AI在线 AI在线

合成数据

谷歌研究:合成数据使大模型数学推理能力提升八倍

最近,来自谷歌、卡内基梅隆大学和 MultiOn 的联合研究团队发表了一项关于合成数据在大型模型训练中应用的新研究。 据专注于人工智能发展的研究机构 Epoch AI 报告显示,目前全球约有 300 万亿个公开可用的高质量文本训练标记。 然而,随着类似 ChatGPT 这样的大模型的迅猛发展,对训练数据的需求呈指数级增长,预计到 2026 年之前,这些数据将被耗尽。
4/8/2025 12:40:00 AM
远洋

英伟达重磅出手!收购合成数据初创公司Gretel,加速布局生成式AI

人工智能芯片巨头英伟达(Nvidia)传出重大收购消息,其已收购位于圣地亚哥的初创公司Gretel。 Gretel 专注于开发用于生成合成人工智能训练数据的平台。 据 Wired 报道,此次收购的价格达到了九位数美元,超过了 Gretel 最近一次3.2亿美元的估值,但具体的交易条款尚未公开。
3/20/2025 10:02:00 AM
AI在线

大模型合成数据机理分析,人大刘勇团队:信息增益影响泛化能力

AIxiv专栏是AI在线发布学术、技术内容的栏目。过去数年,AI在线AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。
10/15/2024 3:18:00 PM
机器之心
  • 1