马斯克:现实世界中用于训练 AI 模型的数据已经所剩无几

在周三晚间与Stagwell董事会主席马克·佩恩的直播对话中,马斯克表示:“我们现在基本上已经消耗掉了所有人类知识的积累……用于人工智能训练的数据。这个现象基本上是去年发生的。”
感谢据 TechCrunch 报道,马斯克与其他人工智能专家一致认为,现实世界中用于训练 AI 模型的数据几乎已经耗尽。

马斯克:现实世界中用于训练 AI 模型的数据已经所剩无几

在周三晚间与 Stagwell 董事会主席马克・佩恩的直播对话中,马斯克表示:“我们现在基本上已经消耗掉了所有人类知识的积累…… 用于人工智能训练的数据。这个现象基本上是去年发生的。”

马斯克此番言论与前 OpenAI 首席科学家伊利亚・苏茨克弗(Ilya Sutskever)在去年 12 月的 NeurIPS 会议上的观点相似。苏茨克弗曾指出,AI 行业已经达到了所谓的“数据峰值”,并预测未来缺乏足够的训练数据,将迫使 AI 模型的开发方式发生改变。

马斯克认为,合成数据(AI在线注:即人工智能模型自我生成的数据)是未来的解决方案。“补充现实世界数据的唯一途径是通过合成数据,也就是让 AI 自己生成训练数据。AI 会进行自我评估,并通过这一自我学习的过程不断优化自己。”

目前,许多科技公司,包括微软、Meta、OpenAI 和 Anthropic 等,已经开始使用合成数据来训练他们的主力 AI 模型。据 Gartner 估计,到 2024 年,用于人工智能和数据分析项目的 60% 数据将是通过合成方式生成的

使用合成数据的一个显著优势是降低成本。人工智能初创公司 Writer 表示,其 Palmyra X 004 模型几乎完全依赖合成数据进行开发,开发成本仅为 70 万美元,而一个规模相似的 OpenAI 模型的开发成本大约为 460 万美元

然而,合成数据也存在一定的风险。研究表明,合成数据可能会导致模型性能下降,输出结果不仅缺乏创新性,而且可能变得更加偏颇,最终严重影响其功能性。因为模型是通过自己生成合成数据进行训练的,如果这些数据本身带有偏见或局限性,那么最终模型的输出也会受到这些因素的影响。

相关资讯

马斯克:到 2029 年,人工智能可能会比所有人类都更聪明

感谢人工智能 (AI) 超越人类智能的可能性几十年来一直备受科技专家、科学家和未来学家们的热烈讨论和争辩。然而,自生成式人工智能聊天机器人 ChatGPT 发布以来,关于人工智能将取代人类的争论愈演愈烈。生成式人工智能的出现使得谷歌、 Meta、亚马逊甚至微软等科技巨头纷纷加入战局,竞相研发自己的语言模型。鉴于人工智能领域的飞速发展,特斯拉 CEO 埃隆・马斯克 (Elon Musk) 认为人工智能超越人类智能的时刻即将到来。他甚至大胆预测,到 2029 年底,人工智能将超越整个人类种族的智力水平。马斯克的言论源于

马斯克称人工智能毁灭人类的可能性为 20%,但仍值得冒险

埃隆・马斯克 (Elon Musk) 在早些时候举办的 Abundance 峰会 “人工智能辩论” 研讨会上表示,即使人工智能技术有 1/5 的可能性会对人类构成威胁,但其利大于弊,我们仍然值得冒险进行研发。马斯克重新评估了之前他对人工智能的风险评估,他在研讨会上表示:“我认为人工智能有可能终结人类文明。我可能同意 Geoffrey Hinton 的观点,这个概率大约是 10% 到 20% 左右。”但他补充说:“我认为积极的可能性场景要大于消极的可能性场景。”马斯克并没有提到他是如何计算该风险的。IT之家注意到,去

马斯克预测 AI 在两年内能超越最聪明的人类

感谢特斯拉 CEO 埃隆・马斯克(Elon Musk)周一预测,AI 在明年或 2026 年就能超越最聪明的人类。马斯克当地时间周一在社交媒体平台 X(以前称为推特)语音空间上接受了挪威主权财富基金首席执行官 Nicolai Tangen 的采访。当被问及 AGI(通用人工智能)的发展时间表时,马斯克表示,如果你将 AGI 定义为比最聪明的人更聪明,我想可能是明年,或者两年内。AGI 为 Artificial General Intelligence 的首字母缩写,意为人工通用智能。通用人工智能是一个人工智能理论研