​研究显示 60% 以上 AI 聊天机器人回答错误,新闻可信度遭受挑战

根据哥伦比亚新闻评论的数字新闻中心最新研究流行的 AI 搜索工具在回答问题时超过60% 的概率提供了不正确或误导性的信息。 这一结果令人担忧,因为这些工具不仅削弱了公众对新闻报道的信任,也使出版商面临流量和收入的双重损失。 图源备注:图片由AI生成,图片授权服务商Midjourney研究人员测试了包括 ChatGPT、Perplexity、Gemini 和 Grok 在内的八款生成式 AI 聊天机器人,要求它们识别来自200篇最新新闻文章的摘录。

根据哥伦比亚新闻评论的数字新闻中心最新研究流行的 AI 搜索工具在回答问题时超过60% 的概率提供了不正确或误导性的信息。这一结果令人担忧,因为这些工具不仅削弱了公众对新闻报道的信任,也使出版商面临流量和收入的双重损失。

机器人 AI写作 AI教育

图源备注:图片由AI生成,图片授权服务商Midjourney

研究人员测试了包括 ChatGPT、Perplexity、Gemini 和 Grok 在内的八款生成式 AI 聊天机器人,要求它们识别来自200篇最新新闻文章的摘录。结果显示,超过60% 的回答都是错误的,这些聊天机器人经常捏造标题、不引用文章或引用未经授权的内容。即使它们能正确指出发布者,链接也常常指向失效的 URL、转载版本或与内容无关的页面。

令人失望的是,这些聊天机器人很少表达不确定性,反而以不当的自信提供错误的答案。例如,ChatGPT 在200个查询中提供了134条错误信息,但仅在15次中表示过怀疑。即便是付费版的 Perplexity Pro 和 Grok3,其表现也不尽如人意,错误答案的数量更高,尽管它们的价格分别为每月20美元和40美元。

在内容引用方面,多个聊天机器人未能遵循出版商的限制尝试,五款聊天机器人甚至忽视了机器人排除协议这一被广泛接受的标准。Perplexity 就曾在出版商限制其爬虫的情况下,正确引用国家地理的文章。与此同时,ChatGPT 通过未授权的 Yahoo 新闻重新引用了收费墙内容的 USA Today 文章。

此外,很多聊天机器人将用户引导至 AOL 或 Yahoo 等平台的转载文章,而非原始来源,甚至在已经与 AI 公司达成授权协议的情况下。例如,Perplexity Pro 引用了德克萨斯论坛的转载版本,却未能给出应有的署名。而 Grok3和 Gemini 则常常发明 URL,Grok3的200个回答中有154个链接至错误页面。

这一研究突显了新闻机构面临的日益严重危机。越来越多的美国人将 AI 工具作为信息来源,但与 Google 不同,聊天机器人不会将流量引向网站,反而会在没有链接回去的情况下总结内容,从而使出版商失去广告收入。新闻媒体联盟的丹妮尔・科菲警告称,如果没有对爬虫的控制,出版商将无法有效 “变现有价值的内容,或支付记者的薪水”。

研究小组在联系 OpenAI 和微软后,他们虽然对自己的做法进行了辩护,但并未回应具体的研究发现。OpenAI 表示,它 “尊重出版商的偏好”,并帮助用户 “发现优质内容”,而微软则声称其遵循 “robots.txt” 协议。研究人员强调,错误的引用做法是系统性的问题,而非个别工具的现象。他们呼吁 AI 公司改善透明度、准确性以及对出版商权益的尊重。

划重点:

📊 研究发现,AI 聊天机器人的回答错误率超过60%,严重影响了新闻的可信度。  

📰 多款聊天机器人无视出版商的限制,引用了未授权内容和错误链接。  

💰 新闻机构面临流量和收入双重危机,AI 工具逐渐取代传统搜索引擎。

相关资讯

​亚马逊 CEO:AI 成本因 DeepSeek 技术大幅降低

近日,亚马逊首席执行官安迪・贾西在与分析师的电话会议中谈到了人工智能(AI)技术的发展及其成本问题。 他表示,随着新技术的不断涌现,特别是 DeepSeek 等模型的推出,人工智能推理的成本将会显著下降。 这一变化将使得更多企业能够轻松将 AI 应用于其业务中,尤其是在推理和生成式 AI 的领域。

​2025 年十大 AI 技能,可以让你薪资增长高达 47%

随着人工智能(AI)技术的迅速发展,学习 AI 相关技能正成为求职者和在职人员的热门选择。 根据 Coursera 最新发布的《2025年职业技能报告》,过去一年中,AI 课程的需求增长惊人,年均增长率达866%。 分析显示,企业员工、学生和求职者的报名人数分别增加了1100%、500% 和1600%。

AI在这方面存在致命缺陷!专家:AI不应用于重要应用

在当前的技术环境下,人工智能(AI)引发了广泛的讨论。 德蒙特福特大学的网络安全教授 Eerke Boiten 对此表示,现有的 AI 系统在管理和可靠性方面存在根本性缺陷,因此不应被用于重要应用。 Boiten 教授指出,当前的 AI 系统大多依赖于大型神经网络,尤其是生成式 AI 和大型语言模型(如 ChatGPT)。