AI幻觉

三大模型巨头比拼思考“幻觉”：DeepSeek 不敌 ChatGPT，Gemini 用词最少

三大模型巨头比拼思考“幻觉”：DeepSeek 不敌 ChatGPT，Gemini 用词最少

近日，智利大学 CIAE 教育研究所的研究员 Roberto Araya 进行了 4 组对照实验：提供相同的提示词，让 Gemini 2.0 Flash、ChatGPT o3-mini、DeepSeek R1 进行推理分析，研究三个模型在应对幻觉问题上的性能对比。其研究发现：ChatGPT 03-mini 在应对大模型幻觉问题上占有绝对优势，能够灵活切换不同的策略进行思考推理。相比之下，DeepSeek R1 和 Gemini 2.0 Flash 虽然能够尝试使用策略，但表现了出对这些策略的抗拒，且推理过程存在错误或混乱。

西湖大学研发 AI 文本检测模型，助力辨别人工智能创作

西湖大学研发 AI 文本检测模型，助力辨别人工智能创作

近日，西湖大学的研究团队成功研发出一种能够检测人工智能生成文本的新模型。该团队的负责人张岳教授在接受采访时表示，这一模型采用无监督算法，可以有效判断一篇文章是否由 AI 创作，尤其在人工智能迅速发展的当下显得尤为重要。张岳教授提到，随着科技的不断进步，AI 在创作领域的应用日益普及。

如何应对 AI“一本正经的胡说八道”？研究人员希望它会承认“我不知道”

如何应对 AI“一本正经的胡说八道”？研究人员希望它会承认“我不知道”

当前 AI 的训练数据几乎不包含“我不知道”这样的表述，因此它们天生不会谦逊。Cohen 和 Dobler 通过调整 AI 训练过程，使其在可能出错时，至少一部分情况下会选择回答“我不知道”，从而提高整体准确性。

1

资讯热榜

ChatGPT“生成吉卜力风格 AI 图”海外潮流引发版权争议，CEO Sam Altman 回应将施以限制 DeepSeek-R1之后推理模型发展如何？Raschka长文梳理后R1时代14篇重要论文内存革命！LangGraph 0.3.19如何实现Python内存使用效率的飞跃？宫崎骏“怒了”?ChatGPT吉卜力风潮惹版权争议，OpenAI或面临法律挑战! 国内首款中医 AI 大模型 “广医・岐智” 发布告别AI“一本正经”!Midjourney联手NYU解锁创意文本新维度，多样性飙升23%! OpenAI 审查策略大转向!ChatGPT 新图像生成器爆红，争议内容限制放宽引关注 DeepSeek 月访问量超越 ChatGPT，成为 AI 工具新星

标签云