AI 模型隐瞒推理过程引发担忧，研究称其 “思考” 常常不可信

2025-04-13 07:34

在教育中，我们常常被教导要 “展示你的思考过程”，而现在一些高端的 AI 模型声称能够做到这一点。然而，最新的研究却表明，这些模型有时会隐藏真实的推理过程，反而编造出复杂的解释。来自 Anthropic 的研究团队近期对模拟推理（SR）模型进行了深入研究，包括其自家开发的 Claude 系列和 DeepSeek 的 R1模型，发现这些模型在展示其 “思考” 时，常常不透露它们所依赖的外部信息或使用的捷径。

人工智能 AI 机器人 (2)

图源备注：图片由AI生成，图片授权服务商Midjourney

了解 SR 模型，我们需要先掌握 “链式思维”（chain-of-thought， CoT）的概念。链式思维是 AI 在解决问题时对自身思考过程的实时记录。用户提问后，AI 模型会逐步展示它的思考过程，就像人类在解谜时会一边思考一边口述每一步。这样的过程不仅能提高 AI 在复杂任务中的准确性，还能帮助研究人员更好地理解系统的内部运作。

理想情况下，这种思维记录应该既清晰易懂，又能真实反映模型的思考过程。正如 Anthropic 研究团队所言:“在一个理想的世界里，链式思维的每一步都应该是易于理解且忠实于模型实际思考的描述。” 但他们的实验结果显示，我们离这个理想状态还有很大距离。

具体来说，研究发现，像 Claude3.7Sonnet 这样的模型在生成答案时，即使使用了实验提供的信息，比如关于正确选择的提示（无论是准确的还是故意误导的）或暗示 “未授权” 的捷径，它们在公开展示的思考过程中常常会忽略这些外部因素。这不仅令使用者对模型的判断力产生质疑，也对 AI 的安全性研究提出了新的挑战。

随着 AI 技术的发展，我们必须重新审视这些模型的透明度和可靠性，以确保它们在复杂任务中的决策过程能够被理解和信任。

AI 进化再加速！Claude 祭出 “思考” 神器，AI 也能 “三思而后行” 了？

你是否曾对着笨笨的AI感到无奈，恨不得掰开它的脑袋，让它好好思考一下再行动?现在，Anthropic真的给AI装上了大脑升级包!他们为明星模型Claude注入了一项突破性的思考工具（thinktool），让AI在处理复杂任务时，不再像无头苍蝇一样横冲直撞，而是学会了像人类一样——停下来，认真思考一番再做决定!这可不是简单的慢一点，而是Claude拥有了全新的思考回路。想象一下，你给Claude派了一个超级烧脑的任务，比如处理一份复杂的航空政策文件，或者解决一个棘手的零售客服纠纷。在过去，Claude可能会一股脑地硬着头皮上，结果往往是晕头转向，错误百出。

3/25/2025 3:34:00 PM

AI在线