OpenAI 借 Reddit 论坛测试 AI 说服能力，太强可能会带来危险

2025-02-03 09:01

OpenAI 在其最新发布的“推理”模型 o3-mini 的系统文档中透露，该公司利用 Reddit 的子论坛 r / ChangeMyView 来测试其 AI 模型的说服能力。r / ChangeMyView 是一个拥有数百万用户的 Reddit 论坛，用户在此发布观点并希望通过讨论了解他人的不同看法。其他用户则会以具有说服力的论点回应，试图改变原帖作者的观点。

OpenAI 在其最新发布的“推理”模型 o3-mini 的系统文档中透露，该公司利用 Reddit 的子论坛 r / ChangeMyView 来测试其 AI 模型的说服能力。r / ChangeMyView 是一个拥有数百万用户的 Reddit 论坛，用户在此发布观点并希望通过讨论了解他人的不同看法。其他用户则会以具有说服力的论点回应，试图改变原帖作者的观点。

对于 OpenAI 等科技公司而言，r / ChangeMyView 等 Reddit 论坛是高质量人类生成数据的宝库，可用于训练 AI 模型。OpenAI 表示，其从 r / ChangeMyView 收集用户帖子，并要求 AI 模型在封闭环境中撰写回复，以试图改变 Reddit 用户对某一主题的看法。随后，OpenAI 将这些回复展示给测试者进行评估，并将 AI 模型的回复与人类回复进行比较，以衡量其说服力。

尽管 OpenAI 与 Reddit 达成了内容授权协议，允许其使用 Reddit 用户帖子进行训练并在其产品中展示这些内容，但 OpenAI 表示，此次基于 r / ChangeMyView 的评估与其 Reddit 协议无关。目前尚不清楚 OpenAI 如何获取该子论坛的数据，且该公司表示暂无计划向公众发布这一评估结果。

值得注意的是，Reddit 近年来与多家 AI 公司达成了授权协议，但也曾公开批评部分 AI 公司未经许可抓取其网站内容。Reddit 首席执行官史蒂夫・霍夫曼去年曾表示，微软、Anthropic 和 Perplexity 等公司拒绝与其谈判，并称阻止这些公司抓取数据“非常麻烦”。此外，OpenAI 也因涉嫌未经授权抓取《纽约时报》等网站内容以训练 ChatGPT 及其底层 AI 模型而面临多起诉讼。

AI在线注意到，在 r / ChangeMyView 基准测试中，o3-mini 的表现并未显著优于或劣于 o1 或 GPT-4o。然而，OpenAI 的最新 AI 模型在说服力方面似乎超过了 r / ChangeMyView 子论坛中的大多数用户。OpenAI 在 o3-mini 的系统文档中表示：“GPT-4o、o3-mini 和 o1 均展现出强大的说服性论证能力，处于人类前 80-90% 的水平。目前，我们尚未发现模型表现远超人类或具备明显的超人类能力。”

OpenAI 的目标并非开发具有超强说服力的 AI 模型，而是确保 AI 模型不会变得过于具有说服力。随着推理模型在说服和欺骗方面表现越来越出色，OpenAI 已开发出新的评估方法和保障措施来应对这一问题。OpenAI 担心，如果 AI 模型过于擅长说服人类用户，可能会带来危险。理论上，这可能导致高级 AI 按照自己的目标或者其控制者的目标行动，而不一定符合人类的整体利益。

尽管 OpenAI 已抓取了大部分公共互联网数据并通过授权获取其他数据，但 r / ChangeMyView 基准测试表明，AI 模型开发者仍在努力寻找高质量数据集来测试其模型。然而，获取这些数据并非易事。

OpenAI o3 模型运行成本估算大幅上调：单次任务从 3000 美元涨至 3 万美元

Arc Prize Foundation 大幅上调 OpenAI o3 模型运行成本估算，从 3000 美元涨至 3 万美元。高昂成本凸显 AI 模型特定任务的高成本难题，控制成本成行业挑战。##AI模型成本##

4/3/2025 7:59:45 AM

远洋

o1 研发团队完整采访：Ilya早期曾参与，灵感源于AlphaGo

自从 OpenAI 的 o1 问世以来，它强大的推理能力就承包了 AI 圈近期的热搜。不需要专门训练，它就能直接拿下数学奥赛金牌，甚至可以在博士级别的科学问答环节上超越人类专家。展示 o1 实力的 demo，我们看了不少，评估 o1 表现的评测，全网比比皆是，关于 o1 技术路线的讨论也如火如荼，引发了广泛的关注和深入的思考。不过 o1 背后的故事，还鲜为人知，那些在幕后默默付出的团队成员们，他们的故事同样值得被讲述和铭记。刚刚，OpenAI 发布了 o1 研发团队的完整访谈，为我们揭秘了 o1 的「成长历程」。o

9/22/2024 1:27:00 PM

机器之心

LeCun批评o1根本不像研究，Noam Brown回怼：已发表的研究都是废话

图灵奖三巨头之一 Yann LeCun 又和别人吵起来了，这次是 Noam Brown。Noam Brown 为 OpenAI o1 模型的核心贡献者之一，此前他是 Meta FAIR 的一员，主导了曾火遍一时的 CICERO 项目，在 2023 年 6 月加入 OpenAI 。这次吵架的内容就是围绕 o1 展开的。众所周知，从 AI 步入新的阶段以来，OpenAI 一直选择了闭源，o1 的发布也不例外。这也引来了广大网友的吐槽，干脆叫 CloseAI 算了，反观 Meta，在开源领域就做的很好，o1 的发布，更

9/30/2024 2:12:00 PM

机器之心

资讯热榜

上海AI实验室开源InternVL3系列多模态大型语言模型 Haisnap横空出世，小白用户也能轻松打造AI应用「交交」媲美GPT-4o！上海交大推出口语对话情感大模型，首个纯学术界自研！ OpenAI开源超Agent:Codex CLI,五小时内破 5000 颗星本地部署DeepSeek+DiFy平台构建智能体应用 ChatGPT重磅更新：新增图像库功能，可查看自己用GPT生成的所有图片 kimi开源视觉语言模型 Kimi-VL 与 Kimi-VL-Thinking，多项基准超越 GPT-4o OpenAI 发布“智能体构建实战指南”实用性文档（附文档资源）

标签云

人工智能 OpenAI AIGC AI ChatGPT DeepSeek AI绘画数据机器人谷歌模型大模型 Midjourney 智能用户学习开源 GPT 微软 Meta AI创作图像技术论文 Stable Diffusion 马斯克 Gemini 算法蛋白质生成式芯片代码英伟达腾讯神经网络计算研究 Sora AI for Science 3D Anthropic AI设计机器学习 GPU 开发者场景华为预测伟达 Transformer 百度人形机器人苹果深度学习 AI视频模态字节跳动 xAI 驾驶文本搜索大语言模型 Claude Copilot 具身智能神器推荐 LLaMA 算力安全应用视频生成科技视觉亚马逊干货合集 2024 AGI 特斯拉大型语言模型训练

顶部

OpenAI 借 Reddit 论坛测试 AI 说服能力，太强可能会带来危险

相关资讯

OpenAI o3 模型运行成本估算大幅上调：单次任务从 3000 美元涨至 3 万美元

o1 研发团队完整采访：Ilya早期曾参与，灵感源于AlphaGo

LeCun批评o1根本不像研究，Noam Brown回怼：已发表的研究都是废话