研讨发现，OpenAI 的 GPT-4o 公德推理能力胜过人类大师

近期的一项研讨表明，OpenAI 最新的聊天机器人 GPT-4o 能够供应公德方面的解说和提议，且质量优于“公认的”公德大师所供应的提议。据 The Decoder 当地时间周六报道，美国北卡罗莱纳大学教堂山分校和艾伦 AI 研讨所的研讨人员从事了两项研讨，将 GPT 模型与人类的公德推理能力从事比拟，以探讨大言语模型是否可被视为“公德大师”。IT之家汇总研讨内容如下：研讨一501 名美国成年人对比了 GPT-3.5-turbo 模型和其他人类参与者的公德解说。结果表明，人们觉得 GPT 的解说比人类参与者的解说更

近期的一项研讨表明，OpenAI 最新的聊天机器人 GPT-4o 能够供应公德方面的解说和提议，且质量优于“公认的”公德大师所供应的提议。

据 The Decoder 当地时间周六报道，美国北卡罗莱纳大学教堂山分校和艾伦 AI 研讨所的研讨人员从事了两项研讨，将 GPT 模型与人类的公德推理能力从事比拟，以探讨大言语模型是否可被视为“公德大师”。

IT之家汇总研讨内容如下：

研讨一

501 名美国成年人对比了 GPT-3.5-turbo 模型和其他人类参与者的公德解说。结果表明，人们觉得 GPT 的解说比人类参与者的解说更符合公德、更值得相信、更周密。

评价者也觉得人工智能的评价比其他人更可靠。虽然悬殊很小，但关键发现是 AI 可以匹配甚至超越人类水平的公德推理。

研讨发现，OpenAI 的 GPT-4o 公德推理能力胜过人类大师

研讨二

将 OpenAI 最新的 GPT-4o 模型生成的提议与《纽约时报》“伦理学家”专栏中著名伦理学家 Kwame Anthony Appiah 的提议从事了比拟。900 名参与者对 50 个“伦理困境”的提议质量从事了评分。

结果表明，GPT-4o 在“几乎每个方面”都胜过人类大师。人们觉得 AI 生成的提议在公德上更正确、更值得相信、更周密、更准确。只有在感知细微差别方面，人工智能和人类大师之间没有显著悬殊。

研讨发现，OpenAI 的 GPT-4o 公德推理能力胜过人类大师

研讨人员觉得，这些结果表明 AI 可以通过“比拟公德图灵测试”（cMTT）。而文本分析显示，GPT-4o 在供应提议时使用的公德和积极言语比人类大师更多。这可以部分解说为什么 AI 的提议评分更高 —— 但不是唯一因素。

需要注意的是，这项研讨仅仅针对美国参与者从事，后续仍需进一步研讨人们如何看待 AI 生成的公德推理的文化悬殊。

论文地址：https://osf.io/preprints/psyarxiv/w7236

{{userData.name}}已认证

研讨发现，OpenAI 的 GPT-4o 公德推理能力胜过人类大师

研讨一

研讨二

谈天机器人胡说八道？牛津钻研职员操纵语义熵来识破 AI“幻觉”

英伟达将在中东五国数据中心布署 AI 技能，首次在当地大规模推出产品

细节表现超Sora，网友：真正的国产之光！MiniMax视频模型再上新

关于LLM-as-a-judge范式，终于有综述讲明白了

快手预告“可灵 AI”导演共创计划作品 12 月 6 日上线：联合李少红、贾樟柯、叶锦添、薛晓路等

李飞飞「世界实验室」重磅推出 AI“造物主”：一张图片生成 3D 世界“任意门”

ChatGPT遇到这些人名开始自闭，OpenAI回应了

平安人寿ChatBI：大模型智能化报表的深度实践

字节跳动豆包 AI 文生图“喜提新技能”：App 可生成带有指定文字的图片

李飞飞空间智能首秀：AI靠单图生成3D世界，可探索，遵循基本物理几何规则