OpenAI o1
DeepSeek-R1 模型发布,性能对标 OpenAI o1 正式版
幻方量化旗下 AI 公司深度求索(DeepSeek)今日正式发布 DeepSeek-R1 模型,并同步开源模型权重。据官方介绍,DeepSeek-R1 在后训练阶段大规模使用了强化学习技术,在仅有极少标注数据的情况下,极大提升了模型推理能力。在数学、代码、自然语言推理等任务上,性能比肩 OpenAI o1 正式版。
OpenAI o1 推理模型 API 上线,仅面向特定开发者开放
“OpenAI 12 天”活动进入第 9 天,OpenAI 今日宣布,其“推理”人工智能模型 o1 正式通过 API 向部分开发者开放,并同步更新了包括 GPT-4o、实时 API 以及微调 API 等多项开发者工具。
OpenAI o1强推理能提升安全性?长对话诱导干翻o1
AIxiv专栏是AI在线发布学术、技术内容的栏目。 过去数年,AI在线AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。 如果您有优秀的工作想要分享,欢迎投稿或者联系报道。
280页PDF,全方位评估OpenAI o1,Leetcode刷题准确率竟这么高
OpenAI 的 o1-preview 模型已经发布两周了,网上也有了很多零星的测评。不过,大部分测评都侧重于某一个方面,对于 o1-preview 的系统评估目前还比较匮乏。在一篇长达 280 页的论文中,来自加拿大阿尔伯塔大学等机构的研究者报告了他们对 o1-preview 的系统评估结果,非常具有参考价值。论文标题:Evaluation of OpenAI o1: Opportunities and Challenges of AGI论文链接:,这项综合研究评估了 o1-preview 在各种复杂推理任务中的
OpenAI o1式思维链,开源模型也可以有,成功案例来了
北京时间 9 月 13 日午夜,OpenAI 发布了推理性能强大的 ο1 系列模型。之后,各路研究者一直在尝试挖掘 ο1 卓越性能背后的技术并尝试复现它。当然,OpenAI 也想了一些方法来抑制窥探,比如有多名用户声称曾试图诱导 ο1 模型公布其思维过程,然后收到了 OpenAI 的封号威胁。尽管如此,不过三四天时间,就已经有研究者宣称已经成功复现/开发出了与 ο1 性能差不多的推理技术,并且还不止一个!Llamaberry:教会 AI 像聪明人一样思考Llamaberry 的提出者是 Martin Bowling
- 1