OpenAI 再成“榜一大哥”：o1-preview AI 模型更轻松驾驭数学、编程等任务

应用
9月20日
编辑

故渊

科技媒体 The Decoder 昨日（9 月 19 日）发布博文，报道称在聊天机器人竞技场（Chatbot Arena）上，OpenAI 的新人工智能模型 o1-preview 和 o1-mini 问鼎榜首。聊天机器人竞技场简介聊天机器人竞技场是一个比较人工智能模型的平台，它利用 6000 多个社区评分对新的 OpenAI 系统进行了评估。结果结果显示，o1-preview 和 o1-mini 尤其在数学任务、复杂提示和编程方面表现出色。Lmsys 提供的数学模型优势图表清楚地显示，o1-preview 和 o1

科技媒体 The Decoder 昨日（9 月 19 日）发布博文，报道称在聊天机器人竞技场（Chatbot Arena）上，OpenAI 的新人工智能模型 o1-preview 和 o1-mini 问鼎榜首。

聊天机器人竞技场简介

聊天机器人竞技场是一个比较人工智能模型的平台，它利用 6000 多个社区评分对新的 OpenAI 系统进行了评估。

结果

结果显示，o1-preview 和 o1-mini 尤其在数学任务、复杂提示和编程方面表现出色。

OpenAI 再成“榜一大哥”：o1-preview AI 模型更轻松驾驭数学、编程等任务

Lmsys 提供的数学模型优势图表清楚地显示，o1-preview 和 o1-mini 的得分超过 1360 分，远高于其他模型的表现。AI在线附上相关截图如下：

OpenAI 再成“榜一大哥”：o1-preview AI 模型更轻松驾驭数学、编程等任务

OpenAI 再成“榜一大哥”：o1-preview AI 模型更轻松驾驭数学、编程等任务

OpenAI 再成“榜一大哥”：o1-preview AI 模型更轻松驾驭数学、编程等任务

O1 的目标是为人工智能推理设定一个通用新标准，即在回答前“思考”” 更长时间。

然而，O1 模型并非在所有方面都优于 GPT-4o。许多任务并不需要复杂的逻辑推理，有时 GPT-4o 的反应更快。

注意事项

o1-preview 和 o1-mini 的票数远低于 GPT-4o 或 Anthropic’s Claude 3.5 等成熟模型，每个模型都只有不到 3000 条评论，这样小的样本量可能无法准确代表实际结果，限制结果的意义。

给TA打赏

共{{data.count}}人

人已打赏

GPT Mini o1 preview 模型

Runway Gen-3的视频转绘功能太牛了！大片制作0门槛！

2024-9-20 7:27:24

华为云AI原生基础设施CloudMatrix亮相全联接大会

2024-9-20 12:13:00

0 条回复 A文章作者 M管理员

更换删除

暂无讨论，说说你的看法吧

TOP1

AI 助力脑瘤手术：10 秒内精准识别残留肿瘤
21小时前
TOP2

钉钉AI重磅更新：深入业务场景，上线工单等场景AI助理
11月13日
TOP3

腾讯：大模型 App 元宝不会嵌入商业搜索结果，目前专注于尽可能增加对用户的吸引力
11月13日
AI 开始“卷”智能体：OpenAI 被曝明年将推 Operator，可控制电脑、独立执行任务
11月14日
Red Hat 收购 Neural Magic 并开源其技术：优化通用设备 AI 性能，可媲美专用芯片
11月14日
AI面临的五个蛋白质设计问题，Nature找了一群专家来讨论
11月13日
谷歌扩大 AI 洪水预警系统覆盖范围，惠及全球 7 亿人
11月13日
OpenAI 联合创始人回来了，还是总裁，将更专注重大技术挑战
11月13日

❯

个人中心

今日签到

搜索

幸运之星正在降临...

点击领取今天的签到奖励！

恭喜！您今天获得了{{mission.data.mission.credit}}积分

今日签到

连续签到

{{item.credit}}

连续{{item.count}}天

查看所有

我的优惠劵

_￥_优惠劵

使用时效：无法使用

使用时效：
之前

使用时效：永久有效

优惠劵ID：
×

限制以下商品使用：限制以下商品分类使用：不限制使用：

[{{ct.name}}]

所有商品和商品类型均可使用

没有优惠劵可用!

购物车

×

删除

购物车空空如也!

清空购物车前往结算

您有新的私信

没有新私信

写新私信查看全部