扒一扒o3-mini背后团队:3位华人核心成员,北大清华南开校友在列

比o1 mini性能更强,价格更低,性价比新王o3-mini再次引爆AI圈热议。 在官方截图中,中等o3-mini的性能和o1 mini差不多,价格却只有后者的一半,整体延迟也和GPT-4o相当。 最主要的,这表明了OpenAI可以在降低成本的同时提高性能。

比o1 mini性能更强,价格更低,性价比新王o3-mini再次引爆AI圈热议。

在官方截图中,中等o3-mini的性能和o1 mini差不多,价格却只有后者的一半,整体延迟也和GPT-4o相当。

图片

最主要的,这表明了OpenAI可以在降低成本的同时提高性能。

图片

与此同时,o3-mini背后团队也曝光了,其中华人更是占据了绝对焦点。

图片

而且我们还发现了一件有意思的事:

包括o3-mini在内,有3位华人(任鸿宇、赵盛佳、Kevin Lu)几乎结成了固定搭子,还一起负责过之前的GPT-4o mini/o1 mini

图片

华人成o3-mini团队支柱

这第1位,就是曾在OpenAI最后一天直播中现身的北大校友任泓宇,当时由他来展示o3-mini的编程能力。

任泓宇去年刚加入OpenAI担任研究科学家,主要负责语言模型训练,是GPT-4o的核心开发者、GPT-Next项目组成员。

他博士毕业于斯坦福大学。加入OpenAI之前,在Apple、Google、NVIDIA和Microsoft均有大量研究实习经历。

图片

然后是赵盛佳(Shengjia Zhao),OpenAI研究科学家,方向为ChatGPT的训练和对齐。

他于2022年加入OpenAI,博士毕业于斯坦福大学计算机科学系,本科毕业于清华大学

图片

第3位是Kevin Lu,大概今年7月加入OpenAI。

他2021年毕业于加州大学伯克利分校,就读期间受伯克利人工智能研究所(BAIR)联合主任Pieter Abbeel和谷歌DeepMind研究科学家Igor Mordatch指导,方向为强化学习和序列建模。

图片

除了上面这几位mini搭子,经任泓宇透露,o3-mini还有下面这几位成员:

图片

Max Schwarzer,去年11月加入OpenAI,主要负责提高ML系统的能力。

加入OpenAI之前,曾在谷歌Brain和DeepMind实习,还在Mila人工智能研究所(由深度学习图灵奖得主Yoshua Bengio领导)研究强化学习和自监督学习。

图片

Eric Anthony Mitchell,在OpenAI主要负责o系列模型研究。

本科毕业于普林斯顿大学,博士毕业于斯坦福大学计算机科学系(方向为语言模型)。

他在DeepMind有过一段4个月的暑期实习,更早前是三星AI中心(Base纽约)的一名研究工程师。

图片

Brian (Qiang) Zhang,南开校友,今年3月加入OpenAI负责模型API研究。

他硕士毕业于加州大学洛杉矶分校。加入OpenAI之前,在支付公司Stripe(目前是Chatgpt支付服务商)工作了近7年。

图片

Ted Sanders,拥有OpenAI 3年工龄的老员工,主要负责GPT后训练。

博士毕业于斯坦福大学。加入OpenAI之前,在Netflix研究推荐算法,更早之前在两家咨询公司供职。

图片

性价比新王o3-mini

在OpenAI下一代模型o3系列发布后,CEO奥特曼曾表示:

在许多编码任务中,o3-mini将比o1大幅降低成本。

图片

官方介绍中,o3-mini支持低中高三种思考程度设置。

在代码能力中,低设置下o3-mini和o1-mini差不多,中高设置已经超过了o1正式版。

图片

目前o3-mini仅提供有限测试申请,预计明年1月底左右推出,完整o3还要更久。

不过如果等不及了,也可以自己去加速加速进程(doge)。

这不,o3-mini团队成员赵盛佳就放出了一则招聘消息,邀请共商预训练前沿模型/成本与性能兼具模型的大计。

图片

相关资讯

百分点认知智能实验室:基于不完全标注样本集的信息抽取实践

编者按信息抽取是从文本数据中抽取特定信息的一种技术,命名实体识别(Named Entity Recognition, NER)是信息抽取的基础任务之一,其目标是抽取文本中具有基本语义的实体单元,在知识图谱构建、信息抽取、信息检索、机器翻译、智能问答等系统中都有广泛应用。基于监督学习的NER系统通常需要大规模的细粒度、高精度标注数据集,一旦数据标注质量下降,模型的表现也会急剧下降。利用不完全标注的数据进行NER系统的建立,越来越受到专家学者们的关注。第九届国际自然语言处理与中文计算会议(NLPCC 2020)针对此业

关键点检测项目代码开源了!

作者:闫永强,算法工程师,Datawhale成员 本文通过自建手势数据集,利用YOLOv5s检测,然后通过开源数据集训练squeezenet进行手部关键点预测,最后通过指间的夹角算法来判断具体的手势,并显示出来。文章第四部分为用C 实现整体的ncnn推理(代码较长,可先马后看)一、YOLOV5训练手部检测训练及部署思路类似表情识别,需要将handpose数据集标签改成一类,只检测手部,简化流程,更易上手。此部分数据集来源格物钛  ,具体的效果如图:本教程所用训练环境:系统环境:Ubuntu16.04cuda版本:

5 个章节、25 条规范,全方位 Get 数据集选择与创建的「百科全书」

内容一览:如果你正在学习如何创建或选择一个合适的数据集,那么这篇文章会给你一些实用的建议,帮助你在选择和创建数据集时做出明智的决策。 关键词:机器学习 数据集