目标超级智能,前DeepMind科学家离职创业,获1.3亿刀融资

又有谷歌大模型核心成员出来创业了。 3 月 8 日,两名前谷歌 DeepMind 研究人员在社交平台 X 上宣布,成立一家名为 Reflection AI 的公司,旨在开发超级智能。 该公司一亮相,就已宣布获得 1.3 亿美元融资,估值更是高达 5.55 亿美元。

又有谷歌大模型核心成员出来创业了。

3 月 8 日,两名前谷歌 DeepMind 研究人员在社交平台 X 上宣布,成立一家名为 Reflection AI 的公司,旨在开发超级智能。

image.png

该公司一亮相,就已宣布获得 1.3 亿美元融资,估值更是高达 5.55 亿美元。

这家公司的两名创始人 Misha Laskin(图右)和 Ioannis Antonoglou(图左)也来头不小。

image.png

担任 CEO 的 Misha 曾帮助开发谷歌 Gemini 大语言模型系列的训练工作流程,而联合创始人 Ioannis 则是谷歌 DeepMind 的创始工程师,也是 AlphaGo 的幕后功臣,还从事了 Gemini 的训练后系统工作。

其团队成员也都是曾在 DeepMind、OpenAI 和其他前沿实验室发挥主导作用的研究人员和工程师,参与打造了过去十年间一些最先进的人工智能系统,比如 AlphaGo 和 Gemini 等。

image.png

可谓是谷歌、OpenAI 重磅 AI 研究的原班人马。

对于他们「开发超级智能」的使命,网友也有不同看法。

有人认为,从 AGI 到 ASI 的转变会很快,一旦实现了真正的通用智能,超越人类水平应该会很容易。

image.png

也有人质疑,他们是在利用 ASI 的噱头来融资。

image.png

打造超级智能

据介绍,Reflection AI 的目标是开发超级智能,他们将其定义为能够执行大多数涉及计算机工作的智能系统。

作为实现这一目标的第一步,该公司正在构建一个自主编程工具。Reflection AI 认为,创建此类工具所需的技术构建模块可以重新用于构建超级智能。

Reflection AI 工作人员在一篇博客中写道,「构建完全自主编码系统所需的突破性技术 —— 如高级推理和迭代自我改进 —— 自然会扩展到更广泛的计算机工作类别。」

该公司将先专注于开发能够自动执行相对狭窄编程任务的 AI agent 。一些 agent 将专注于扫描开发人员代码中的漏洞。其他 agent 将优化应用程序的内存使用并测试其可靠性问题。

Reflection AI 还计划实现一系列相关任务的自动化。据该公司称,其技术可以生成解释特定代码片段工作原理的文档,该软件还将帮助管理客户应用程序运行的基础设施。

据 Reflection AI 网站上的一则招聘启事显示,该公司计划使用大语言模型和强化学习来驱动其软件。过去,开发人员在训练人工智能模型时,使用的数据集中的每个数据点都附带一个解释,而强化学习则无需包含这些解释,这使得创建训练数据集变得更加容易。

该招聘启事还透露,该公司计划为其 AI 系统「探索新型的架构」。这表明该公司可能会超越目前支撑大语言模型的 Transformer 神经网络架构。越来越多的大语言模型正在使用一种名为 Mamba 的竞争架构,它在某些方面更加高效。

此外, Reflection AI 还计划使用多达数万块显卡来训练其模型。该公司还提到将致力于开发「适用于非大语言模型的类似 vLLM 平台」。开发人员使用 vLLM 这一流行的人工智能开源工具来减少语言模型的内存使用。

两位谷歌DeepMind元老

image.png

ReflectionAI 的 CEO Misha Laskin 曾于 2022-2024 年任 Google DeepMind 研究科学家,此前曾在加州大学伯克利分校念博士后,是芝加哥大学理论物理学博士。

Misha Laskin 深度参与了 Gemin 大模型的研发,研究方向为通用智能体,并对大模型中的强化学习有所研究。

image.png

ReflectionAI 联合创始人 Ioannis Antonoglou 此前任 Google DeepMind 资深研究科学家,曾参与过 AlphaGo 和 AlphaZero 项目。

loannis.png

期待他们的首个公开项目。

参考内容:

https://www.sequoiacap.com/founder/ioannis-antonoglou/

https://www.reflection.ai/

https://x.com/MishaLaskin/status/1898048928236421363

https://x.com/kimmonismus/status/1898076692645880242

相关资讯

开源大模型新王 Reflection 70B 超越 GPT-4o:新技术可纠正自己幻觉,数学 99.2 分刷爆测试集

开源大模型王座突然易主,居然来自一家小创业团队,瞬间引爆业界。新模型名为 Reflection 70B,使用一种全新训练技术,让 AI 学会在推理过程中纠正自己的错误和幻觉。比如最近流行的数 r 测试中,一开始它犯了和大多数模型一样的错误,但主动在 反思 标签中纠正了自己。在官方评测中,70B 模型全面超越最强开源 Llama 3.1 405B、GPT-4o、Claude 3 Opus、Gemini 1.5 Pro,特别是数学基准 GSM8K 上直接刷爆,得分 99.2%。这个结果也让 OpenAI 科学家、德扑

Reflection 70B AI 模型“塌房”:第三方基准测试结果不佳,不如 LLaMA-3.1-70B

科技媒体 The Decoder 昨日(9 月 10 日)报道,对比平台 Artificial Analysis 相关数据表明,Reflection 70B AI 模型在基准测试中的表现,实际上不及 Meta 的 LLaMA-3.1-70B。针对 AI 模型基准测试结果不佳,Reflection 公司首席执行官马特・舒默(Matt Shumer)表示,上传模型权重至 Hugging Face 时遇到问题,所使用的权重是多个不同模型的混合体,而他们内部托管的模型则显示出更佳的结果。舒默随后向部分用户提供了独家访问内部

刚刚,开源大模型的新王诞生了:超越GPT-4o,模型还能自动纠错

快速更迭的开源大模型领域,又出现了新王:Reflection 70B。横扫 MMLU、MATH、IFEval、GSM8K,在每项基准测试上都超过了 GPT-4o,还击败了 405B 的 Llama 3.1。这个新模型 Reflection 70B,来自 AI 写作初创公司 HyperWrite。HyperWrite 公司的 CEO Matt Shumer 表示,Reflection-70B 现在是「世界上最顶级的开源 AI 模型」。Reflection 70B 的底层模型建立在 Meta 的 Llama 3.1 7