消息称“AI 教母”李飞飞正建立初创公司,开发可理解 3D 空间关系的 AI 系统

当地时间周六,据路透社援引 6 名知情人士消息,计算机科学家李飞飞正在建立一家初创公司。该公司旨在利用类似人类的视觉处理技术,使 AI 具备高级推理能力,有望成为 AI 技术的一次飞跃。IT之家注:李飞飞被广泛称为“AI 教母”,与通常用来指因 AI 技术突破而在 2018 年获得图灵奖的三位研究人员的“AI 教父”对应。这三名“AI 教父”则是杰弗里・辛顿、杨立昆、约书亚・本西奥。一位消息人士通过李飞飞上个月在温哥华 TED 大会发表的演讲,对这家初创公司进行了详细描述:李飞飞曾表示,最前沿的研究涉及一种算法,这

当地时间周六,据路透社援引 6 名知情人士消息,计算机科学家李飞飞正在建立一家初创公司。该公司旨在利用类似人类的视觉处理技术,使 AI 具备高级推理能力,有望成为 AI 技术的一次飞跃。

IT之家注:李飞飞被广泛称为“AI 教母”,与通常用来指因 AI 技术突破而在 2018 年获得图灵奖的三位研究人员的“AI 教父”对应。这三名“AI 教父”则是杰弗里・辛顿、杨立昆、约书亚・本西奥。

一位消息人士通过李飞飞上个月在温哥华 TED 大会发表的演讲,对这家初创公司进行了详细描述:李飞飞曾表示,最前沿的研究涉及一种算法,这种算法可以合理地推断出图像和文字在三维环境中的样子,并根据这些预测采取行动,使用的概念叫作 “空间智能”。

李飞飞曾展示一张猫伸出爪子把杯子推向桌子边缘的图片。她说,在一瞬间,人脑就能评估 “这个玻璃杯的几何形状、它在三维空间中的位置、它与桌子、猫和其他一切的关系”,然后预测会发生什么,并采取行动加以阻止。目前,她在斯坦福大学的实验室正试图“教计算机如何在三维世界中行动”,例如使用大型语言模型让机械臂执行任务、根据口头指令开门和制作三明治等。

报道称,当前有不少声音认为,在人工智能模型实现人工通用智能(AGI)之前,必须先建立起这种 “推理 ”能力。“推理 ”能力指的是一个阈值,在这个阈值上,系统可以像人类一样或更有能力地完成大多数任务。

相关资讯

北大推出全新机器人多模态大模型!面向通用和机器人场景的高效推理和操作

AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。投稿邮箱:[email protected][email protected]本文由 HMI Lab 完成。HMI Lab依托北京大学视频与视觉技术国家工程研究中心和多媒体信息处理全国重点实验室两大平台,长期从事机器学习、多模态学习和具身智能方向的研究。本工作第一作

商汤发布日日新 5.0 大模型:推理上下文窗口 200K,号称对标 GPT-4 Turbo

感谢4 月 23 日,商汤科技发布了日日新 5.0 大模型。据介绍,该模型采用 MOE 混合专家架构,在知识、数学、推理和代码能力方面大幅提升。该模型基于超过 10TB tokens 训练,具备 200K 推理上下文窗口(IT之家注:相当于 36.5 万个汉字),推理时上下文窗口达到 200K 左右,更号称“全面对标 GPT-4 Turbo”。其提供自然语言处理、图片生成、自动化数据标注、自定义模型训练等多种大模型及能力。文科能力方面,其在创意写作、推理总结等方面能力均有提升,可为教育、内容产业等垂直应用场景提供辅

不作诗,只做事:华为盘古3.0,给大模型落地定了个调

千呼万唤始出来,华为的多模态千亿级大模型 「盘古」3.0 版来了。