应用

首次!大模型自动搜索人工生命,做出AI科学家的Sakana AI又放大招

2024 临近尾声,AI 又给了所有人一个大惊喜,这次可以用来自动发现新的人工生命形式了。 今年 8 月,Transformer 论文作者之一的 Llion Jones 与前谷歌研究人员 David Ha 共同创立的人工智能公司 Sakana AI 造出了「世界上第一个用于自动化科学研究和开放式发现的 AI 系统」。 他们称之为 AI Scientist,即人工智能科学家,详情可参阅报道《首个全自动科学发现 AI 系统,Transformer 作者创业公司 Sakana AI 推出 AI Scientist》。

模拟生命体,智源线虫登上Nature子刊封面,探索AGI的第三条路径

智源研究院提出了 BAAIWorm 天宝 -- 一个全新的、基于数据驱动的生物智能模拟系统,首次实现秀丽线虫神经系统、身体与环境的闭环仿真。 BAAIWorm 天宝通过构建线虫的精细神经系统、身体和环境模型,为探索大脑与行为之间的神经机制提供重要研究平台。 2024 年 12 月 16 日,智源研究院理事长黄铁军和生命模拟研究中心马雷等共同关于 BAAIWorm 天宝的重要进展在国际著名科学期刊《自然・计算科学》(Nature Computational Science)上发表,并于 12 月 21 日被选为期刊封面故事。

终于等来能塞进手机的文生图模型!十分之一体量,SnapGen实现百分百的效果

AIxiv专栏是AI在线发布学术、技术内容的栏目。 过去数年,AI在线AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。 如果您有优秀的工作想要分享,欢迎投稿或者联系报道。

哪家AI能成卧底之王?淘天技术团队发布多智能体博弈游戏平台WiS

AIxiv专栏是AI在线发布学术、技术内容的栏目。 过去数年,AI在线AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。 如果您有优秀的工作想要分享,欢迎投稿或者联系报道。

阿里通义千问开源视觉推理模型 QVQ-72B-Preview:像物理学家一样思考

阿里通义千问 Qwen 团队今天(12 月 25 日)发布博文,宣布基于 Qwen2-VL-72B 构建,推出 QVQ-72B-Preview 开源视觉推理模型,能够像物理学大师一样,面对复杂的物理问题,沉着冷静地通过逻辑推理找到解决方案。

智源线虫登上Nature子刊封面,具身元年尾声深长

智源研究院提出了BAAIWorm天宝--一个全新的、基于数据驱动的生物智能模拟系统,首次实现秀丽线虫神经系统、身体与环境的闭环仿真。 BAAIWorm天宝通过构建线虫的精细神经系统、身体和环境模型,为探索大脑与行为之间的神经机制提供重要研究平台。 2024年12月16日,智源研究院理事长黄铁军和生命模拟研究中心马雷等共同关于BAAIWorm天宝的重要进展在国际著名科学期刊《自然·计算科学》(Nature Computational Science)上发表,并于12月21日被选为期刊封面故事。

中国首次!高文院士获得 IEEE 社会基础设施创新奖

作者|朱可轩编辑|陈彩娴近日,IEEE奖励委员会官网()正式公布了 2025 年度“IEEE技术领域奖”(IEEE Technical Field Awards)获奖名单。 中国工程院院士、北京大学博雅讲席教授、鹏城实验室主任、数字音视频编解码技术标准(AVS)工作组组长高文因其在高性能人工智能计算基础设施和高效视频编码方面的贡献和领导地位,获得 2025 年度“IEEE社会基础设施创新奖”(IEEE Innovation in Societal Infrastructure Award)。 IEEE 每年都会设立技术领域奖,“IEEE社会基础设施创新奖”则设立于 2011 年,至今表彰了 18 位获奖者,高文院士是首位获得该奖项的中国科学家。

机器人端侧模型的十字路口

作者|朱可轩编辑|陈彩娴自 2023 年以来,以大模型为代表的人工智能与以具身智能为代表的机器人成为科技发展的两股重要力量。 与此同时,将人工智能算法、尤其是大模型应用于进一步提升机器人智能水平也成为一个自然而然的趋势。 在这个背景下,“机器人学习”、“具身大脑”成为炙手可热的名词。

谷歌被曝正使用 Anthropic 的 Claude 模型来改进其 Gemini AI

据 TechCrunch 获得的内部通信内容显示,参与改进谷歌 Gemini 人工智能模型的承包商正在将其答案与 Anthropic 的竞品模型 Claude 的输出进行比较。此举引发了谷歌是否获得 Anthropic 授权使用 Claude 进行测试的合规性质疑。

消息称谷歌正为 Chrome 浏览器引入“Glic”AI 功能,基于 Gemini Live 大模型打造

数据挖掘者 Leopeva64 发文,声称其在最近的谷歌 Chrome 浏览器客户端中发现谷歌正在悄悄测试一款专版 Gemini Live AI,相关代码显示该 AI 名为“Glic”(Gemini Live in Chrome)。代码显示用户届时有望通过浏览器浮动面板或侧边界面呼出 AI ,以便于获取对于网页的见解、查询更多资讯等。

消息称 OpenAI 考虑开发人形机器人,此前已投资多家机器人初创公司

据 The Information 今日报道,OpenAI 内部人士近日透露,该公司正在探讨开发人形机器人的可能性。该媒体从两位“直接知情人士”处获悉了这一消息。然而,关于这一潜在项目的细节仍然很少,目前尚不清楚 OpenAI 计划何时推出该机器人,以及其目标应用场景。

今年最被低估的AI模型之一,重现李小龙功夫音

AI好好用报道编辑:Sia音频视频的同步生成,是时候开卷了~承认吧,虽然谷歌 Veo2 在视频生成上完虐了 Sora,但生成的还是个默片。 没声音的 AI 视频,说白了就是个半成品。 看看这组数字:谷歌开放的大规模音频数据集 AudioSet 显示,82% 以上的视频都有人声或音乐;去年抖音上传的 100 多亿条视频里,差不多八成都配了背景音乐。

突破数据瓶颈!交大研发电脑智能体,让 AI 替你熬夜做 PPT

AIxiv专栏是AI在线发布学术、技术内容的栏目。 过去数年,AI在线AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。 如果您有优秀的工作想要分享,欢迎投稿或者联系报道。

图森未来董事长陈默:图森未来重生了,股价回到 40 元时才会原谅自己

图森未来董事长陈默今日发文感谢各股东在图森未来发生了许多不愉快的事后,仍选择相信管理团队和自己!直言“今天是图森未来重生的一天。”

o3智商高达157?每13333人中才有一个这么高,网友:编码分数无意义

从韦氏智商测试来看,如果 o3 的 IQ 真这么高,则称得上非常优秀。 OpenAI o3 的智商(IQ)竟然已经这么高了吗今天,Reddit 上一则热帖宣称「OpenAI o3 的 IQ 估计为 157」,并放出了一张数据图。 这意味着什么呢?

字节整新活!照片+音频让蒙娜丽莎秒变播客主理人

AIxiv专栏是AI在线发布学术、技术内容的栏目。 过去数年,AI在线AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。 如果您有优秀的工作想要分享,欢迎投稿或者联系报道。

推动智能决策,AutoML技术在腾讯广告推荐场景的探索与应用

广告推荐系统的表现直接影响用户体验和商业收益,如何在海量数据中精准捕捉用户需求并提供个性化推荐,成为广告推荐场景面临的重要挑战。 为了解决该场景中的数据稀疏、冷启动等问题,腾讯机器学习平台部对 AutoML 相关技术进行了深入的研究,发表了一系列具有创新性的学术论文。 一、AutoML 技术背景AutoML 自动化机器学习,是一个旨在简化和自动化机器学习模型开发过程的领域。

近1.4万星,腾讯混元大模型开源成绩单公布,多次登顶开源趋势热榜

记者获悉,腾讯云副总裁,腾讯混元大模型负责人刘煜宏在2024开放原子开发者大会暨首届开源技术学术大会上表示,腾讯将开源协同作为公司的核心技术战略,积极推动内外部技术开源共享。 腾讯混元大模型语言大模型、文生图大模型、文生3D大模型以及文生视频大模型等多个模态模型均已开源,未来大模型各版本也将进一步开源,与社区开发者一起共同推动技术生态繁荣发展。 (腾讯云副总裁,腾讯混元大模型负责人 刘煜宏)腾讯混元大模型的开源模型已经全面覆盖文生文、文生图、文生3D以及文生视频多个模态,是开源系列模型中较全的,其模型性能也得到了开源社区的高度认可,总GitHub Star(星星)数量近1.4万颗,并且多次登顶趋势榜。