资讯列表

如何高效桥接视觉和语言,字节&中大提出全新多模态大模型连接器ParGo

AIxiv专栏是AI在线发布学术、技术内容的栏目。 过去数年,AI在线AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。 如果您有优秀的工作想要分享,欢迎投稿或者联系报道。

以AI之光,点亮未来工厂——人工智能赋能未来工厂论坛成功举办

1 月 9 日,由张江集团指导,AI在线、WAIC Circle、浦软创投联合主办,数字工博支持的「人工智能赋能未来工厂论坛」在上海·浦东软件园圆满举行。 本次论坛以「以 AI 之光, 点亮未来工厂」为主题,通过主题演讲、先锋对话、AI 创新项目路演等丰富多彩的形式,聚焦在人工智能时代的驱动下,推动“AI ”助力企业实现数字化智能转型,论坛汇聚灯塔工厂企业代表联宝科技、中信泰富特钢兴澄特钢、施耐德、三一重工、工业富联、博世和国家级智能制造示范工厂企业代表君实生物,黑湖科技、格创东智、浪潮云州、库帕思等技术企业荣耀亮相。 嘉宾云集,共话行业发展                                    上海张江(集团)有限公司副总经理 陈衡论坛伊始,上海张江(集团)有限公司副总经理陈衡发表致辞。

LLM 带来了「编程末日」?哥本哈根大学计算机教授称“永远不会”

LLM 会把编程淘汰吗?近日,哥本哈根大学的计算机教授,通过分析计算理论中的定理所施加的基本限制,得出结论:距离编程的终结还远得很。

微软 rStar-Math 技术登场:小语言 AI 模型数学推理从“不及格”一跃成为“优等生”

微软亚洲研究院旗下数学和人工智能研究团队昨日(1 月 10 日)发布博文,针对小语言模型,设计并开发了 rStar-Math 技术,专门用于解决数学问题。

中文互联网语料 AI 资源平台发布:27 个数据集、总量 2.7T

中国网络空间安全协会于 1 月 9 日发布公告,面向社会发布中文互联网语料资源平台,支持行业领域、内容模态、体量规模等多种标签分类,便于用户下载与使用。

直击CES 2025:这么离谱的AI小玩意卖89美元,凭啥啊?

AI好好用报道编辑:杨文到底是真创新还是搞噱头? 我们已见过太多奇形怪状的 AI 小玩意了。 比如挂在脖子上的「AI 项链」Friend:别在衣领上形似胸针的 AI Pin:还有各路科技厂商扎堆搞的智能眼镜、智能手表、智能戒指……在这届「科技春晚」CES 上,更是不乏稀奇古怪的 AI 黑科技(也有可能是智商税)。

英伟达迷你超算遭友商嘲讽:宣传 FP4 算力,实际“不如买个游戏电脑”

在 AMD 和英特尔都工作过的芯片设计专家 Raja Koduri 实名吐槽道:FLOPs 除以 4,价格翻倍,这就是在 CES 上 stay grounded 的秘诀。

银河通用发布全球首个端到端具身抓取基础大模型 GraspVLA,预训练数据十亿帧“视觉-语言-动作”对

银河通用昨日宣布,联合北京智源人工智能研究院(BAAI)及北京大学和香港大学研究人员,发布首个全面泛化的端到端具身抓取基础大模型 GraspVLA。

ChatGPT两周年:从不被看好到掀起AI浪潮,一文解析缘起与未来

2022年11月30日,当时还只是一个小型初创的OpenAI用一篇博客,以及首席执行官Sam Altman的一条推特,悄然推出了一项名为ChatGPT的新服务。 在推文中,奥特曼低调地将其称为「一种可能性的早期demo」,「很大程度上是一项研究的发布」,「仍然有很多限制」。 这种措辞看起来与之后的现实情形完全不相符,但从当时来看,OpenAI的团队将期望设定在这个程度是有充足理由的。

英伟达迷你超算遭友商嘲讽:宣传FP4算力,实际“不如买个游戏电脑”

老黄在CES上发布的迷你超算Project DIGITS,开启了AI超算的PC时刻。 但随即也引发了不小争议,还遭到了大佬的贴脸嘲讽。 在AMD和英特尔都工作过的芯片设计专家Raja Koduri实名吐槽道:FLOPs除以4,价格翻倍,这就是在CES上stay grounded的秘诀。

谷歌内部AI人才大迁移,统一纳入DeepMind旗下,归哈萨比斯领导

新年新气象! 谷歌内部AI人才来了个大迁移——统一归拢到DeepMind旗下,归诺奖得主哈萨比斯领导。 本来DeepMind人才密度都是全球数一数二的高,现在又来一整个直线拉升。

AI预测论文能不能中,8B超越70B大模型,港大发布图文融合多智能体GraphAgent

论文能不能中? 可以用AI提前预测~港大黄超教授团队提出多智能体自动化框架GraphAgent,能自动构建和解析知识图谱中的复杂语义网络,应对各类预测和生成任务。 GraphAgent通过图生成、任务规划和任务执行三大核心智能体的协同运作,融合大语言模型与图语言模型的优势,成功连接了结构化图数据与非结构化文本数据,在文本总结与关系建模方面实现了明显提升。

麻省理工Nature子刊:AI加速量子化学计算,精度媲美「金标准」,计算效率提升百万倍!

编辑 | 2049在量子化学计算中,精确预测分子电子结构一直是一个重要而富有挑战性的课题。 传统的密度泛函理论(DFT)方法虽然计算速度快,但精度有限;而高精度的耦合簇(CCSD(T))方法虽然被视为「金标准」,但其计算成本随分子大小呈指数级增长,难以应用于复杂体系。 最近,麻省理工学院的研究团队开发出一种创新的多任务学习方法,成功将机器学习与量子化学计算相结合,实现了接近CCSD(T)精度的分子电子结构预测。

AMD把o1炼成了实验室助手,自动科研经费节省84%

芯片强者AMD最新推出科研AI,o1-preview竟成天选打工人? 注意看,只需将科研idea和相关笔记一股脑丢给AI,研究报告甚至是代码就能立马出炉了。 这个AI系统代号“Agent Laboratory”,全程由LLM(大语言模型)驱动完成文献综述、实验,以及报告,一站式搞定科学研究。

AI驱动的药物研发领域,AMD与Nvidia展开正面交锋

编辑 | 白菜叶AMD(Advanced Micro Devices Inc)正与更大的竞争对手 Nvidia 在人工智能支持的药物研发领域展开正面交锋,并有消息称该公司将与初创公司 Absci Corp. 建立新的合作伙伴关系并进行投资。 2025 年 1 月 8 日早盘,Absci 股价飙升逾 30%,此前该公司宣布已从新合作伙伴 AMD 获得 2000 万美元投资,以推进其产品线。

企业软件是否已告别“太贵”时代?

在不太遥远的未来,GenAI将使企业软件领域以往无法实现或成本过高的功能成为可能。 GenAI,尤其是大型语言模型(LLM),正在改变公司开发和交付软件的方式。 从聊天机器人和简单自动化工具开始的这一进程,正在发展成为功能更为强大的AI系统——这些系统与软件架构深度融合,并影响从后端流程到用户界面的方方面面。

一秒内从单个图像生成3D对象,Stability AI推出3D生成新方法

2025 年来了,3D 生成也迎来了新突破。 刚刚,Stability AI 在 CES 上宣布为 3D 生成推出一种两阶段新方法 ——SPAR3D(Stable Point Aware 3D),旨在为游戏开发者、产品设计师和环境构建者开拓 3D 原型设计新方式。 无论是精致的艺术品,还是纹理复杂的日常用品,SPAR3D 都能提供精确的几何形状和完整的 360 度视图的详细预测,包括通常隐藏的区域(例如物体的背面):值得一提的是,SPAR3D 还引入了实时编辑功能,能在不到一秒的时间内从单个图像生成 3D 对象的完整结构。

超越KL!大连理工发布Wasserstein距离知识蒸馏新方法|NeurIPS 2024

自Hinton等人的开创性工作以来,基于Kullback-Leibler散度(KL-Div)的知识蒸馏一直占主导地位。 然而,KL-Div仅比较教师和学生在相应类别上的概率,缺乏跨类别比较的机制,应用于中间层蒸馏时存在问题,其无法处理不重叠的分布且无法感知底层流形的几何结构。 为了解决这些问题,大连理工大学的研究人员提出了一种基于Wasserstein距离(WD)的知识蒸馏方法。