AI资讯列表 - AI在线

刚拿下NeurIPS优秀论文，字节就开源VAR文生图版本，拿下SOTA击败扩散模型

自回归文生图，迎来新王者——新开源模型Infinity，字节商业化技术团队出品，超越Diffusion Model。值得一提的是，这其实是从前段时间斩获NeurIPS最佳论文VAR衍生而来的文生图版本。在预测下一级分辨率的基础上，Infinity用更加细粒度的bitwise tokenizer建模图像空间。

美国银行分析师：英伟达有望正式进军“AI PC”市场，小概率亲自推出 CPU

美国银行分析师Vivek Arya 表示，英伟达或将在“ AI PC 市场”正式亮相，可能通过合作伙伴关系，甚至有小概率直接推出独立 PC CPU 。

2025智能世界50震撼预测！AI海啸来袭，5维度看清AGI与潜在可能

一直坚持的新年预测大多得到印证，尤其去年命中率90%以上。 2025继续。《2024年的16个可能》，讲到我们同时处在四个周期的起点。

华为终端BG李小龙曝出业界翻车难题：手机拍摄的模糊文字，用AI增强很容易翻车

编辑 | 言征近日，华为终端BG李小龙发博展示了Mate70 Pro 的AI照片增强的功能，并热心询问大家对于AI云增强效果是否满意。图片为了方便大家查看效果，大家可以点击下面的大图来查看AI增强效果。左侧是原图，右侧是AI增强图左侧是原图，右侧是AI增强图不过一位好奇的网友在评论区问了一个让李小龙非常关注的问题：小龙总，高倍率看不清楚的字能AI（增强）吗，最好要自然点，不能弄成假的。

马斯克又又又跳票了！说好年底推出的“重大飞跃”的Grok 3，迟迟未现身！AI大厂集体哑火的“下一代模型”，再度验证AI撞墙论！

编辑 | 伊风有没有人发现——马斯克又又又又跳票了？？你说好“年底”发的Grok 3呢？

阿里入局 AI 眼镜：与雷鸟达成战略合作，产品将接入通义大模型

据悉，这是国内首个大模型与AI眼镜硬件厂商开展的深度定制合作，阿里云通义系列大模型将为雷鸟旗下AI眼镜产品提供全套AI技术和产品支持。

动物版谷歌翻译来了？Nature：用AI解码野性的呼唤！

每一种动物都有其独特的历史。来自加拿大Carleton University的鲸鱼生物学家Shane Gero，花了20年时间试图了解鲸鱼是如何交流的。比如，同一个家族的鲸鱼会发出特定的声音，而不同区域的抹香鲸（Physeter macrocephalus）有自己的「方言」。

谷歌研究科学家意外离世，两月前留下绝笔：从事大模型研究让我深陷抑郁症

「再见，菲利克斯！」本周四，人工智能社区都在以自己的方式，对一位科学家进行告别。菲利克斯・希尔（Felix Hill），是 Google DeepMind 的一名研究科学家，在 2024 年 12 月 5 日去世。

Science子刊 | GPT4、Llama等LLM可以调节粒子加速器？仅50%性能优化，未来可期

编辑 | 萝卜皮粒子加速器的自主调节是一个活跃且具有挑战性的研究领域，其目标是实现先进的加速器技术和尖端的高影响力应用，例如物理发现、癌症研究和材料科学。但是，自主加速器调节仍然严重依赖经验丰富的熟练操作员的手动操作。德国亥姆霍兹协会旗下 DESY（Deutsches Elektronen Synchrotron）的研究人员建议使用大型语言模型（LLM）来调整粒子加速器。

AAAI 2025 | 多模态大语言模型空间智能新探索：仅需单张图片或一句话，就可以精准生成3D建模代码啦！

AIxiv专栏是AI在线发布学术、技术内容的栏目。过去数年，AI在线AIxiv专栏接收报道了2000多篇内容，覆盖全球各大高校与企业的顶级实验室，有效促进了学术交流与传播。如果您有优秀的工作想要分享，欢迎投稿或者联系报道。

北大、港理工革新性LiNo框架：线性与非线性模式有效分离，性能全面超越Transformer

本文的通讯作者为北京大学计算机学院长聘副教授杨仝和香港理工大学助理教授王淑君。第一作者为香港理工大学 24 级博士生余国齐，以及联合作者北京大学 21 级软微学院博士生、每因智能创始人郭潇宇等。研究工作在北京大学计算机学院数据结构实验室和每因智能发起的研究课题中完成。

多模态大语言模型空间智能新探索：仅需单张图片或一句话，就可以精准生成3D建模代码啦！

计算机辅助设计（CAD）已经成为许多行业设计、绘图和建模的标准方法。如今，几乎每一个制造出来的物体都是从参数化 CAD 建模开始的。 CAD 构造序列是 CAD 模型表示的一种类型，不同于 Mesh 类型的三角网格、B-rep 格式的点、线、面表示，它被描述为一系列建模操作，包括确定草图 3D 起点和 3D 草图平面方向、绘制 2D 草图、将草图拉伸成 3D 实体形状的完整参数和过程，以 JSON 代码格式储存和表示。

昆仑万维周亚辉：人形机器人时代，中国新首富就在这三个人当中

AI好好用转载作者：周亚辉（昆仑万维创始人）谁会是十年后机器人时代中国的首富，我认为会从这三个人中诞生。写作是我的爱好，给我带来很好的情绪价值，为了创业交付，歇笔了 7 年。最近在朋友圈偶尔写点随笔，获得了一些重量级人物主动跑过来好评，让我又升起了写作的欲望。

谷歌 DeepMind 天才科学家 Felix Hill 英年早逝，年仅 41 岁

就在刚刚，噩耗传来：年仅 41 岁的谷歌 DeepMind 天才科学家 Felix Hill 英年早逝。他的一篇博客揭露了 AI 研究者面临的巨大压力：几大公司的竞争，研究方向的迷失，让他即使积累了大量财富，内心也依然痛苦。AI 研究者们悲痛表示，这个消息令人心碎。

DeepMind天才科学家疑自杀！41岁SuperGLUE之父英年早逝，AI圈悲痛不已

就在刚刚，一个令人悲伤的消息传来。谷歌DeepMind研究科学家Felix Hill，于2024年12月5日英年早逝，年仅41岁。自2023年初以来，他一直在与严重的精神疾病作斗争。

揭示LLaMA 3对话能力的奥秘

过去的一年中，大模型技术得到了广泛认可，全行业对大模型的投入也在不断增加。开源社区涌现了许多优秀的模型和框架，推动了大模型技术的普及和应用。在这一年的时间里，LLaMA 系列模型也经历了快速的发展，从 LLaMA 2 到 LLaMA 3，我们看到了性能和应用上的显著提升。

OpenAI发布新年目标，Agent智能体或将迎来百模大战

2025年1月1日，OpenAI CEO 奥特曼公布了公司的新年目标，涵盖AGI、智能体、4o升级、模型更好记忆、更长上下文等等。图片关于智能体，有网友爆料，OpenAI 可能在 1 月份发布一个名为 “operator” 的 Agent，这个 Agent 将具备直接控制电脑的能力。图片其实24年10月份的时候，Claude 就已经发布了基于 Claude 3.5 Sonnet 多模态大模型，可操作电脑的智能体。

斯坦福AI科研神器开源，一键成文GPT-4o mini加持！科研写作彻底解放双手

AI写作神器，竟被斯坦福开源了！在OpenAI与Perplexity绞尽脑汁去动谷歌搜索的蛋糕时，斯坦福研究团队却「于无声处响惊雷」，一鸣惊人推出了支持避开信息盲点、全面整合可靠信息、从头写出维基长文的STORM&Co-STORM系统。图片背后模型是由必应搜索，以及GPT-4o mini加持。