AI资讯列表 - AI在线

围猎Suno！国产AI音乐三巨头：华语创作称雄，MV一键生成全球首创

终于，谷歌新一代视频生成大模型 Veo2 把 Sora 给秒了：「更懂人间烟火」、「懂电影拍摄技巧」、「分辨率高达 4K 」……视频生成已经步入影视级，但，还是个默片。 Veo2生成视频，来自X网友 @moderncpp7，背景音效是作者手动添加。国内互联网公司却开辟了新玩法，让「视听同步生成」变成现实。

中国信通院联合淘天集团发布全球首个中文安全领域事实性基准评测集，仅三个大模型达及格线

在当今迅速发展的人工智能时代，大语言模型（LLMs）在各种应用中发挥着至关重要的作用。然而，随着其应用的广泛化，模型的安全性问题也引起了广泛关注。探讨如何评估和提升这些模型在复杂的法律、政策和伦理领域的安全性，成为了学术界和工业界亟待解决的重要议题。

Exa CEO：我们处于AGI疯狂前夜，码农迎来“天堂”时代，最受冲击的是数学家

AGI前夜的思考Exa公司CEO Will Bryk，在目睹o3模型的进展后，分享了他对AGI未来的一些想法，以下是他社媒上的帖子整理：AGI真的来了这周我和几个朋友聊了聊o3模型，他们的反应基本都是“我的天，这真的发生了吗？ ”是的，它真的发生了。接下来的几年将会非常疯狂，这将是历史性的，甚至是星际级的事件荒谬的是，目前还没有关于AGI的深度讨论。

4比特量化三倍加速不掉点！清华即插即用的SageAttention迎来升级

AIxiv专栏是AI在线发布学术、技术内容的栏目。过去数年，AI在线AIxiv专栏接收报道了2000多篇内容，覆盖全球各大高校与企业的顶级实验室，有效促进了学术交流与传播。如果您有优秀的工作想要分享，欢迎投稿或者联系报道。

劲爆！理想汽车转做大模型，主持人质疑李想是否跟风：你有理想吗？李想自曝三次创业心得：终极是硅基家人，要做中国第一！

编辑 | 言征厂长李想回来了！不过出人意料的是，李想一公开露面，就曝出一个大料：李想要把理想汽车这家车企改造成一家AI企业？昨晚，理想汽车官宣的三天直播上来就抛出了一个让人脑洞大开、议论纷纷的话题。

引入长思维链！微信基于阿里千问大模型搞出个翻译版o1

最近，类 o1 模型的出现，验证了长思维链 (CoT) 在数学和编码等推理任务中的有效性。在长思考（long thought）的帮助下，LLM 倾向于探索、反思和自我改进推理过程，以获得更准确的答案。在最近的一项研究中，微信 AI 研究团队提出了 DRT-o1，将长 CoT 的成功引入神经机器翻译 (MT)。

超越Claude 3.5紧追o1！DeepSeek-V3-Base开源，编程能力暴增近31％

ScienceAI 2024「AI+材料&化学」专题年度回顾

编辑 | 2049在数字化转型的背景下，人工智能技术正在从根本上改变化学与材料科学的研究范式。 2024年，这场技术革新在多个领域展现其变革力量。在分子设计领域，基于图神经网络（GNN）和 Transformer 架构的深度学习模型，结合分子动力学模拟，实现了分子性质的精确预测与优化。

速度提升44%，节能153倍，清华使用内存计算硬件高效标记数据

编辑丨&对于现在的许多 AI 任务来说，标记数据是一个耗时、劳动密集型且昂贵的过程。深度贝叶斯主动学习（DBAL）以指数级方式提高标记效率，从而大幅降低成本。为了解决 DBAL 需要高带宽的数据传输和概率计算的问题，来自清华大学的团队提出一种忆阻器随机梯度 Langevin 动力学原位学习方法。

「数字孪生」东京上线！Jim Fan：具身智能零样本迁移现实世界，共享「蜂群思维」

东京高分辨率点云3D数字孪生模型现已公开发布！任何人都可以免费下载。项目地址：，而且它对东京的刻画也非常之精细——其绝对位置精度大约在10cm以内。

英特尔至强6独享MRDIMM，内存带宽飙升，加速推理达2.4倍！

之前的文章中，有业者预测至强6性能核处理器每颗计算单元芯片中的内核数量为43，加上每个计算单元有两组双通道内存控制器各占一个网格，那么总共占用43 2=45个网格，可以由5×9的布局构成。但这个假设有一个问题，要构成128核的6980P，三颗芯片只屏蔽1个内核，这良率要求比较高啊。至今还未在公开渠道看到至强6性能核处理器的Die shot或架构图，但英特尔发布了晶圆照片作为宣传素材。

至强 6 性能核处理器在核数、内存带宽均大幅提升的加持下，推理性能激增，进一步提升了推理的性价比。至强 6 性能核的核心规模在之前的文章中，有从业者预测至强 6 性能核处理器每颗计算单元芯片中的内核数量为 43，加上每个计算单元有两组双通道内存控制器各占一个网格，那么总共占用 43 2=45 个网格，可以由 5×9 的布局构成。但这个假设有一个问题，要构成 128 核的 6980P，三颗芯片只屏蔽 1 个内核，这良率要求比较高啊。

SPAR：融合自对弈与树搜索的高性能指令优化框架

大语言模型的指令遵循能力需要模型能够准确识别指令中的细微要求，并在输出中精确体现这些要求。现有方法通常采用偏好学习进行优化，在创建偏好对时直接从模型中采样多个独立响应。但是这种方法可能会引入与指令精确遵循无关的内容变化（例如，同一语义的不同表达方式），这干扰了模型学习识别能够改进指令遵循的关键差异。

CMU等提出超实用「模型泛化性」指标，分布外准确率提升6% | ICML 2024 Oral

当前许多深度学习分类模型通常在大规模数据中训练以找到足以区分不同类别的特征。然而，这种方式不可避免地学到伪相关特征（Spurious Correlation），导致训练的分类器在分布偏移（Distribution Shift）下往往会失效。因此，如何在衡量一个训练好的模型的泛化性（Generalization）一直是一个关键问题。