AI资讯列表 - AI在线

Mistral 发布 Pixtral Large 多模态 AI 模型：登顶复杂数学推理，图表 / 文档推理超过 GPT-4o

Mistral AI 公司昨日（11 月 18 日）发布公告，宣布了全新的多模态 AI 模型 Pixtral Large。该模型拥有 1240 亿参数，基于 Mistral Large 2，主要用于处理文本和图片。

多模态竞技场对标90B Llama 3.2！Pixtral 12B技术报告全公开

作为欧洲的OpenAI，Mistral最近压力不小。端侧小模型端不出来，对比评测的结果又遭到质疑。上个月震撼登场的自家首款多模态大模型Pixtral 12B，也疑似遇到了成绩不如人的窘境。

阿里通义千问发布 Qwen2.5-Turbo 开源 AI 模型：支持 100 万 tokens 上下文，处理时间缩短至 68 秒

阿里通义千问昨日（11 月 18 日）发布博文，宣布在经过数月的优化和打磨后，针对社区中对更长上下文长度（Context Length）的要求，推出了 Qwen2.5-Turbo 开源 AI 模型。

对话华为云马会彬：AI原生应用变革，本质上是一场「从1到 0」的创新

嘉宾 | 马会彬编辑 | 云昭出品 | 51CTO技术栈（微信号：blog51cto）进入2024年，业界对于生成式AI的注意力开始转向应用层。 AI编程领域的Cursor、AI生成视频领域的可灵、自动驾驶领域的Robotaxi等，都取得了很大的突破。据有关媒体报道，2024年创投界在AI应用层上的投资规模整体超过了模型层。

使用Pytorch构建视觉语言模型（VLM）

视觉语言模型（Vision Language Model，VLM）正在改变计算机对视觉和文本信息的理解与交互方式。本文将介绍 VLM 的核心组件和实现细节，可以让你全面掌握这项前沿技术。我们的目标是理解并实现能够通过指令微调来执行有用任务的视觉语言模型。

为了了解DNA与疾病的关系，美国洛斯阿拉莫斯国家实验室的科学家开发了第一个多模态深度学习模型EPBDxDNABERT-2，该模型能够利用DNA“呼吸”，即双螺旋结构自发打开和关闭，来确定转录因子（调节基因活动的蛋白质）之间的精确关系。该模型有可能帮助设计用于治疗源于基因活性疾病的药物。与DNA链结合的转录因子蛋白的表示洛斯阿拉莫斯国家实验室研究员、该论文的第一作者Anowarul Kabir说：“转录因子有很多种，人类基因组的规模大得令人生畏。

高通的自研架构芯片，正在整合生成式AI世界

生成式 AI 的驱动力，就在这块「至尊」芯片上？身处 2024 年末的我们，已经能感觉到大模型就在身边。新一代的旗舰手机上，动态壁纸、AI 画图、语音通话总结等功能一字排开，常用功能也有了新技术加持。

LLM为何频频翻车算术题？研究追踪单个神经元，「大脑短路」才是根源

由于缺少对运行逻辑的解释，大模型一向被人称为「黑箱」，但近来的不少研究已能够在单个神经元层面上解释大模型的运行机制。例如Claude在2023年发表的一项研究，将大模型中大约500个神经元分解成约4000个可解释特征。而10月28日的一项研究，以算术推理作为典型任务，借鉴类似的研究方法，确定了大模型中的一个模型子集，能解释模型大部分的基本算术逻辑行为。

发力了，Mistral对标ChatGPT全面升级le Chat，还祭出超大杯多模态模型

一觉醒来，Mistral AI 又发力了。就在今天，Mistral AI 多模态家族迎来了第二位成员：一个名为 Pixtral Large 的超大杯基础模型。这是一个基于 Mistral Large 2 构建、124B 开放权重的多模态模型，具备顶尖的图像理解能力 —— 能够看懂文档、图表和自然图像，同时保持 Mistral Large 2 领先的纯文本理解能力。

大模型承重墙，去掉了就开始摆烂！苹果给出了「超级权重」

去掉一个「超权重」的影响，比去掉其他 7000 个离群值权重加起来还要严重。大模型的参数量越来越大，越来越聪明，但它们也越来越奇怪了。两年前，有研究者发现了一些古怪之处：在大模型中，有一小部分特别重要的特征（称之为「超权重」），它们虽然数量不多，但对模型的表现非常重要。

取人类与大模型之长，人机协作式智能软件开发框架AgileGen来了

AIxiv专栏是AI在线发布学术、技术内容的栏目。过去数年，AI在线AIxiv专栏接收报道了2000多篇内容，覆盖全球各大高校与企业的顶级实验室，有效促进了学术交流与传播。如果您有优秀的工作想要分享，欢迎投稿或者联系报道。

面向代码语言模型的安全性研究全新进展，南大&NTU联合发布全面综述

消息称腾讯杰出科学家、混元大模型技术负责人之一刘威离职

今年 9 月，他还在 2024 外滩新媒体年会上发表了题为《生成式 AI 的发展与腾讯混元大模型的实践》的主旨演讲。（AI 前线）

英伟达发布新 AI 硬件：H200 NVL PCIe GPU 和 GB200 NVL4 超级芯片

H200 NVL 是此前 H200 SXM 的 PCIe AIC 降频版本；GB200 NVL4 超级芯片规模相当于 2 组单 CPU + 双 GPU 的 GB200 Grace Blackwell 超级芯片。

研究发现ChatGPT在疾病诊断方面优于医生

随着AI技术的飞速发展，其在医疗保健领域的应用也日益广泛。近期，一项由波士顿贝斯以色列女执事医疗中心(BethIsrael Deaconess Medical Center)的研究团队发表在《美国医学会网络开放》(JAMA Network . Open)上的研究，引发了广泛关注。

AlphaFold3级性能、开源、可商用，MIT团队推出生物分子预测模型Boltz-1

图示：来自测试集的靶标上的 Boltz-1 的示例预测。（来源：论文）编辑 | 萝卜皮2024 年 11 月 18 日，麻省理工学院（MIT）的研究人员宣布推出 Boltz-1，这是一个开源模型，旨在准确模拟复杂的生物分子相互作用。 Boltz-1 是第一个完全商业化的开源模型，在预测生物分子复合物的 3D 结构方面达到 AlphaFold3 级精度。

北大清华等联合发布 LLaVA-o1：首个自发性视觉 AI 模型，推理计算 Scaling 新思路

由北京大学、清华大学、鹏城实验室、阿里巴巴达摩院以及理海大学（Lehigh University）组成的研究团队，最新推出了 LLaVA-o1，这是首个具备自发性、类似于 GPT-o1 的系统性推理视觉语言模型。

澳门大学最新！CVPR'24 ALOcc：自适应再出山，精度与速度的完美均衡！

写在前面 & 笔者的个人理解基于视觉的语义占用和流量预测在为自动驾驶等现实世界任务提供时空线索方面发挥着至关重要的作用。现有方法优先考虑更高的精度，以满足这些任务的需求。在这项工作中，通过引入一系列针对3D语义占用预测和流量估计的有针对性的改进来提高性能。

资讯列表