资讯列表

发力了,Mistral对标ChatGPT全面升级le Chat,还祭出超大杯多模态模型

一觉醒来,Mistral AI 又发力了。 就在今天,Mistral AI 多模态家族迎来了第二位成员:一个名为 Pixtral Large 的超大杯基础模型。 这是一个基于 Mistral Large 2 构建、124B 开放权重的多模态模型,具备顶尖的图像理解能力 —— 能够看懂文档、图表和自然图像,同时保持 Mistral Large 2 领先的纯文本理解能力。

大模型承重墙,去掉了就开始摆烂!苹果给出了「超级权重」

去掉一个「超权重」的影响,比去掉其他 7000 个离群值权重加起来还要严重。 大模型的参数量越来越大,越来越聪明,但它们也越来越奇怪了。 两年前,有研究者发现了一些古怪之处:在大模型中,有一小部分特别重要的特征(称之为「超权重」),它们虽然数量不多,但对模型的表现非常重要。

取人类与大模型之长,人机协作式智能软件开发框架AgileGen来了

AIxiv专栏是AI在线发布学术、技术内容的栏目。 过去数年,AI在线AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。 如果您有优秀的工作想要分享,欢迎投稿或者联系报道。

面向代码语言模型的安全性研究全新进展,南大&NTU联合发布全面综述

AIxiv专栏是AI在线发布学术、技术内容的栏目。 过去数年,AI在线AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。 如果您有优秀的工作想要分享,欢迎投稿或者联系报道。

消息称腾讯杰出科学家、混元大模型技术负责人之一刘威离职

今年 9 月,他还在 2024 外滩新媒体年会上发表了题为《生成式 AI 的发展与腾讯混元大模型的实践》的主旨演讲。(AI 前线)

英伟达发布新 AI 硬件:H200 NVL PCIe GPU 和 GB200 NVL4 超级芯片

H200 NVL 是此前 H200 SXM 的 PCIe AIC 降频版本;GB200 NVL4 超级芯片规模相当于 2 组单 CPU + 双 GPU 的 GB200 Grace Blackwell 超级芯片。

研究发现ChatGPT在疾病诊断方面优于医生

随着AI技术的飞速发展,其在医疗保健领域的应用也日益广泛。 近期,一项由波士顿贝斯以色列女执事医疗中心(BethIsrael Deaconess Medical Center)的研究团队发表在《美国医学会网络开放》(JAMA Network . Open)上的研究,引发了广泛关注。

AlphaFold3级性能、开源、可商用,MIT团队推出生物分子预测模型Boltz-1

图示:来自测试集的靶标上的 Boltz-1 的示例预测。 (来源:论文)编辑 | 萝卜皮2024 年 11 月 18 日,麻省理工学院(MIT)的研究人员宣布推出 Boltz-1,这是一个开源模型,旨在准确模拟复杂的生物分子相互作用。 Boltz-1 是第一个完全商业化的开源模型,在预测生物分子复合物的 3D 结构方面达到 AlphaFold3 级精度。

北大清华等联合发布 LLaVA-o1:首个自发性视觉 AI 模型,推理计算 Scaling 新思路

由北京大学、清华大学、鹏城实验室、阿里巴巴达摩院以及理海大学(Lehigh University)组成的研究团队,最新推出了 LLaVA-o1,这是首个具备自发性、类似于 GPT-o1 的系统性推理视觉语言模型。

澳门大学最新!CVPR'24 ALOcc:自适应再出山,精度与速度的完美均衡!

写在前面 & 笔者的个人理解基于视觉的语义占用和流量预测在为自动驾驶等现实世界任务提供时空线索方面发挥着至关重要的作用。 现有方法优先考虑更高的精度,以满足这些任务的需求。 在这项工作中,通过引入一系列针对3D语义占用预测和流量估计的有针对性的改进来提高性能。

猫猫运动方程,首次被物理学家破解! |《美国物理学杂志》正经研究

猫猫和人的交互行为,竟然被物理学家用方程式写出来了! 其成果还正经刊登在了《美国物理学杂志》上。 起因就是这位名叫Anxo Biasi的小哥,有一天观察起了自家猫猫,突发奇想:能否将猫视为一个在人产生的势场中运动的质点,用物理方程来描述其行为?

AI一键解析九大生物医学成像模式,用户只需文字prompt交互,微软UW等新研究登Nature Methods

用AI大模型一键解析MRI、CT和病理学等九大生物医学成像模式。 不仅复杂、不规则形状对象能高精度识别:而且通过对象识别阈值建模,模型能够检测无效的提示请求,并在图像中不存在指定对象时拒绝分割。 用户更是无需手动进行标注或边界框操作——只需通过简单的临床语言提示指定目标对象,例如“肿瘤边界”或“免疫细胞”,便能让AI准确识别、检测并分割图像中的相关区域。

生成式 AI 新助力:IBM 携手 AMD 明年部署推出 MI300X 加速器服务

IBM 公司昨日(11 月 18 日)发布公告,宣布和 AMD 公司达成合作,计划在 IBM Cloud 上部署 AMD Instinct™ MI300X 加速器服务(accelerators as a service)。

蚂蚁集团、网商银行统一动态纠偏框架,非随机缺失问题优化新视角

本工作被人工智能顶级会议 NeurIPS 2024 接收。 在诸如推荐系统、展示广告等多数实际应用中,所收集的数据往往包含缺失值,并且这些缺失值通常并非随机缺失,这会使模型的预测性能变差。 一些现有的估计量和正则化器试图实现无偏估计以提升模型的预测性能。

提升人工智能性能的三种关键的LLM压缩策略

译者 | 布加迪审校 | 重楼在当今快节奏的数字环境中,依赖人工智能的企业面临着新的挑战:运行人工智能模型的延迟、内存使用和计算能力成本。 随着人工智能快速发展,幕后推动这些创新的模型变得越来越复杂、资源密集。 虽然这些大模型在处理各种任务中取得了出色的性能,但它们通常伴随着很高的计算和内存需求。

微软在东京开设其日本首个研发中心,专注于将机器人技术与 AI 相结合

据 NHK 报道,美国科技巨头微软在东京开设了其日本首个研发中心,专注于将机器人技术与人工智能相结合,11 月 18 日举行了启用仪式。

网易云音乐创始人再创业、全灵完成千万美元 Pre-A 轮融资,称将发布全球首个 AI 游戏生成平台

全灵创始人兼 CEO 王诗沐是前网易云音乐创始人,曾担任腾讯 NBase 创新业务总经理、腾讯新闻负责人。

AI 写诗胜过莎士比亚?研究显示人类更偏爱 AI 生成的诗歌

据 The Rundown AI 报道,一项由匹兹堡大学进行的研究显示,人们无法区分 AI 生成的诗歌与莎士比亚、艾米莉・狄金森等著名诗人的作品。更令人惊讶的是,超过 78% 的参与者给 AI 生成的诗歌的平均评分高于人类诗人的作品。