性能

ScaleOT框架亮相AAAI 2025：提升隐私保护50%，降算力成本90%

近日，在全球人工智能顶级学术会议AAAI2025期间，蚂蚁数科、浙江大学、利物浦大学和华东师范大学联合团队提出创新的跨域微调（offsite-tuning）框架——ScaleOT。该框架能在模型性能无损前提下，将隐私保护效果提升50%，与知识蒸馏技术相比，算力消耗显著降低90%，为百亿级参数模型的跨域微调提供高效轻量化方案，论文因创新性入选AAAI的oral论文(本届大会近13000篇投稿，口头报告比例仅4.6%)。跨域微调是目前业内保护模型产权与数据隐私的主流方案，通过有损压缩将大模型转换为仿真器，数据持有方基于其训练适配器并返回给大模型完成调优，数据和模型均未出域，可保护双方隐私，但存在局限性:一是“均匀抽积木”式处理易致模型关键层缺失，使性能显著下降;二是用蒸馏技术弥补性能损失，计算成本高;且现有方法隐私保护缺乏灵活性。

2/26/2025 2:13:00 PM

AI在线

DeepSeek开源FlashMLA：Hopper GPU解码新标杆，测评大揭秘！

DeepSeek今天正式启动为期五天的开源成果发布计划，首个亮相的项目是FlashMLA。这一开源项目将先进的MLA算法与GPU优化技术相结合，为大模型推理提供了一套高性能、低延迟的解码方案。 FlashMLA是一款专门为Hopper GPU（比如H800 SXM5）优化的高效MLA解码内核，旨在加速大模型的计算任务，尤其是在NVIDIA高端显卡上提升性能。

2/25/2025 10:09:00 AM

新闻助手

李飞飞谢赛宁新作「空间推理」：多模态大模型性能突破关键所在

李飞飞谢赛宁再发新成果：直接把o1式思考拉至下一个level——多模态大语言模型的空间思维！这项研究系统评估了多模态大模型的视觉空间智能，结果发现：当前，即使是最先进的多模态大模型，在空间认知方面与人类相比仍有显著差距，测试中约71%的错误都源于空间推理方面的缺陷，即空间推理能力是当前主要瓶颈。图片更为有趣的是，在这种情况下，思维链、思维树等常用的语言提示技术直接失灵了——不仅没有提升模型在空间任务上的表现，反而会使性能下降。

12/23/2024 12:37:34 PM

明确了：文本数据中加点代码，训练出的大模型更强、更通用

代码知识原来这么重要。如今说起大语言模型（LLM），写代码能力恐怕是「君子六艺」必不可少的一项。在预训练数据集中包含代码，即使对于并非专门为代码设计的大模型来说，也已是必不可少的事。虽然从业者们普遍认为代码数据在通用 LLM 的性能中起着至关重要的作用，但分析代码对非代码任务的精确影响的工作却非常有限。在最近由 Cohere 等机构提交的一项工作中，研究者系统地研究了代码数据对通用大模型性能的影响。论文链接：「预训练中使用的代码数据对代码生成以外的各种下游任务有何影响」。作者对范围广泛的自然语言推理任务、世界知识任

8/22/2024 6:20:00 PM

机器之心

1230 亿参数，Mistral 发布 Large 2 旗舰 AI 模型：支持 80 多种编程语言，增强代码生成、数学和推理能力

AI 竞赛日益激烈，Meta 公司昨日推出开源 Llama 3.1 模型之后，法国人工智能初创公司 Mistral 也加入了竞争行列，推出了新一代旗舰模型 Mistral Large 2。模型简介该模型共有 1230 亿个参数，在代码生成、数学和推理方面比其前身功能更强大，并提供更强大的多语言支持和高级函数调用功能。Mistral Large 2 拥有 128k 的上下文窗口，支持包括中文在内的数十种语言以及 80 多种编码语言。该模型在 MMLU 上的准确度达到了 84.0%，并在代码生成、推理和多语言支持方面有

7/25/2024 6:53:16 AM

故渊

90/270 亿参数，谷歌发布 Gemma 2 开源 AI 模型：性能力压同级、单 A100 / H100 GPU 可运行

感谢谷歌公司昨日发布新闻稿，面向全球研究人员和开发人员发布 Gemma 2 大语言模型，共有 90 亿参数（9B）和 270 亿参数（27B）两种大小。Gemma 2 大语言模型相比较第一代，推理性能更高、效率更高，并在安全性方面取得了重大进步。谷歌在新闻稿中表示，Gemma 2-27B 模型的性能媲美两倍规模的主流模型，而且只需要一片英伟达 H100 ensor Core GPU 或 TPU 主机就能实现这种性能，从而大大降低了部署成本。Gemma 2-9B 模型优于 Llama 3 8B 和其他类似规模的开源模

6/28/2024 8:21:10 AM

故渊

比原始材料强8倍，清华、武汉理工团队用AI筛选高熵电介质材料

编辑 | 萝卜皮电介质材料能够储存和释放电荷，广泛应用于电容器、电子和电力系统中。它们因其高功率密度和快速响应特性，被用于混合动力电动汽车、便携式电子设备和脉冲电力系统等领域，但其能量密度仍需进一步提高。高熵策略已成为提高储能性能的有效方法，然而，在高维组成空间中发现新的高熵系统对于传统的试错实验来说是一个巨大的挑战。武汉理工大学、清华大学、宾夕法尼亚州立大学的研究团队基于相场模拟和有限的实验数据，提出了一种生成学习方法，用于加速在超过 10^11 种组合的无限探索空间中发现高熵介电材料（HED）。该工作为设计高熵

6/25/2024 7:15:00 PM

ScienceAI

苹果推出 300 亿参数 MM1 多模态 AI 大模型，可识别图像推理自然语言

感谢苹果公司旗下研究团队近日在 ArXiv 中公布了一篇名为《MM1：Methods， Analysis & Insights from Multimodal LLM Pre-training》的论文，其中介绍了一款 “MM1”多模态大模型，该模型提供 30 亿、70 亿、300 亿三种参数规模，拥有图像识别和自然语言推理能力。IT之家注意到，苹果研究团队相关论文主要是利用 MM1 模型做实验，通过控制各种变量，找出影响模型效果的关键因素。研究表明，图像分辨率和图像标记数量对模型性能影响较大，视觉语言连接器对模型的

3/16/2024 6:31:33 PM

漾仔

Llama2推理RTX3090胜过4090，延迟吞吐量占优，但被A800远远甩开

这是为数不多深入比较使用消费级 GPU（RTX 3090、4090）和服务器显卡（A800）进行大模型预训练、微调和推理的论文。大型语言模型 (LLM) 在学界和业界都取得了巨大的进展。但训练和部署 LLM 非常昂贵，需要大量的计算资源和内存，因此研究人员开发了许多用于加速 LLM 预训练、微调和推理的开源框架和方法。然而，不同硬件和软件堆栈的运行时性能可能存在很大差异，这使得选择最佳配置变得困难。最近，一篇题为《Dissecting the Runtime Performance of the Training,

12/27/2023 3:04:00 PM

机器之心

Arm新一代架构发布：CPU能效提升40%，GPU性能提升15%

对于全球 Arm 生态来说，每年不变的常数就是 Arm 新发布的「公版」架构，其设计一直在引领移动和云端计算的发展。

5/30/2023 2:50:00 PM

机器之心

全新x86内核架构、XeSS神经网络超采样、千亿晶体管SoC，这次英特尔诚意满满

2021 年英特尔架构日上，英特尔发布一系列重大技术架构的改变和创新：两款全新的 x86 内核架构（能效核与性能核）、代号为 Alder Lake 的首个性能混合架构、英特尔硬件线程调度器、专为数据中心设计的下一代英特尔至强可扩展处理器 Sapphire Rapids 以及基础设施处理器（IPU）等内容。

8/20/2021 12:18:00 PM

机器之心

报名通道开启！CVPR 2021 NAS国际竞赛邀全球开发者迎接挑战

CVPR作为计算机视觉领域和模式识别领域的世界级学术顶会，不仅是展示前沿科技成果的学术会议，也是探索学术应用的一大平台。今年，百度联合澳大利亚悉尼科技大学和美国北卡罗来纳大学举办CVPR 2021 NAS workshop，同时于3月1日正式启动CVPR 2021 NAS国际竞赛，面向全球开发者开放报名通道。人脸识别、语音识别、机器翻译……每一项人工智能应用的背后都离不开AI技术算法模型，而神经网络结构对最终模型的效果起着至关重要的作用。为降低传统神经网络结构对人工经验和背景知识的依赖，近年来神经网络结构搜索（NA

3/2/2021 11:54:00 AM

新闻助手

资讯热榜

上海AI实验室开源InternVL3系列多模态大型语言模型 Haisnap横空出世，小白用户也能轻松打造AI应用全日程揭晓！ICLR 2025论文分享会我们北京见「交交」媲美GPT-4o！上海交大推出口语对话情感大模型，首个纯学术界自研！ 5分钟直出46页论文！谷歌Deep Research完爆OpenAI，最强Gemini 2.5加持 kimi开源视觉语言模型 Kimi-VL 与 Kimi-VL-Thinking，多项基准超越 GPT-4o 击败DeepSeek-R1！豆包新推理模型仅用前者参数量1/3！还将开源两个基准，瞄准通用推理能力！ ChatGPT重大更新，能翻出所有历史对话，网友被AI聊破防了

标签云

人工智能 OpenAI AIGC AI ChatGPT DeepSeek AI绘画数据机器人谷歌模型大模型 Midjourney 智能用户学习开源 GPT 微软 Meta AI创作图像技术论文 Stable Diffusion 马斯克 Gemini 算法蛋白质生成式芯片代码英伟达神经网络腾讯计算研究 Sora AI for Science 3D AI设计 Anthropic 机器学习 GPU 开发者场景华为预测伟达 Transformer 百度深度学习苹果模态 AI视频驾驶文本人形机器人 xAI 搜索大语言模型 Copilot 字节跳动神器推荐 LLaMA 具身智能 Claude 算力安全应用视频生成科技视觉亚马逊干货合集 2024 AGI 特斯拉 DeepMind 训练