能力 - AI在线

IBM 推出小型AI模型 Granite 3.2 ，强调高效推理与实用性

IBM 最近发布了其最新的 Granite3.2大型语言模型，旨在为企业和开源社区提供 “小巧、高效、实用” 的企业人工智能解决方案。该模型不仅具备多模态和推理能力，还提升了灵活性和成本效益，使得用户更容易采用。 Granite3.2引入了视觉语言模型（VLM），用于处理文档，进行数据分类和提取。

联合中国教科院打造，科大讯飞首发“高中数学智能教师系统”

在今日上午的 2024 科大讯飞全球 1024 开发者节上，科大讯飞宣布联合中国教科院首发“基于问题链的高中数学智能教师系统”。据介绍，该系统是大量高中数学优秀教师集体智慧与 AI 大模型智能的综合体，最新的星火智慧黑板 2.0 也将于 10 月 25（明）日的第 84 届教育装备展上正式发布。在今年 1 月，中国教育科学研究院、科大讯飞、华为三方达成了战略合作，共同打造教育大模型、研发中小学智能教师。

科大讯飞星火 4.0 Turbo 大模型发布：七大能力全面超越 GPT-4 Turbo

在今日上午的 2024 科大讯飞全球 1024 开发者节上，科大讯飞正式发布“讯飞星火 4.0 Turbo”。讯飞星火 4.0 Turbo 号称迎来全新升级，七大能力全面超越 GPT-4 Turbo，数学能力、代码能力超过 GPT-4o。在数学能力方面，讯飞星火 4.0 Turbo 已完成超长思维链、树搜索和自我反思评价等算法验证，预计今年底可实现类 o1 的高难度数学能力。

2024 科大讯飞全球 1024 开发者节官宣：首发多模态视觉交互、超拟人虚拟人交互能力

感谢AI在线从科大讯飞获悉，第七届世界声博会暨 2024 科大讯飞全球 1024 开发者节将于今年 10 月 24 日在合肥奥体中心正式开启。官方表示，届时将发布讯飞星火大模型升级版，其底座能力将再次升级，包含数学、代码和长文本能力显著提升、中英文综合能力持续领先，训练推理效率大幅提升等特性。在今年的 1024 开发者节活动中，科大讯飞还将首次发布多模态视觉交互及超拟人虚拟人交互能力，官方称将面向万物智联“打造极致人机交互体验”。此外，还将在教育、医疗、科研、司法、政务等领域升级行业大模型及更多应用产品。在去年的

字节跳动发布 GR-2 机器人 AI 大模型：任务平均完成率 97.7%，模拟人类学习处理复杂任务

字节跳动研究团队最新推出了第二代机器人大模型 GR-2（Generative Robot2.0），其亮点在于创新构建“机器人婴儿期”学习阶段，模仿人类成长学习复杂任务，具备卓越的泛化能力和多任务通用性。 GR-2 模型和其它很多 AI 模型一样，包括预训练和微调两个过程。在预训练阶段，GR-2“观看”了多达 3800 万个来自各类公开数据集的互联网视频以及 500 亿个 tokens，涵盖了家庭、户外、办公室等多种日常场景，让 GR-2 具备在后续策略学习中跨越广泛机器人任务和环境的泛化能力。在微调阶段，团队使用机

中文多模态大模型 SuperCLUE-V 基准 8 月榜单发布，腾讯混元居首

感谢据腾讯科技今日报道，中文多模态大模型 SuperCLUE-V 基准 8 月榜单发布，腾讯混元大模型位居国内大模型首位（71.95 分）。腾讯科技方面宣称，该模型准确识别图像元素并生成自然语言描述，全方位理解并洞察细节。此次测评覆盖了 12 个国内外高代表性的多模态理解大模型，腾讯混元模型在多模态基础能力和应用能力中获得 71.95 的分数。AI在线查询得知，8 月榜单中涵盖国内外最具代表性的 12 个多模态理解大模型。腾讯混元大模型在总榜上位居第二，仅次于 GPT-4o。GPT-4o 取得 74.36 分，领跑

SuperCLUE 中文大模型基准测评2024上半年报告

SuperCLUE 发布了《中文大模型基准测评2024上半年报告》，在AI大模型发展的巨大浪潮中，通过多维度综合性测评，对国内外大模型发展现状进行观察与思考。

蚂蚁百灵大模型最新进展：已具备原生多模态能力

7月5日，在2024世界人工智能大会“可信大模型助力产业创新发展”论坛上，蚂蚁集团公布了其自研的百灵大模型最新研发进展：百灵大模型已具备能“看”会“听”、能“说”会“画”的原生多模态能力，可以直接理解并训练音频、视频、图、文等多模态数据。原生多模态被认为是通往AGI的必经之路，在国内，目前只有为数不多的大模型厂商实现了这一能力。记者从大会现场的演示看到，多模态技术可以让大模型更像人一样感知和互动，支撑智能体体验升级，百灵的多模态能力已应用于“支付宝智能助理”上，未来还将支持支付宝上更多智能体升级。（蚂蚁集团副总裁徐

北大推出全新机器人多模态大模型！面向通用和机器人场景的高效推理和操作

AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年，机器之心AIxiv专栏接收报道了2000多篇内容，覆盖全球各大高校与企业的顶级实验室，有效促进了学术交流与传播。如果您有优秀的工作想要分享，欢迎投稿或者联系报道。投稿邮箱：[email protected]；[email protected]本文由 HMI Lab 完成。HMI Lab依托北京大学视频与视觉技术国家工程研究中心和多媒体信息处理全国重点实验室两大平台，长期从事机器学习、多模态学习和具身智能方向的研究。本工作第一作

中国电信已在上海建成单集群的万卡智算资源池，智算规模达 13EFLOPS

中国电信昨天发布了中国电信 AI 产品升级计划和中国电信 AI 品牌标识，推出首批 AI 产品，并成立中国电信“美好家”产业生态联盟。中国电信总经理邵广禄今日在 2024 世界电信和信息社会日大会上介绍称，中国电信重点规划“2 3 7 N M”的智算布局，智算规模达到 13EFLOPS（IT之家注：每秒一百京，即 1018 次浮点运算）。目前，中国电信已在上海已建成单集群的万卡智算资源池；在智算云能力方面已初步具备云骁、慧聚和息壤的三大能力平台，实现了智算算力的统一纳管、一站提供和异构调度的能力，智算云能力

消息称“AI 教母”李飞飞正建立初创公司，开发可理解 3D 空间关系的 AI 系统

当地时间周六，据路透社援引 6 名知情人士消息，计算机科学家李飞飞正在建立一家初创公司。该公司旨在利用类似人类的视觉处理技术，使 AI 具备高级推理能力，有望成为 AI 技术的一次飞跃。IT之家注：李飞飞被广泛称为“AI 教母”，与通常用来指因 AI 技术突破而在 2018 年获得图灵奖的三位研究人员的“AI 教父”对应。这三名“AI 教父”则是杰弗里・辛顿、杨立昆、约书亚・本西奥。一位消息人士通过李飞飞上个月在温哥华 TED 大会发表的演讲，对这家初创公司进行了详细描述：李飞飞曾表示，最前沿的研究涉及一种算法，这

商汤发布日日新 5.0 大模型：推理上下文窗口 200K，号称对标 GPT-4 Turbo

感谢4 月 23 日，商汤科技发布了日日新 5.0 大模型。据介绍，该模型采用 MOE 混合专家架构，在知识、数学、推理和代码能力方面大幅提升。该模型基于超过 10TB tokens 训练，具备 200K 推理上下文窗口（IT之家注：相当于 36.5 万个汉字），推理时上下文窗口达到 200K 左右，更号称“全面对标 GPT-4 Turbo”。其提供自然语言处理、图片生成、自动化数据标注、自定义模型训练等多种大模型及能力。文科能力方面，其在创意写作、推理总结等方面能力均有提升，可为教育、内容产业等垂直应用场景提供辅

不作诗，只做事：华为盘古3.0，给大模型落地定了个调

千呼万唤始出来，华为的多模态千亿级大模型「盘古」3.0 版来了。

斯坦福最新研究警告：别太迷信大模型涌现能力，那是度量选择的结果

大模型出现后，涌现这一术语开始流行起来，通常表述为在小规模模型中不存在，但在大规模模型中存在的能力。但斯坦福大学的研究者对 LLM 拥有涌现能力的说法提出了质疑，他们认为是人为选择度量方式的结果。

复旦邱锡鹏：深度剖析 ChatGPT 类大语言模型的关键技术

内容来源：ChatGPT 及大模型专题研讨会分享嘉宾：复旦大教授邱锡鹏分享主题：《对话式大型语言模型》转载自CSDN稿件ChapGPT 自问世以来，便展现出了令世人惊艳的对话能力。仅用两个月时间，ChatGPT 月活跃用户就达一亿，是史上用户增速最快的消费应用。对于学术界、工业界、或是其他相关应用来说都是一个非常大的机会和挑战。事实上，ChatGPT 的成功并不是偶然结果，其背后多有创新之处。本文整理于达观数据参与承办的「ChatGPT 及大模型专题研讨会」上，复旦大学邱锡鹏教授带来的《对话式大型语言模型》主题分

ChatGPT的前世今生：OpenAI的技术「执拗」与「豪赌」

本文全方位地介绍了 ChatGPT 的能力特征、发展历程以及 OpenAI 一路走来所坚守的技术路线，并对 ChatGPT 出现之后 NLP 领域的范式转换进行了展望，即 ChatGPT 开启「文本生成 + 指令」的范式。

能力

​IBM 推出小型AI模型 Granite 3.2 ，强调高效推理与实用性