2.0

推动多语言语音科技迈向新高度：INTERSPEECH 2025 ML-SUPERB 2.0 挑战赛

随着语音技术在各领域应用的迅速扩展，全球语言与口音的多样性成为技术进一步突破的重大挑战。为了应对这一难题，来自卡内基梅隆大学（CMU）、斯坦福大学（Stanford University）、乔治梅森大学(George Mason University)、台湾大学与芝加哥丰田技术学院(TTIC)的研究团队连手，在即将举行的 INTERSPEECH 2025 国际会议上推出了 ML-SUPERB 2.0 挑战赛（Multilingual SUPERB 2.0 Challenge）。该挑战旨在推动多语言语音技术迈向新高度，为语音科技的全球化应用奠定坚实基础。

浪潮信息发布源 2.0-M32 大模型 4bit / 8bit 量化版：运行显存仅需 23GB，号称性能媲美 LLaMA3

浪潮信息今日发布源 2.0-M32 大模型 4bit 和 8bit 量化版，性能号称“比肩 700 亿参数的 LLaMA3 开源大模型”。4bit 量化版推理运行显存仅需 23.27GB，处理每 token 所需算力约为 1.9 GFLOPs，算力消耗仅为同等当量大模型 LLaMA3-70B 的 1/80。而 LLaMA3-70B 运行显存为 160GB，所需算力为 140GFLOPs。据浪潮信息介绍，源 2.0-M32 量化版是“源”大模型团队为进一步提高模算效率，降低大模型部署运行的计算资源要求而推出的版本，将

Midjourney 官宣网页版免费用，前谷歌大佬祭出 AI 生图 Ideogram 2.0

Midjourney 一度稳居 AI 生图的第一梯队，甚至是很多人心中的 Top1。但是 Ideogram 2.0 的发布，抢夺了 Midjourney 的荣光，不仅一举拉高了图像生成质量，还打起了价格战。曾经在 AI 图像生成领域无可匹敌的领导者 Midjourney，终于听劝了，上周五推出了网页版图像编辑器。新编辑器巧妙集成了重绘、缩放等核心功能。不仅提高了操作效率，而且使整体交互逻辑更加清晰，对于高频使用 Midjourney 的用户来说，绝对欣喜！今天，Midjourney 宣布，将升级后的新工具向所有人免

科大讯飞智文 2.0 版本发布：内置 AI PPT 编排创作引擎，基于星火大模型

AI在线从讯飞开放平台获悉，讯飞智文 2.0 版本今天正式发布，带来 PPT 文本生成大模型、AI PPT 编排创作引擎、AI PPT 在线编辑模组三大技术升级。据介绍，讯飞智文 2.0 依托讯飞星火 V4.0 的底座能力，在文本生成方面进行了独立训练，对用户输入的主题具备更强大的理解能力。用户在“主题创建”中输入一句话主题，再勾选“联网搜索”，大模型即可自动抓取实时资讯，以确保事实的时效性、准确性。▲ 图为讯飞智文 1.0 生成结果▲ 图为讯飞智文 2.0 生成结果官方表示，讯飞智文 2.0 对长文本的内容理解、

中国农业大学发布“神农大模型 2.0”：覆盖育种、种植、养殖、农业遥感及气象

第八届智慧农业创新发展国际会议于 7 月 13 日在北京举办，中国农业大学在会议上发布了“神农大模型 2.0”。AI在线注意到，相比 1.0 版本，“神农大模型 2.0”在图像、声音、视频、文件等多模态交互及智能化推理方面获得提升，使大模型能够覆盖育种、种植、养殖、农业遥感及气象等多个农业应用场景。“神农大模型 2.0”含有四个专门化的农业专业大模型：“神农・固芯”育种大模型：结合多源高维数据推理分析，优化育种流程，减少盲目性与随机性，为种子筛选与适应性评估提供科学依据，保障粮食安全“神农・筑基”种植大模型：涵盖水

金山办公发布 WPS AI 2.0：个人用户新增 4 个 AI 办公助手，政务自研模型首次亮相

感谢在今天的 2024 世界人工智能大会上，金山办公宣布升级 AI 战略，并正式发布 WPS AI 2.0。其包含 WPS AI 办公助手、WPS AI 政务版等应用，并首次公开了 13B 级别的政务自研模型 —— 金山政务办公模型 1.0。IT之家汇总 WPS AI 2.0 主要特征如下：WPS AI 2.0 为个人用户新增了 4 个 AI 办公助手，分别为 AI 写作助手、AI 阅读助手、AI 数据助手、AI 设计助手。AI 写作助手：可为用户提供“沉浸式”伴写功能，根据用户输入的内容提供智能建议，并进行续写，

手机流畅运行 470 亿大模型：上交大发布 LLM 手机推理框架 PowerInfer-2，提速 29 倍

苹果一出手，在手机等移动设备上部署大模型不可避免地成为行业关注焦点。然而，目前在移动设备上运行的模型相对较小（苹果的是 3B，谷歌的是 2B），并且消耗大量内存，这在很大程度上限制了其应用场景。即使是苹果，目前也需要与 OpenAI 合作，通过将云端 GPT-4o 大模型嵌入到操作系统中来提供能力更强的服务。这样一来，苹果的混合方案引起了非常多关于数据隐私的讨论和争议，甚至马斯克都下场讨论。如果苹果在操作系统层面集成 OpenAI，那么苹果设备将被禁止在我的公司使用。这是不可接受的安全违规行为。既然终端侧本地部署大

首个面向气象导航的全球气象大模型，复旦大学发布“伏羲”2.0

IT之家从复旦大学官方公众号获悉，复旦大学和上海科学智能研究院昨日联合举办“走进智能气象”主题活动暨智能气象创新生态联盟成立仪式。成立仪式上，伏羲系列气象大模型 2.0（简称“伏羲”2.0）发布，以“伏羲”2.0 为核心的智能气象创新生态联盟成立。相较于去年推出的 1.0 系列，“伏羲”2.0 的中期天气预报大模型和次季节大模型，面向新能源、航空运输等行业取得进展。“伏羲”2.0 有以下升级：面向气象导航对伏羲大模型进行优化，提高时空分辨率，实现未来 15 天 0.1 度逐小时气象预测构建海气耦合模型，纳入风浪、涌

Stable Audio 2.0 发布：生成最长 3 分钟音频，能帮音乐家补全创意作品

Stability AI 近日发布新闻稿，宣布推出 Stable Audio2.0，可以基于用户输入的提示词，生成最长 3 分钟的完整音轨。Stable Audio 2.0 在此前 1.0 版本基础上，进一步为音频生成扩展了前奏、副歌、收尾和立体声效果等内容，最长可以生成 3 分钟的音频内容。Stable Audio 2.0 扩充了生成功能之外，还提供了音频生成音频功能，基于用户上传的一小段音频内容，扩展生成、补充相关的音频内容。IT之家附上演示视频如下：例如音乐家如果在创作某段音乐的时候“卡壳”了，可以上传某段

「天工2.0」MoE大模型发布——「天工AI」国内首个MoE架构免费向C端用户开放的大语言模型应用全新问世

北京时间2月6日，昆仑万维正式发布新版MoE大语言模型「天工2.0」与新版「天工AI智能助手」APP，这是国内首个搭载MoE架构并面向全体C端用户免费开放的千亿级参数大语言模型AI应用。用户即日起可在各手机应用市场下载「天工AI智能助手」APP，体验昆仑万维「天工2.0」MoE大模型的卓越性能。「天工2.0」是昆仑万维自去年4月发布双千亿级大语言模型「天工」以来的最大规模版本升级，其采用业内顶尖的MoE专家混合模型架构，应对复杂任务能力更强、模型响应速度更快、训练及推理效率更高、可扩展性更强。此次更新全面升级了AI

千亿规模参数，阿里云通义千问进化到2.0：性能超GPT-3.5，加速追赶GPT-4

10 月 31 日，阿里云正式发布千亿级参数大模型通义千问 2.0。在 10 个权威测评中，通义千问 2.0 综合性能超过 GPT-3.5，正在加速追赶 GPT-4。当天，通义千问 APP 在各大手机应用市场正式上线，所有人都可通过 APP 直接体验最新模型能力。过去 6 个月，通义千问 2.0 在性能上取得巨大飞跃，相比 4 月发布的 1.0 版本，通义千问 2.0 在复杂指令理解、文学创作、通用数学、知识记忆、幻觉抵御等能力上均有显著提升。目前，通义千问的综合性能已经超过 GPT-3.5，加速追赶 GPT-4。