大模型

月之暗面 Kimi 推出首个内容社区，开启用户互动新模式

月之暗面近日宣布正在进行其首个内容社区产品的灰度测试，旨在提升用户体验和留存率。这款名为 Kimi 的产品早在去年底就开始了小范围的试用，目前终于迎来了更广泛的测试阶段。据澎湃新闻报道，月之暗面是一家成立于2023年3月的公司，由有着清华背景的杨植麟团队领导。

4/15/2025 12:02:18 PM

AI在线

MCP 协议深度解读：技术创新正以前所未有的速度突破

作者 | rianOpenAI 官宣全面支持MCP协议，至此MCP已得到业界广泛的认可。正逐步成为AI应用架构的基础协议。做为AI应用架构的USB-C,MCP原理是怎样的？

4/15/2025 10:16:12 AM

腾讯技术工程

智谱AI正式启动IPO流程，大模型“六小龙”迎来新篇章

据证券时报消息，国内大模型领域领军企业智谱AI已正式启动首次公开募股（IPO）流程，成为业内备受瞩目的焦点。据悉，智谱2025年4月14日在北京证监局办理辅导备案，辅导机构为中国国际金融股份有限公司。作为“大模型六小龙”（智谱AI、月之暗面、百川智能、MiniMax、零一万物、阶跃星辰）之一，智谱AI的这一里程碑标志着中国AI初创企业迈向资本市场的重要一步。

4/15/2025 10:01:28 AM

AI在线

海豚语言被谷歌大模型破译！跨物种交流大门打开，哈萨比斯：下一个是狗

神奇！人类和海豚真的能实现跨物种交流了？！

4/15/2025 9:53:52 AM

量子位

Meta 新模型 Llama-4-Maverick 排名骤降，引发刷榜质疑

近日，Meta 公司发布的开源大模型 Llama-4-Maverick 在 LMArena 的排行榜上从第二名直降至第32名，这一剧烈波动引发了开发者们的广泛质疑，认为 Meta 可能通过提交特供版本以刷榜。事情的起因要追溯到4月6日，Meta 发布了其最新的大模型 Llama4，包括 Scout、Maverick 和 Behemoth 三个版本。其中，Llama-4-Maverick 在初期的评估中表现亮眼，位列 LMArena 排行榜的第二名，仅次于 Gemini2.5Pro。

4/14/2025 6:01:07 PM

AI在线

商汤大装置SenseCore 2.0全新升级推出1亿元代金券计划

4月14日，在北京举办的2025商汤技术交流日上，商汤科技正式宣布其大装置SenseCore2.0全面升级。作为AI基础设施领域的领军者，商汤大装置SenseCore2.0致力于为企业提供敏捷、灵活、可靠的全栈AI基础设施服务，以极致性价比推动大模型技术的高效落地与规模化应用。商汤大装置SenseCore2.0的升级，旨在应对当前大模型产业面临的三大挑战:开源模型和工具的主流化、性价比的生死线以及多模态技术带来的新场景需求。

4/14/2025 4:01:07 PM

AI在线

WOT大会7月北京启幕！12大AI主题诚征议题和嘉宾

WOT全球人工智能技术峰会是由51CTO开创的面向人工智能领域的高端技术会议品牌，它与另一大会品牌WOT全球技术创新大会一道，自2012年首次举办以来，历时十余年沉淀，累计吸引超过万名技术人员现场参与，同时吸引了数百家国内外知名科技企业和行业龙头、近千位技术领军人物深度合作。 ChatGPT引爆的热潮没有丝毫减缓之势，而DeepSeek又给这一热度添了一把火。伴随大模型的快速迭代、持续演进，生成式AI技术从理念到实践，从应用落地到产品百花齐放，创新速度之快令人瞩目，这也正是WOT全球人工智能技术峰会2025召开的目的和初衷。

4/14/2025 1:55:31 PM

阿里全模态Qwen2.5-Omni技术报告万字解读！

Qwen 团队最近发布了一款统一多模态大模型 Qwen2.5-Omni，开放了 7B 版本的权重。能够同时处理文本、图像、音频和视频输入，并以流式方式生成文本和语音响应。下面来详细看下：开源地址：论文地址：：地址： Face：：：官方体验：：：在日常生活中，人类能够同时感知视觉和听觉信息，并通过大脑处理这些信息后，以书写、说话或使用工具等方式进行反馈，从而与世界上的各种生物进行信息交流并展现智能。

4/14/2025 12:20:00 AM

Goldma

斯坦福权威报告盖章！阿里通义千问贡献排名全球第三！用算力优势重塑全球竞争格局！

近日，斯坦福大学人工智能研究所发布了《2025年人工智能指数报告》，为全球人工智能领域的发展提供了新的视角。报告指出，阿里巴巴在全球重要大模型贡献中位居第三，成为中国科技公司的领军代表。报告显示，2024年，中国在全球 AI 大模型中贡献了15项，而阿里巴巴的6个模型入选，紧随谷歌与 OpenAI 的7个模型之后。

4/13/2025 7:34:53 AM

AI在线

商汤日日新 SenseNova V6 多模态融合大模型发布

“商汤日日新 SenseNova V6”多模态融合大模型于今日发布，具备最长 64K 思维链、数理分析、多模态深度推理、全局记忆等能力，支持 10 分钟的视频推理及深度推理。

4/10/2025 4:16:29 PM

远洋

大模型“自动修 bug”能力将提升，豆包团队开源首个多语言代码修复基准 Multi-SWE-bench

4 月 10 日消息，豆包大模型团队今日通过官方公众号宣布，首个多语言类 SWE 数据集 Multi-SWE-bench 现已正式开源，可用于评估和提升大模型“自动修 Bug”能力。在 SWE-bench 基础上，Multi-SWE-bench 首次覆盖 Python 之外的 7 种主流编程语言，是真正面向“全栈工程”的评测基准。其数据均来自 GitHub issue，历时近一年构建，以尽可能准确测评和提高大模型高阶编程智能水平。

4/10/2025 2:30:12 PM

清源

算法面试80%会问：大模型评估指标全解析

从训练到部署的评估链条大模型的评估贯穿了从研发到部署的全生命周期：训练阶段：使用交叉熵等损失函数指导模型优化方向生成评估：通过BLEU、ROUGE等指标量化生成内容质量能力测试：利用GLUE、MMLU等标准化基准评估多维度能力实战对比：在竞技场上与其他模型直接PK，检验实际效果交叉熵与困惑度熵最初源自物理学，用于描述系统无序程度。在信息论中，熵衡量信息的不确定性：$H(X) = -\sum_{x} P(x)log_b P(x)$交叉熵是评估预测分布与真实分布差异的指标，也是大模型训练中最常用的损失函数：$H(p, q) = -\sum_{i} p(i) \log q(i)$困惑度是评估语言模型的老牌指标，简单说就是预测下一个词有多"困难"。计算公式：复制在实际项目中，我们常用它监控预训练过程。

4/10/2025 7:00:00 AM

贝塔街的万事屋

阿里云刘伟光：AI正在推动各行各业的生产力变革

“阿里云大模型的战略就是服务企业市场创造社会价值，AI正在推动各行各业的生产力变革，通义大模型将深耕企业市场。 ”4月9日，阿里云在京召开AI势能大会，阿里云智能集团资深副总裁、公共云事业部总裁刘伟光称，大模型的社会价值正在企业市场释放，阿里云将坚定投入，打造全栈领先的技术，持续开源开放，为AI应用提速。近一年多来，通义大模型技术加速迭代，在to B和to C赛道都取得了一些进展，在消费端表现为用户体验的优化，在产业侧表现为生产力的极大提升。

4/9/2025 2:35:50 PM

"是我创造了第一个LLM"！Kaggle前首席科学家一句话引发AI学术圈考古行动

论如何在技术圈争论中一句话噎到对方：哥们，是我创造了第一个大语言模型。发言者Jeremy Howard为澳大利亚昆士兰大学名誉教授、曾任Kaggle创始总裁和首席科学家，现answer.ai与fast.ai创始人，。事情的起因是有人质疑他最近的项目llms.txt在帮助大模型爬取互联网信息上并没太大作用，从而引发了这段争论，迅速引起众人围观。

4/9/2025 9:23:00 AM

量子位

一文彻底搞懂 MCP：AI 大模型的标准化工具箱

MCP 最近在 AI 领域引发了广泛关注，特别是在海外各大社区中，大家热烈讨论，热度相当高。我打开了 Google Trends[1]，这是一个专门用于查看全球热点趋势的网站。图片输入关键词后，可以查看其热度变化。

4/9/2025 8:25:20 AM

程序员NEO

模态编码器 | CLIP改进之SigLIP，采用sigmoid损失的图文预训练

DeepMind对CLIP改进的一篇工作--SigLIP，发表在2023CVPR。简单看下研究动机：传统的对比学习方法如CLIP等依赖于 softmax 归一化，这需要一个全局视角来计算成对相似度，从而限制了批处理大小的扩展能力，并且在小批处理大小下表现不佳。因此本文提出了一个简单的成对 Sigmoid 损失函数用于语言-图像预训练（SigLIP）。

4/9/2025 2:10:00 AM

Goldma