业务

从DeepSeek MoE专家负载均衡谈起

上周中的时候, 同事给我了一份线上DeepSeek-R1推理的Expert激活的数据用来研究一些专家负载均衡的算法, 当然这些线上数据来自于公司内部的请求, 从中观测出前面10层专家基本上是相对均衡的, 而越到后面不均衡程度差异越大. 当时讨论到这个问题时, 是怀疑内部的一些请求是否专注于电商领域而带来的不平衡特性, 于是做了一些研究. 恰好搜到Intel的一篇论文《Semantic Specialization in MoE Appears with Scale: A Study of DeepSeek-R1 Expert Specialization》[1]有一些基于语义的MoE分析专家的专业性相关的问题, 再加上前几天看到某个公众号采访某院长的一个比较有趣的说法:“Dense模型适合toB业务,MoE模型适合toC业务”.

美团内部沟通会:AI 为王兴关注 “新” 方向之一

据《晚点 LatePost》报道,美团 CEO 王兴于2月28日召开了一次重要的内部沟通会,参与者包括公司高层及总监级别以上的管理人员。 这次会议是美团成立15周年以来的首次高层沟通会,王兴在会上深入探讨了美团未来的发展方向。 据了解,上此次会议则标志着王兴对美团未来的更深思考,他提出了未来十年将更加关注的三个新方向:食杂零售、国际化和科技创新。

百川智能调整 To B 业务,金融团队裁撤聚焦 AI 医疗

据《智能涌现》报道,王小川创立的 AI 独角兽企业百川智能近期对 To B 业务进行了重大调整。 2025年3月3日,主要负责金融行业 To B 业务的 B 端组被裁撤,相关员工已在当天签署离职协议。 此外,2025年2月19日,原属于 To B 业务的 PE(提示词工程)团队调整至统管算法团队和 C 端产品的产研组。

网络安全是Agentic AI成功的关键,我们该怎么做?

根据专家预测,Agentic AI将带来两到三倍于当前大语言模型(LLM)的生产力提升,因此2025年或将成为Agentic AI的元年。 然而,就如任何强大的新技术一样, Agentic AI具有巨大的潜力,但也存在着重大的安全风险。 一旦这些自主系统偏离预期轨道,后果可能是灾难性的。

大模型的下一步:要高精尖,更要接地气

当下,AI 领域最热门的技术非大模型莫属。提到大模型,你也许会想到高参数、强算力、各种国际级的技术奖项和竞赛佳绩…… 让大家认为数据上的「大」和「强」,就是衡量大模型好坏的标准。

6年技术迭代,阿里全球化出海&合规的挑战和探索

全球化技术根植于全球化业务,经过五个阶段的演进,逐渐发展成为阿里巴巴集团内相对独立的技术体系。本文会首先重点讲解全球化基础设施层的挑战和技术实践。

阿里数据中台底座的12年建设实践

文/阿里云智能计算平台事业部研究员 关涛阿里巴巴数据平台发展的四大阶段构建数据中台,一个强大的数据平台作为底座必不可少。 阿里巴巴数据平台发展的四个阶段,一定程度上其实也是阿里巴巴数据中台发展的四个阶段。这四个阶段里,你可以看到阿里巴巴对自身数据的商业价值的萃取,对原有分而治之的数据系统的聚合,对计算数据资产化和数据高效应用的新思路以及对数据平台治理过程中面临的组织变革等。阶段一:业务百花齐放,发现数据价值2009年到2012年,阿里巴巴电商业务进入爆发期,涌现出非常多有名的业务团队,比如淘宝、1688、AliEx

DataWorks数据建模 - 一揽子数据模型管理解决方案

作者:DataWorks产品经理 刘天鸢在当下的商业环境中,正确的数据治理策略对于数据增值是非常重要的。据统计,企业的数据一直都在以每年50%的速度增长,因此企业数据治理与整合的难度就不断加大了。DataWorks一直以来都致力于成为用户更方便、更快捷地进行数据开发与数据治理的好帮手。此次发布的数据建模,是对已有数据治理领域能力的补齐,为用户带来了在数据开发前,实施事前治理的能力。一、为什么要数据建模引用《大数据之路:阿里巴巴大数据实践》中的内容:“如果把数据看作图书馆里的书,我们希望它们在书架上分门别类地放置;如
  • 1