独家|杨红霞创业入局“端侧模型”,投后估值 1.5 亿美元

近日,关于字节跳动大语言模型研发技术专家杨红霞离职创业的事情,坊间传得沸沸扬扬。 此前,杨红霞为大家所熟知的是,她曾是阿里达摩院万亿参数规模多模态预训练模型 M6 的技术负责人,参与过北京智源研究院主导的“悟道”大模型项目,而该项目是中国最早的大模型项目之一。 2007 年,杨红霞从南开大学本科毕业后,赴杜克大学攻读博士,师从著名统计学家 David Dunson,著有超过 100 篇杰出学术论文。

近日,关于字节跳动大语言模型研发技术专家杨红霞离职创业的事情,坊间传得沸沸扬扬。

此前,杨红霞为大家所熟知的是,她曾是阿里达摩院万亿参数规模多模态预训练模型 M6 的技术负责人,参与过北京智源研究院主导的“悟道”大模型项目,而该项目是中国最早的大模型项目之一。

2007 年,杨红霞从南开大学本科毕业后,赴杜克大学攻读博士,师从著名统计学家 David Dunson,著有超过 100 篇杰出学术论文。

博士毕业后,杨红霞入职 IBM 全球研发中心任 Watson 研究员,之后又加入雅虎公司,担任首席数据科学家。

2016年,杨红霞回国加入阿里达摩院,就职期间杨红霞的职级为 P9,曾任达摩院智能计算实验室主任,作为技术负责人,一路见证了 M6 从百亿、千亿进化到万亿参数量规模。

去年年初,杨红霞加入字节跳动 AML(Applied Machine Learning,机器学习系统),向团队的负责人项亮汇报,带领一支大约 40 人的团队。

如今,杨红霞身上又多了一层创业者的身份。

今年以来,通用大模型格局逐渐收缩,落地应用成为主旋律,越来越多的目光开始瞄向行业、端侧大模型。而端侧模型,主要应用在手机、电脑、智能网联汽车等终端设备上,具有成本低、移动性强、数据安全等优势,正逐渐成为行业追逐的热门话题。

今年 2 月,清华 THUNLP 走出的 AI 公司——面壁智能推出 20 亿参数的开源端侧模型 MiniCPM;

4 月,商汤推出 1.8B 参数规模的 SenseChat-Lite 版本端侧⼤模型;

5 月,来自斯坦福大学的 NEXA AI 团队发布了全球首个参数量小于 10 亿的多模态 AI Agent 模型 Octopus V3,在函数调用性能上远超同类模型,可与 GPT-4V+GPT4 相媲美,更是将端侧模型卷到新高度。

据了解,NEXA AI 团队创始人兼首席科学家陈伟(Alex Chen),正在攻读斯坦福大学博士学位,拥有丰富的AI研究经验;联合创始人兼首席技术官李志远,毕业于斯坦福大学,并在 Google 和 Amazon Lab 126 实验室拥有 4 年端侧 AI 的研发经验。

不管是手机,还是电脑,或者汽车,在人们的生活中都扮演着重要角色,可见,端侧大模型前景广阔,在如何更好地训练出小且好用的端侧模型的新行业命题下,大有可为。

相关资讯

端侧ChatGPT时刻!这家清华系大模型公司赶在OpenAI、苹果之前

下周苹果即将召开发布会了! 但最令笔者期待的不是 iphone16,而是苹果今年提出的 Apple Intelligence 的进展,这是苹果今年进军端侧 AI 的一大杀手锏。 其实早在今年年初,国内就有一家当时还名不见经传的大模型公司率先喊出 “端侧AI是未来大趋势”的口号,当时还没有太多玩家意识到端侧AI的重要性。

机器人端侧模型的十字路口

作者|朱可轩编辑|陈彩娴自 2023 年以来,以大模型为代表的人工智能与以具身智能为代表的机器人成为科技发展的两股重要力量。 与此同时,将人工智能算法、尤其是大模型应用于进一步提升机器人智能水平也成为一个自然而然的趋势。 在这个背景下,“机器人学习”、“具身大脑”成为炙手可热的名词。

Nature子刊,上智院、复旦、中国气象局研发次季节AI大模型「伏羲」,突破「可预报性沙漠」

编辑 | ScienceAI作者 | 伏羲团队国务院印发的《气象高质量发展纲要(2022—2035 年)》明确提出要「提前一个月预报重大天气过程」,而这离不开 15 天以上的次季节气候预测技术。次季节气候预测关注的是未来 15~60 天的气候异常,可以为农业、水利、能源等领域的生产安排提供重要支撑。相比时效在两周以内的中短期天气预报,次季节气候预测的不确定性更大。它不仅需要考虑初值问题,还要考虑边界强迫的影响,预测来源更为复杂,预测技巧也较少。因此,次季节气候预测一直被称为「可预报性沙漠」,由于其复杂性,甚至连 A