面壁
硅谷巨头要学会接受:「DeepSeek 现象」只是开始
2025 年的春节无疑已被 DeepSeek 霸屏。 过去三年每年的春节都有一次重磅的 AI 讨论:2023 年是 ChatGPT、2024 年是 Sora,这两股风潮都是由 OpenAI 掀起,而 2025 年则是 DeepSeek 的 V3 与 R1。 除夕当天 1 月 28 日,DeepSeek 更是趁热发布了文生图模型 Janus-Pro,但后者没有 V3 与 R1 吸引的关注大,原因在于其没有像前者一样动摇了过去基座大模型的「奇迹」来源:算力。
面壁智能获新一轮数亿元融资,高效端侧智能持续引领行业发展
近日,面壁智能完成新一轮数亿元融资,本轮融资由龙芯创投、鼎晖百孚、中关村科学城基金和赛富基金联合领投,北京市人工智能产业投资基金与清科创投跟投,万甲资本担任本轮独家财务顾问。 本轮融资完成后,面壁智能将进一步提速以端侧AI为代表的高效大模型商业化布局,以同等参数、更高性能、更低能耗、更快速度的高效大模型深度服务行业,为用户创造具体可感知的价值。 面壁智能是以「高效为第一性原理」的大模型公司。
长城汽车与面壁智能签署战略合作协议,加快大模型在汽车领域的落地
长城汽车今日宣布,9 月 27 日公司与面壁智能签署战略合作协议,双方将就大模型技术的研发应用在汽车领域展开深入合作。长城汽车介绍称,双方此次合作旨在围绕长城汽车的 AI 大模型技术与数据积累,以面壁智能在端侧大模型的研发与应用的全栈能力,与长城汽车多个技术栈进行产品融合、创新,加快长城汽车大模型技术在汽车领域的落地,为长城汽车智慧出行与用户服务的发展提供新的技术动力。AI在线从公开资料获悉,面壁智能科技有限责任公司成立于 2022 年 8 月,获近千万种子轮融资,2023 年 3 月完成数千万天使轮融资。面壁智能
端侧ChatGPT时刻!这家清华系大模型公司赶在OpenAI、苹果之前
下周苹果即将召开发布会了! 但最令笔者期待的不是 iphone16,而是苹果今年提出的 Apple Intelligence 的进展,这是苹果今年进军端侧 AI 的一大杀手锏。 其实早在今年年初,国内就有一家当时还名不见经传的大模型公司率先喊出 “端侧AI是未来大趋势”的口号,当时还没有太多玩家意识到端侧AI的重要性。
WAIC 最具技术想象力成果发布:新架构面壁小钢炮又一次验证并加速了面壁定律
2020 年,1750 亿参数规模的 GPT-3 问世。 彼时,完整训练 1750 亿参数的模型需要 3.14E11(TFLOPS)的每秒浮点运算量。 如果使用英伟达 80GB A100 GPU(16位浮点算力有 312 TFLOPS,但在分布式环境中很难达到峰值),按照每张显卡 1.5 刀每小时的租赁价格来算,则需要使用一千张 A100 、花费81.6 万刀、用 22 天才能完成整个训练过程。
面壁智能开源“小钢炮”MiniCPM-S AI 模型,主打高效低能耗
今天的 2024 世界人工智能大会(WAIC 2024)期间,面壁智能联合创始人、首席科学家刘知远宣布,开源主打高效低能耗的新一代“面壁小钢炮”MiniCPM-S 模型,同时发布助力开发者一键打造大模型 SuperApp 的全栈工具集 MobileCPM。据介绍,面壁 2024 年发布了具备 GPT-3 同等性能但参数仅为 24 亿的 MiniCPM-2.4B,知识密度提高了约 86 倍。面壁方面更称,这“并不是极限”—— 其持续优化 Scaling Law 使模型知识密度不断提升,可不断训练出计算更加高效、表现更
全国首个司法审判垂直领域 AI 大模型在深圳市中级人民法院上线运行
综合“面壁智能”“深圳市中级人民法院”官方公众号,由面壁智能公司助力的全国首个司法审判垂直领域大模型问世,AI 辅助审判系统于 28 日在深圳市中级人民法院上线运行。据介绍,该大模型能够精确诊断案情,解决 AI 在司法领域的应用难题。该系统可充分尊重裁判者的自主决策权,确保技术进步不“越俎代庖”,让司法裁判始终由审判人员作出。该系统可全面覆盖立案、阅卷、庭审、文书制作等审判业务的 85 项流程,实现 AI 全链条赋能。该系统在各环节节点均设置审核、确认、决定选项和提示,并作为 AI 辅助生成的前置条件,AI 根据智
“清华系”面壁智能与华为云合作,推进大模型端云协同解决方案
面壁智能与华为云于 6 月 22 日在华为开发者大会 2024(HDC2024)上达成正式合作。华为云推进大模型端云协同解决方案中,面壁智能是首个端侧大模型合作方。双方将共同推进大模型端云协同解决方案的研发和部署,进一步降低大模型使用成本、提升响应速度;将大模型放在“离用户最近的地方”,在各个场景和不同领域进一步拓展大模型的应用价值。面壁核心研发团队脱胎于清华自然语言处理实验室,此前他们的开源模型“小钢炮”MiniCPM-Llama3-V 2.5 被斯坦福大学 AI 研究团队的 Llama3-V 开源模型抄袭。据I
斯坦福团队为抄袭清华系面壁智能 AI 模型道歉:Llama3-V 模型将悉数撤下
近日斯坦福大学的 AI 研究团队的 Llama3-V 开源模型被指控抄袭了清华系明星创业公司面壁智能开发的开源模型“小钢炮”MiniCPM-Llama3-V 2.5,在网上引起热议。图源 Pexels5 月 29 日一个斯坦福 AI 团队在网上宣称只需 500 美元就可训练出一个超越 GPT-4V 的 SOTA 多模态大模型,但很快网友就发现该项目使用的模型结构和代码与“小钢炮”高度相似,仅有部分变量名被更改。面壁智能团队在 6 月 2 日深夜确认,斯坦福的模型不仅能识别出“清华简”中的战国古文字,而且连错误的识别
华为哈勃首次投资国内 AI 大模型公司:面壁智能完成数亿元融资,知乎 CTO 李大海担任 CEO
面壁智能昨日宣布完成新一轮数亿元融资,由春华创投、华为哈勃领投,北京市人工智能产业投资基金等跟投,知乎作为战略股东持续跟投支持。哈勃科技创业投资有限公司由华为投资控股有限公司全资持股,成立于 2019 年 4 月 23 日,法定代表人、董事长、总经理是华为全球金融风险控制中心总裁白熠。此前华为哈勃更多投资半导体企业,这是华为哈勃首次投资国内 AI 大模型公司。面壁核心研发团队脱胎于清华自然语言处理实验室。春华创投负责人表示:“大模型技术带来了人工智能范式的进化,我们持续关注人工智能领域,希望陪伴富有远见的创业者,通
面壁智能完成新一轮数亿元融资,继续面向AGI的高效大模型征程
近日,面壁智能完成新一轮数亿元融资,由春华创投、华为哈勃领投,北京市人工智能产业投资基金等跟投,知乎作为战略股东持续跟投支持。本轮融资完成后,面壁智能将进一步推进优秀人才引入,加固大模型发展的底层算力与数据基础,持续引领「高效大模型」路线,推动大模型高效训练、快步应用落地。本轮由光源资本担任独家财务顾问。依托于扎实的原创性AI技术底蕴,面壁智能是世界范围内对「高效大模型」探索最为前列的大模型团队之一,目前已完成了贯彻高效训练、高效落地与高效推理的大模型全栈技术生产线布局。核心研发团队脱胎于清华NLP实验室,拥有中国
面壁智能大模型即日起开放公众服务
11月4日,面壁智能多模态大模型应用「面壁露卡Luca」正式面向公众开放服务。广大用户可访问 注册使用,开启 Luca 最新体验。「面壁露卡Luca」于今年 5 月正式推出,是面壁智能基于其自研千亿参数基座模型 CPM 打造的多模态智能对话助手。经过多次迭代更新,Luca 不仅在中英文语言对话方面表现出色,还具备强大的代码、知识、逻辑及图片理解能力。CPM(Chinese Pretrained Model) 系列是面壁智能自主研发的预训练大语言模型,其中包括国内首个中文大模型 CPM-1,及国内首个开源免费商用基
面壁智能ChatDev火遍全球,GitHub星标超1.2万
ChatDev 又双叒叕霸榜了 GitHub Trending,开源仅 6 周星标数已超 1.2 万!这一由面壁智能(ModelBest)联合清华大学 NLP 实验室共同开发的大模型全流程自动化软件开发框架,火遍全球,吸引国内外软件开发和创业者成为“自来水”。谷歌 DeepMind 大模型产品负责人 Bailey、资深数据科学家 Sanyam Bhutani等对 ChatDev 强大的自动开发软件功能及其背后的大模型群体智能技术进行了详细解读。DeepMind 大模型产品负责人 Bailey 的推特截图资深数据科学
知乎下场,发布「知海图AI」中文大模型,开启内测
如今,国产大模型这场科技之战,已经越来越激烈。而拥有最多高质量中文数据的社区——知乎,也不出意外的终于下场。4月13日,知乎在京举办“2023知乎发现大会”,发布“知海图AI”中文大模型,并开启内测。知乎创始人、董事长兼CEO周源开场时,知乎创始人、董事长兼CEO周源表示,知乎是一个以人与人的讨论分享为核心的生态,从移动互联网时代行至 AI 时代,知乎以问答形式搭建了专业、多元、有价值的“讨论场”。而这种问答形式的讨论场”,也成为了ChatGPT这样的大模型技术应用的天然场景。今日,周源和知乎合作人、CTO李大海共
- 1