面壁智能

让「GPT-4V」跑在手机上，这家中国大模型公司做到了
真实世界的视觉信息是流动的，而在处理流动性的视觉信息上，端侧视频理解具有天然优势，手机、PC、AR、机器人、智能座驾等端侧设备自带的摄像头，具有天然的多模态输入能力。与云端相比，端侧离用户更近，链路更短，效率更高，同时具有更强的信息安全优势。今日，面壁正式发布了 MiniCPM-V 2.6，在端侧性能实现全面对标 GPT-4V——据介绍，MiniCPM-V 2.6 首次在端侧实现单图、多图、视…
应用
- 973
- 0
朱可轩8月7日
可信度超越GPT-4V，清华&面壁揭秘「小钢炮」模型背后的高效对齐技术
AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年，机器之心AIxiv专栏接收报道了2000多篇内容，覆盖全球各大高校与企业的顶级实验室，有效促进了学术交流与传播。如果您有优秀的工作想要分享，欢迎投稿或者联系报道。投稿邮箱：[email protected]；[email protected]本文主要作者来自 MiniCPM-V 团队，其中第一作者余天予是清华…
应用
- 9
- 0
机器之心6月11日
重磅！斯坦福 AI 团队被曝抄袭中国大模型开源成果，推特舆论开始发酵
过去一年，中国大模型一直被贴上「追赶美国」的标签，但近日，推特上却有人曝出：根据 AI 科技评论整理，事情的经过大致如下：5 月 29 日，斯坦福大学的一个研究团队发布了一个名为「Llama3V」的模型，号称只要 500 美元（约等于人民币 3650 元）就能训练出一个 SOTA 多模态模型，且效果比肩 GPT-4V、Gemini Ultra 与 Claude Opus 。 Github开源：：（…
应用
- 978
- 0
陈彩娴6月4日
国产端侧小模型超越 GPT-4V，「多模态」能力飞升
在刚刚过去的机器人学术顶会 ICRA 2024 上，「具身智能」成为热议，其中围绕具身智能的一个普遍疑问是：若将 AI 大模型应用到消费级机器人领域，首先是模型适配终端，还是终端适配模型？过去一年，由于 6B、7B 等小模型的成果井喷，以及 MoE 训练技术的越发成熟，将模型跑在手机、学习机、平板电脑、机器人甚至汽车等等终端应用上的想象力开始变大，无论算法层还是硬件层都「蠢蠢欲动」。诚然，这已…
应用
- 971
- 0
陈彩娴5月20日
面壁新模型：早于Llama3、比肩 Llama3、推理超越 Llama3！
图注：面壁Eurux-8x22B 模型在 LeetCode 和 TheoremQA这两个具有挑战性的基准测试中，刷新开源大模型推理性能 SOTA。图注：面壁Eurux-8x22B 模型综合性能比肩 LlaMa3-70B，超越开源模型 WizardLM-2-8x22b, Mistral-8x22b-Instruct,DeepSeek-67b，以及闭源模型 GPT-3.5-turbo。 Eurux…
应用
- 982
- 0
张进5月1日
被低估的面壁：打造出不输 OpenAI 的 Scaling Law 曲线
大约 1 个月前，马斯克所创办的 xAI 团队宣布开源 Grok-1——一个参数量为 3140 亿的 MoE 大模型。从参数量来看，Grok-1 超越了 70B 的 LLaMA 2，是当前开源模型中最大的一个，被调侃为「庞然大物」。然而，有研究人员测试却发现，参数规模量如此巨大的 Grok-1 ，效果竟然只与 Mistral AI 的 8x7B MoE 模型相当。
应用
- 971
- 0
王悦4月16日
企业级AI Agent如何落地汽车行业，这是国内首份系统阐述白皮书
一年多来，大模型技能的进步日新月异，模型才能的上限不断抬高。但从产业厘革的角度看，大模型的落地或许刚刚处于开端阶段。如何才能发挥出大模型的巨大潜力，并推动生产力更快更好地厘革，仍然是一个充满摸索空间的课题。每个行业都关心一个问题：将大模型利用到营业层面的最优方法论是什么？当我们谈及这个问题，自然无法避开「AI Agent」（智能体）。当 AI 从学术前沿跨越到实际利用，大模型驱动的智能体正成为推动…
应用
- 6
- 0
机器之心4月12日
中文OCR超过GPT-4V，参数目仅2B，面壁小钢炮拿出了第二弹
OpenAI后，大模型新增长曲线来了。大言语模型的效率，正在被这家「清华系」创业公司发展到新高度。从 ChatGPT 到 Sora，生成式 AI 技巧遵从《苦涩的教训》、Scaling Law 和 Emerging properties 的预言一路走来，让我们已经看到了 AGI 的冰山一角，但技巧的发展的方向还不尽于此。最近一段时间，科技公司大力投入生成式 AI，一系列新的概念正在出现：手机厂商认…
应用
- 3
- 0
机器之心4月12日
向完全自主性更进一步，清华、港大全新跨恣意自我退化政策让智能体学会「以经历为鉴」
「以史为鉴，可以知兴替。」人类的进步史，可以看作是一个接续吸取曩昔经历、接续推进威力边界的自我蜕变过程。在这个过程中，我们吸取曩昔失败的教训以纠正错误，借鉴成功的经历以提高效益和效果。这种自我退化的过程在我们的生活中无所不在：从如何总结经历以更好地解决工作中的问题，到如何行使规律更精确地预测天气，我们都在接续地从曩昔的经历中学习和退化。成功从曩昔的经历中提取知识并将其应用于未来的挑战，这是人类退…
应用
- 7
- 0
机器之心2月6日
专访面壁曾国洋：踩过 1000 次大模型的坑后，造一个性能小钢炮
2月1日，刚成立一年的面壁智能发布了两个在海内外大模型领域「炸裂级」的存在——面壁 MiniCPM 2B 旗舰端侧大模型与面壁OmniLMM多模态大模型。 MiniCPM 2B 有着当之无愧的「小钢炮」称号，其炸裂的点在于，从规模大小和性能来看，仅用2B 规模和1T tokens精选数据，便已在多项主流评测榜单、中英文平均成绩中超越被称为“欧洲最佳大模型”的Mistral-7B。在与其他同等规模…
应用
- 975
- 0
王悦2月5日
2B参数功能超Mistral-7B：面壁智能多模态端侧模型开源
千元机也能本地运行。在大模型不断向着大体量方向前进的同时，最近一段时间，人们在优化和摆设方面也取得了成果。2 月 1 日，面壁智能联合清华 NLP 实验室在北京正式颁布了旗舰端侧大模型「面壁 MiniCPM」。新一代大模型被称为「功能小钢炮」，直接拥抱终端摆设，同时也具有同量级最强的多模态能力。面壁智能本次提出的 MiniCPM 2B 参数目仅有 20 亿，使用 1T token 的精选数据训练。…
应用
- 6
- 0
机器之心2月2日