让「GPT-4V」跑在手机上,这家中国大模型公司做到了
真实世界的视觉信息是流动的,而在处理流动性的视觉信息上,端侧视频理解具有天然优势,手机、PC、AR、机器人、智能座驾等端侧设备自带的摄像头,具有天然的多模态输入能力。 与云端相比,端侧离用户更近,链路更短,效率更高,同时具有更强的信息安全优势。 今日,面壁正式发布了 MiniCPM-V 2.6,在端侧性能实现全面对标 GPT-4V——据介绍,MiniCPM-V 2.6 首次在端侧实现单图、多图、视…- 973
- 0
可信度超越GPT-4V,清华&面壁揭秘「小钢炮」模型背后的高效对齐技术
AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。投稿邮箱:[email protected];[email protected]本文主要作者来自 MiniCPM-V 团队,其中第一作者余天予是清华…- 9
- 0
重磅!斯坦福 AI 团队被曝抄袭中国大模型开源成果,推特舆论开始发酵
过去一年,中国大模型一直被贴上「追赶美国」的标签,但近日,推特上却有人曝出:根据 AI 科技评论整理,事情的经过大致如下:5 月 29 日,斯坦福大学的一个研究团队发布了一个名为「Llama3V」的模型,号称只要 500 美元(约等于人民币 3650 元)就能训练出一个 SOTA 多模态模型,且效果比肩 GPT-4V、Gemini Ultra 与 Claude Opus 。 Github开源::(…- 978
- 0
国产端侧小模型超越 GPT-4V,「多模态」能力飞升
在刚刚过去的机器人学术顶会 ICRA 2024 上,「具身智能」成为热议,其中围绕具身智能的一个普遍疑问是:若将 AI 大模型应用到消费级机器人领域,首先是模型适配终端,还是终端适配模型? 过去一年,由于 6B、7B 等小模型的成果井喷,以及 MoE 训练技术的越发成熟,将模型跑在手机、学习机、平板电脑、机器人甚至汽车等等终端应用上的想象力开始变大,无论算法层还是硬件层都「蠢蠢欲动」。 诚然,这已…- 971
- 0
面壁新模型:早于Llama3、比肩 Llama3、推理超越 Llama3!
图注:面壁Eurux-8x22B 模型在 LeetCode 和 TheoremQA这两个具有挑战性的基准测试中,刷新开源大模型推理性能 SOTA。 图注:面壁Eurux-8x22B 模型综合性能比肩 LlaMa3-70B,超越开源模型 WizardLM-2-8x22b, Mistral-8x22b-Instruct,DeepSeek-67b,以及闭源模型 GPT-3.5-turbo。 Eurux…- 982
- 0
被低估的面壁:打造出不输 OpenAI 的 Scaling Law 曲线
大约 1 个月前,马斯克所创办的 xAI 团队宣布开源 Grok-1——一个参数量为 3140 亿的 MoE 大模型。 从参数量来看,Grok-1 超越了 70B 的 LLaMA 2,是当前开源模型中最大的一个,被调侃为「庞然大物」。 然而,有研究人员测试却发现,参数规模量如此巨大的 Grok-1 ,效果竟然只与 Mistral AI 的 8x7B MoE 模型相当。- 971
- 0
企业级AI Agent如何落地汽车行业,这是国内首份系统阐述白皮书
一年多来,大模型技能的进步日新月异,模型才能的上限不断抬高。但从产业厘革的角度看,大模型的落地或许刚刚处于开端阶段。如何才能发挥出大模型的巨大潜力,并推动生产力更快更好地厘革,仍然是一个充满摸索空间的课题。每个行业都关心一个问题:将大模型利用到营业层面的最优方法论是什么?当我们谈及这个问题,自然无法避开「AI Agent」(智能体)。当 AI 从学术前沿跨越到实际利用,大模型驱动的智能体正成为推动…- 6
- 0
中文OCR超过GPT-4V,参数目仅2B,面壁小钢炮拿出了第二弹
OpenAI后,大模型新增长曲线来了。大言语模型的效率,正在被这家「清华系」创业公司发展到新高度。从 ChatGPT 到 Sora,生成式 AI 技巧遵从《苦涩的教训》、Scaling Law 和 Emerging properties 的预言一路走来,让我们已经看到了 AGI 的冰山一角,但技巧的发展的方向还不尽于此。最近一段时间,科技公司大力投入生成式 AI,一系列新的概念正在出现:手机厂商认…- 3
- 0
向完全自主性更进一步,清华、港大全新跨恣意自我退化政策让智能体学会「以经历为鉴」
「以史为鉴,可以知兴替。」 人类的进步史,可以看作是一个接续吸取曩昔经历、接续推进威力边界的自我蜕变过程。在这个过程中,我们吸取曩昔失败的教训以纠正错误,借鉴成功的经历以提高效益和效果。这种自我退化的过程在我们的生活中无所不在:从如何总结经历以更好地解决工作中的问题,到如何行使规律更精确地预测天气,我们都在接续地从曩昔的经历中学习和退化。成功从曩昔的经历中提取知识并将其应用于未来的挑战,这是人类退…- 7
- 0
专访面壁曾国洋:踩过 1000 次大模型的坑后 ,造一个性能小钢炮
2月1日,刚成立一年的面壁智能发布了两个在海内外大模型领域「炸裂级」的存在——面壁 MiniCPM 2B 旗舰端侧大模型与面壁OmniLMM多模态大模型。 MiniCPM 2B 有着当之无愧的「小钢炮」称号,其炸裂的点在于,从规模大小和性能来看,仅用2B 规模和1T tokens精选数据,便已在多项主流评测榜单、中英文平均成绩中超越被称为“欧洲最佳大模型”的Mistral-7B。 在与其他同等规模…- 975
- 0
2B参数功能超Mistral-7B:面壁智能多模态端侧模型开源
千元机也能本地运行。在大模型不断向着大体量方向前进的同时,最近一段时间,人们在优化和摆设方面也取得了成果。2 月 1 日,面壁智能联合清华 NLP 实验室在北京正式颁布了旗舰端侧大模型「面壁 MiniCPM」。新一代大模型被称为「功能小钢炮」,直接拥抱终端摆设,同时也具有同量级最强的多模态能力。面壁智能本次提出的 MiniCPM 2B 参数目仅有 20 亿,使用 1T token 的精选数据训练。…- 6
- 0
面壁智能
❯
个人中心
今日签到
搜索
扫码打开当前页
返回顶部
幸运之星正在降临...
点击领取今天的签到奖励!
恭喜!您今天获得了{{mission.data.mission.credit}}积分
我的优惠劵
- ¥优惠劵使用时效:无法使用使用时效:
之前
使用时效:永久有效优惠劵ID:×
没有优惠劵可用!