编辑 | 伊风
Manus横空出世,彻底引爆了今天的AI圈!刚刚我们在某站看了一下邀请码,已经被炒到5万块了(天呐!)
图片
自杭州疯狂上大分后,这泼天的AI富贵也轮到武汉了!(公司多数岗位base武汉,在北京也有办公点。)
ManusAI合伙人张涛,赶紧在社交平台回应,短期内会专注build。并紧急澄清:1.我们从未开设任何付费获取邀请码的渠道;2.我们从未投入任何市场推广预算;3.内测期间系统容量有限,我们将优先保障现有用户的核心体验,并逐步有序释放邀请。
图片
那么,Manus到底是啥?为什么那么火?demo出镜的小哥是华人吗,这是一款中国产品吗?
在这篇文章里,我们想带着好奇心,一起找到关于Manus的N个问题的答案。
Manus 体验申请链接 :https://manus.im/invitation
1.Manus到底是啥?都能做哪些事情?
看头衔,Manus就够炸了:全球首个通用AI代理!!
在GAIA (评估通用人工智能助手解决实际问题的基准)上的跑分是这样的,领跑了性能惊艳的DeepResearch!
图片
在demo里的介绍是这样的:
这不仅仅是另一个聊天机器人或工作流,它是一个真正自主的主体,弥合概念和执行之间的差距,当其他人工智能只是在生产想法,Manus交付成果。我们把它看作是人机协作的下一代范式,并可以让你提前一瞥AGI!
更加直观易懂的就是:这是OpenAI DeepResearch和Claude的Computer Use的集合体!自己一个人把研究和执行的活都包揽了!
官方demo
每次接到任务的时候,Manus都会对任务进行分析,然后给自己一个To Do List,逐一完成。
看到demo里Manus干活的样子,还真有点AGI那味了!
官方给出的一个案例,是Manus审阅了15份候选人的简历,然后按照分析的结果对候选人进行了推荐的排序!
图片
第二个案例中,Manus被要求分析纽约的房产,然后将信息汇总成一个报告。
Manus列出的To Do List如下:
- 搜索并阅读关于纽约最安全社区的文章。
- 研究纽约的中学情况。
- 编写 Python 程序来计算预算。
- 基于预算,在房地产网站上筛选合适的房源。
- 整合所有信息,撰写详细报告并整理相关资料
图片
第三个案例中,Manus做了一个股票相关性的分析,最后生成了一个网站链接,里面的数据表格居然都是可交互的!!!
图片
很多人都感叹道,AI实习生一来,留给行业新人的机会越来越少了!
2.Manus在GAIA上的领先分量几何?这个基准怎么定的?
2023年11 月,由Meta 人工智能研究院和Hugging Face团队牵头,定下了一个面向通用AI助手能力的基准评测体系,这就是GALA。
Manus的很大程度体现了,这是向通用智能上迈进的重大一步。
论文摘要中说:如果 AI 能够解决 GAIA,将标志着 AI 研究的一个重要里程碑。GAIA 设计了一系列真实世界的问题,这些问题需要 AI 具备推理、多模态处理、网页浏览以及通用工具使用等核心能力。
图片
论文地址:https://arxiv.org/pdf/2311.12983v1
看这个论文作者,杨立昆大佬赫然在列。
值得一提的是:GALA基准发布时,已经发布了半年多的GPT-4才得分15%,而人类的表现为 92%。
此时,距离2023年9 月的 Meta Connect 大会,所发布了一系列 AI 聊天助手,也才过去了刚刚两个月。可以想见,Meta 可能希望通过 GAIA 评估 LLM 在实际 AI 助手任务上的差距,以指导其未来的发展方向。
为啥在数学、编程领域一骑绝尘的AI,到了GALA就玩不转了呢?因为GAIA 的理念不是追求对人类而言越来越困难的任务,而是AI 是否能像普通人一样,在这些问题上展现出类似的稳定性和可靠性。(能看到杨立昆“宠物猫的智能远远超过大模型”这一观点的影子)
GALA的题型分为三个级别,Lv.1、Lv.2、Lv.3,难度依次递增。
图片
3.Manus的创始人和团队情况?
Manus的创始人肖弘,是一位90后,是一位名副其实的连续创业者。
2011年,肖弘进入华中科技大学软件工程专业学习。2015年毕业后,肖弘创立了武汉夜莺科技有限公司,专注于微信生态的应用研发与推广。就是这家公司,推出了大名鼎鼎的壹伴助手(微信公众号编辑插件)和微伴助手(企业微信SCRM产品),累计服务超过200万B端用户。
2022年,肖弘创立了蝴蝶效应公司,也就是Manus的母公司。
蝴蝶效应公司先推出了AI浏览器插件Monica。Monica是一款一站式AI助手,整合了OpenAI、Anthropic、DeepSeek等前沿AI模型,提供聊天、翻译、写作等功能。
而在demo视频中出镜的小哥是季逸超(Peak),也是一位知名的“少年极客”。
高中时期,他独立开发了多款苹果应用,包括获得Macworld Asia特等奖的猛犸浏览器(Mammoth Web Browser),以及全球首款手势输入法Rasgueado。
季逸超作为AI创业者的经历也很有意思,他一直在focus通用智能的方向。他所创立的 Peak Labs 把全部的精力都投入了知识搜索引擎 Magi。但在体验GPT-3 API后,他陷入了绝望,并卖掉了创建十年的公司另起炉灶,他现在是蝴蝶效应公司的CTO。
4.Manus用的什么模型?用到DeepSeek了吗?
小编推测是很有可能。
蝴蝶效应公司应该是一家模型、应用分离的公司,类似于Cursor,只做应用层接入别人的大模型。
今年2月份,蝴蝶效应公司打造的Monica的中文版开启内测时。该版本就接入了DeepSeek R1 和 V3 模型,由此为产品配置深度推理思考能力,并支持记忆功能和实时联网搜索。而其海外版本在配置DeepSeek之外,还接入了Claude 3.5等模型。
另外,蝴蝶效应的招聘岗位中,截至目前并没有人工智能模型研发岗位,这也进一步佐证Manus接入主流大模型的可能性。
图片
5.Manus是重大的技术突破吗?有什么局限?
在GAIA跑分一骑绝尘的Manus,无疑在通用AI助手上迈出了重大的一步。
不过,我们可能仍需要一段时间才能触摸到AGI。在为中国AI突破骄傲的同时,我们也想“降降温”,不要冲动购入天价的二手邀请码。
显然,Manus仍然有些局限性。与季逸超同为MIT校友的Zengyi Qin,在X上发表了自己的观点:Manus 显然是一个好产品。
但想成为一个重要的技术突破,还需要一些提升,这是因为Manus:
a. 它主要遵循预定义的流程来执行任务。这种预定义流程会显著限制系统的上限性能,尽管在短期内确实能提升系统的运行效果。
b. 它运行在一个相对受限的环境中, 介于仅限浏览器和操作系统级别之间。超出预定义的软件工具范围,它无法工作。例如,它不能控制 PowerPoint 来为你制作幻灯片。实际上,许多软件都不在 Manus 的工具箱内。
c. 如果 Manus 不是技术突破,那什么才是?一个真正的技术突破应该是在完全开放的操作系统级环境中运行,能够执行大多数任务,并像人类一样操作各种软件。
图片
无论如何,今天的Manus取得的成功是轰动性的。
我们也希望团队可以放出更多的邀请码,让我们都能上手体验,再做出更客观、全面的评价。
AI真的太卷了。这在我们看来,每天都是日新月异的精彩。
但看到季逸超的采访,他从创业者的角度是这样形容自己感受的:
每次睡醒之后,你发现海平面又上涨了。有时候一觉醒来,海水已经淹没了你的鼻子。
AI创业是一场冷酷的竞技游泳比赛。衷心为中国AI创业者感到钦佩,祝贺Manus今天的成功,祝愿他们在这场比赛中享受到领先的乐趣,而且永不孤独。
参考链接:
1.https://www.sohu.com/a/755511127_355029
2.https://xueqiu.com/1752519997/326216457