最近爆火的 MCP(Model Context Protocol,模型上下文协议) 是 Anthropic 公司推出的一种开放协议。
目的是让 AI 智能体(如 Claude、ChatGPT 等) 能像“万能插座”一样,轻松连接各种外部工具和数据源,比如日历、数据库、邮件系统、代码编辑器等。
图片
MCP 本质就是一个标准。举一个最简单的例子,大家去买电器的时候,完全不用担心买来的电器插不到自己家的插座上。因为所有插头和插座生产商遵循的都是同一套标准。
统一标准,意味着可以大大提高开发效率,同时降低开发成本。
在没有MCP情况下,我们需要让大模型使用日历、数据库、邮件系统,需要自己对接这些软件,编写不同的API。
图片
但MCP可以帮你屏蔽各种软件API差异,给你提供一个统一的接口,你只管调用就可以,大大降低对接不同软件的难度。
举一个更实际的例子,之前给大家分享过一个自动使用浏览器完成简单任务的开源Agent——browser-use
图片
这个开源项目自己实现了一套操作浏览器的函数,比如:打开网站(go_to_url)、返回上一页(go_back)、点击页面按钮(click_element)、页面文本框输入文字(input_text)等一系列动作。
图片
不但代码复杂,而且还要对浏览器内部机制有一定的了解,如果是个人开发者想要实现这样一个Agent,难度可想而知。
那让我们再来看看使用 MCP 后变得有多简单。
下面介绍一个微软刚刚开源的可操作浏览器的MCP服务器——microsoft/playwright-mcp
图片
同样也提供了一些操作浏览器的工具。
图片
我们不需要关心这些工具内部实现有多复杂,只需要会调用这些工具完成任务即可。
相比于 browser-use 需要自己编写一个个浏览器操作函数,部署 playwright-mcp MCP服务器直接调用当然是效率最高的。
大模型技术真实日新月异,每隔一段时间就会出现炸裂的模型或工具。