消息称谷歌将推出“Project Jarvis”:可实现网页任务自动化

据 The Information 报道,谷歌计划在 12 月预览其大型动作模型“Project Jarvis”。 知情人士透露,该项目将帮助用户执行诸如“收集研究、购买产品或预订航班”等任务。 图源 Pexels报道称,“Jarvis”将由未来版本的谷歌 Gemini 驱动,专门针对 Chrome 浏览器进行优化。

据 The Information 报道,谷歌计划在 12 月预览其大型动作模型“Project Jarvis”。知情人士透露,该项目将帮助用户执行诸如“收集研究、购买产品或预订航班”等任务。

消息称谷歌将推出“Project Jarvis”:可实现网页任务自动化

图源 Pexels

报道称,“Jarvis”将由未来版本的谷歌 Gemini 驱动,专门针对 Chrome 浏览器进行优化。该工具旨在通过截取屏幕截图、解析内容并自动点击按钮或输入文本,帮助用户“自动化日常的网页任务”。目前,该工具在执行不同操作的时候,中间会有几秒钟的间隔时间。

AI在线注意到,目前所有大型 AI 公司都在研发类似功能的模型。微软的 Copilot Vision 可以与用户讨论正在浏览的网页;苹果的 Apple Intelligence 预计将在明年具备跨多个应用程序的屏幕识别能力;Anthropic 刚刚推出的 Claude 测试版已能在计算机上执行操作;OpenAI 也在研发类似的功能。

报道称,谷歌展示“Jarvis”的计划也可能会有所变动,预计将首先向少量测试者发布,以帮助公司修复潜在的 Bug。

给TA打赏
共{{data.count}}人
人已打赏
应用

腾讯研发全球首个大熊猫模型:实时识别、统计、分析大熊猫行为并生成报告

2024-10-26 21:37:06

应用

北京发布首份教育领域人工智能应用指南

2024-10-27 9:11:42

0 条回复 A文章作者 M管理员
    暂无讨论,说说你的看法吧
个人中心
今日签到
搜索