消息称谷歌将推出“Project Jarvis”:可实现网页任务自动化

据 The Information 报道,谷歌计划在 12 月预览其大型动作模型“Project Jarvis”。 知情人士透露,该项目将帮助用户执行诸如“收集研究、购买产品或预订航班”等任务。 图源 Pexels报道称,“Jarvis”将由未来版本的谷歌 Gemini 驱动,专门针对 Chrome 浏览器进行优化。

据 The Information 报道,谷歌计划在 12 月预览其大型动作模型“Project Jarvis”。知情人士透露,该项目将帮助用户执行诸如“收集研究、购买产品或预订航班”等任务。

消息称谷歌将推出“Project Jarvis”:可实现网页任务自动化

图源 Pexels

报道称,“Jarvis”将由未来版本的谷歌 Gemini 驱动,专门针对 Chrome 浏览器进行优化。该工具旨在通过截取屏幕截图、解析内容并自动点击按钮或输入文本,帮助用户“自动化日常的网页任务”。目前,该工具在执行不同操作的时候,中间会有几秒钟的间隔时间。

AI在线注意到,目前所有大型 AI 公司都在研发类似功能的模型。微软的 Copilot Vision 可以与用户讨论正在浏览的网页;苹果的 Apple Intelligence 预计将在明年具备跨多个应用程序的屏幕识别能力;Anthropic 刚刚推出的 Claude 测试版已能在计算机上执行操作;OpenAI 也在研发类似的功能。

报道称,谷歌展示“Jarvis”的计划也可能会有所变动,预计将首先向少量测试者发布,以帮助公司修复潜在的 Bug。

相关资讯

罗永浩 Jarvis 初创项目“J1 Assistant AI 助理”上线,利用语音与大模型互动

罗永浩旗下 AI 初创项目 Jarvis 现已悄悄在海外上线,目前其官网展示了一款名为 J1 Assistant 的聚合类 AI 助理软件,仅拥有安卓版本。

苹果 Safari 18 浏览器 AI 功能曝光:智能搜索、网页橡皮擦等

据 AppleInsider 报道,苹果公司正在测试一个升级版的 Safari 浏览器,其中包含界面优化、高级内容屏蔽功能以及名为“智能搜索”的人工智能驱动的新工具。据悉,该软件预计将在 2024 年晚些时候作为 Safari 18 正式发布,目前正与下一代苹果操作系统更新 (iOS 18 和 macOS 15) 的内部版本一同进行评估。如果所有新功能都能通过测试,用户将迎来全新的用户界面(UI)来自定义常用页面控制功能,以及“网页橡皮擦”功能和人工智能驱动的内容摘要工具。评估最新版 Safari 18 的工程师可

通义网页版上线“PPT 创作”功能:一句话或一个文档即可生成 PPT

AI在线从通义 AI 官微获悉,通义网页版今天上线了“PPT 创作”功能,其基于通义大模型打造,由通义实验室全链路自研,用户可免费使用。此外,在通义网页版,音视频转文字产品“通义听悟”升级为“实时记录”,长文档阅读助手“通义智文”升级为“阅读助手”,与“PPT 创作”功能共同合并为“通义效率”。据介绍,用户可从通义网页版的“效率”板块进入“PPT 创作”页面,输入一句话或上传文档之后,该工具即可围绕用户给出的内容,自动生成大纲和根据需求展开的内容。此外,PPT 创作支持文生图、图片素材库搜索匹配功能,基于通义万相视