微软人工智能首席执行官穆斯塔法・苏莱曼今天在 Bluesky 上宣布,微软的人工智能助手功能“Copilot Vision”现在可以在 Edge 浏览器中免费使用,该功能可以解读屏幕上的内容并帮助用户使用应用程序。
据AI在线了解,“Copilot Vision”是一种“基于语音的体验”,用户可以通过语音指令与之交互。苏莱曼表示,当用户启用该功能时,“Copilot Vision”能够“实时看到屏幕上你所看到的内容”。例如,用户可以在烹饪时让“Copilot Vision”指导自己按照食谱操作,或者让它“解读”工作职位描述,并直接进入定制化的面试准备或求职信构思环节。不过,微软官方支持页面提醒用户,“Copilot Vision”虽然可以高亮显示屏幕上的部分内容以帮助用户找到相关信息,但它不会代替用户点击链接或执行任何具体操作。
值得注意的是,目前在 Edge 浏览器中免费提供的 Copilot Vision 功能是有限制的。更广泛的、跨应用、系统级别的 Copilot Vision 功能,例如在 Photoshop、视频编辑软件中提供操作指导,或是在《我的世界》(Minecraft) 这类游戏中提供引导,仍然需要用户订阅 Copilot Pro 服务才能使用。
想要尝试“Copilot Vision”功能,用户需要在 Edge 浏览器中访问微软官方提供的一个特定链接。访问该链接后,浏览器通常会弹出请求用户授权启用该功能的提示。用户同意并授权后,即可在浏览任意网页时,打开浏览器侧边栏的 Copilot 图标,点击麦克风按钮。随着一声提示音响起,浏览器界面色调发生轻微变化,即表示 Copilot Vision 会话已成功启动。
微软公司表示,在“Copilot Vision”会话期间,公司会记录 Copilot 对用户的回答内容,但不会收集用户的输入内容、图像或网页内容。当用户不想继续与 Copilot 共享屏幕时,可以选择结束会话或关闭浏览器窗口。