微软推出Copilot Vision AI助手赋能网页浏览与决策

微软Copilot正日益智能化,这家由萨蒂亚·纳德拉领导的公司刚刚宣布,其AI助手现已具备“视觉”功能,能够与用户一起浏览互联网。 虽然该功能在今年10月就已首次宣布,但公司目前正面向部分Pro订阅用户进行预览。 据微软介绍,这些用户将能够在其Edge浏览器上打开的网页上触发Copilot Vision,并就屏幕上可见的内容与其进行交互。

微软推出Copilot Vision AI助手赋能网页浏览与决策

微软Copilot正日益智能化,这家由萨蒂亚·纳德拉领导的公司刚刚宣布,其AI助手现已具备“视觉”功能,能够与用户一起浏览互联网。

虽然该功能在今年10月就已首次宣布,但公司目前正面向部分Pro订阅用户进行预览。据微软介绍,这些用户将能够在其Edge浏览器上打开的网页上触发Copilot Vision,并就屏幕上可见的内容与其进行交互。

该功能仍处于开发的早期阶段,且相当受限,但一旦完全成熟,对微软的企业客户而言将可能是一个颠覆性的改变——它将在客户与微软生态系统中的产品(如OneDrive、Excel、SharePoint等)互动时,帮助他们进行分析和决策。

从长远来看,观察Copilot Vision如何与更加开放且功能强大的代理式产品(如Anthropic和Emergence AI的产品)相抗衡也将颇有趣味。这些产品允许开发者整合代理,以跨不同供应商的应用程序进行查看、推理和采取行动。

Copilot Vision能带来什么?

当用户打开一个网站时,他们可能有一个明确的目标,也可能没有,但是,当他们有目标时,比如为学术论文进行研究,执行所需任务的过程就包括浏览网站、阅读所有内容,然后做出决定(比如是否将网站内容作为论文的参考),同样的道理也适用于其他日常网络任务,如购物。

通过全新的Copilot Vision体验,微软旨在简化整个流程。本质上,用户现在拥有了一个助手,它位于浏览器的底部,可以随时被调用以阅读网站内容,包括所有文本和图像,并帮助用户进行决策。

它能够立即扫描、分析并提供所有所需信息,同时考虑到用户的既定目标——就像另一双眼睛一样。

这一功能具有深远的好处——它可以极大地加速你的工作流程——同时考虑到代理正在阅读和评估你浏览的所有内容,它也具有重大影响,然而,微软已保证,一旦Vision会话关闭,用户共享的所有上下文和信息都将被删除。它还指出,网站数据不会被捕获/存储用于训练底层模型。

“简而言之,我们优先考虑版权、创作者以及我们用户的隐私和安全——并将它们置于首位。”Copilot团队在宣布该功能预览的博客文章中写道。

基于反馈进行扩展

目前,美国已报名参加早期访问Copilot Labs计划的部分Copilot Pro订阅用户将能够在其Edge浏览器中使用视觉功能。该功能为可选加入,这意味着用户不必担心AI一直在读取他们的屏幕。

此外,在这一阶段,该功能将仅适用于部分网站。微软表示,它将根据早期用户的反馈逐步改进该功能,并扩大对更多Pro用户和其他网站的支持。

从长远来看,该公司甚至可能将这些功能扩展到其生态系统中的其他产品,如OneDrive和Excel,从而让企业用户能够更轻松地工作和做出决策,然而,目前尚无官方确认。更不用说,鉴于此处所表明的谨慎态度,这可能需要一些时间才能实现。

微软推出Copilot Vision预览之际,正是竞争对手在代理式AI领域不断提高标准之时。Salesforce已在其Customer 360产品中推出了AgentForce,以实现跨销售、营销和服务等领域的工作流程自动化。

与此同时,Anthropic推出了“Computer Use”,允许开发者整合Claude以与计算机桌面环境进行交互,执行以前仅由人类工作者处理的任务,如打开应用程序、与界面互动和填写表单。

相关资讯

8500字干货!生成式AI助手设计指南(上篇)

一、前言 自 2022 年 11 月 ChatGPT 横空出世以来,世界好像被颠覆了。各类生成式 AI 迅猛发展,其中生成式 AI 助手以其独特的创造力和智能性,重新定义了许多产品的使用方式。它通过先进的自然语言处理技术,不仅能理解用户的指令和问题,还能生成回答、撰写文本、甚至创作内容,拓展了人机交互的边界,带给人们极大的便利。 全球的技术巨头和创新型初创公司都纷纷投身于生成式 AI 这一必争之地,各大厂商都在积极探索如何将生成式 AI 助手融入到自己的产品和服务中。 本文将从 UX 设计的角度,拆解生成式 AI

5000字干货!生成式AI助手设计指南(下篇)

在生成式 AI 助手设计指南上篇中,我们讨论了生成式 AI 助手的关键设计要素和设计原则。在本篇中,我们将会归纳 AI 助手的体验评估思路,另外会提供两个业务案例供大家探讨。一、评估思路 AI 助手的体验评估没有统一方法,我们在这里提供一些思路供大家参考。 1. 衡量成本与收益 用户花费时间和金钱去使用 AI 助手,目的是为了获得帮助。除金钱成本外,付出的成本主要是使用成本,获得的收益则是有用的答案。可以从这个思路入手去评估: 成本类:易理解性(理解成本)、引导性(构思成本)、易用性(输入成本)、费力度(输入成本)

如何让AI助手从呆萌变聪明?来看58赶集的实战案例

自 ChatGPT 诞生以来,对话式 AI 技术迎来了爆发式的增长。国内众多科技公司纷纷推出了自己的 AI 智能助手,如豆包、文心一言、讯飞星火等。在这样的大背景下,赶集也推出了自己的对话生成式 AI 求职助手——小集。 小集的问世,是对公司 AI 技术的一次挑战,也是对用户体验的一次革新。但相较国内外主流 AI 技术,我们的 AI 技术仍显稚嫩。面对这样的现状,我们不仅深思: 一个不够聪明的对话式 AI 求职助手该怎样做? 经过深思熟虑,我们决定运用设计的力量,以创新的视角和方法,赋予我们的 AI 产品以智慧。