微软推出Copilot Vision AI助手赋能网页浏览与决策

2024-12-09 10:53

微软Copilot正日益智能化，这家由萨蒂亚·纳德拉领导的公司刚刚宣布，其AI助手现已具备“视觉”功能，能够与用户一起浏览互联网。虽然该功能在今年10月就已首次宣布，但公司目前正面向部分Pro订阅用户进行预览。据微软介绍，这些用户将能够在其Edge浏览器上打开的网页上触发Copilot Vision，并就屏幕上可见的内容与其进行交互。

微软Copilot正日益智能化，这家由萨蒂亚·纳德拉领导的公司刚刚宣布，其AI助手现已具备“视觉”功能，能够与用户一起浏览互联网。

虽然该功能在今年10月就已首次宣布，但公司目前正面向部分Pro订阅用户进行预览。据微软介绍，这些用户将能够在其Edge浏览器上打开的网页上触发Copilot Vision，并就屏幕上可见的内容与其进行交互。

该功能仍处于开发的早期阶段，且相当受限，但一旦完全成熟，对微软的企业客户而言将可能是一个颠覆性的改变——它将在客户与微软生态系统中的产品(如OneDrive、Excel、SharePoint等)互动时，帮助他们进行分析和决策。

从长远来看，观察Copilot Vision如何与更加开放且功能强大的代理式产品(如Anthropic和Emergence AI的产品)相抗衡也将颇有趣味。这些产品允许开发者整合代理，以跨不同供应商的应用程序进行查看、推理和采取行动。

Copilot Vision能带来什么?

当用户打开一个网站时，他们可能有一个明确的目标，也可能没有，但是，当他们有目标时，比如为学术论文进行研究，执行所需任务的过程就包括浏览网站、阅读所有内容，然后做出决定(比如是否将网站内容作为论文的参考)，同样的道理也适用于其他日常网络任务，如购物。

通过全新的Copilot Vision体验，微软旨在简化整个流程。本质上，用户现在拥有了一个助手，它位于浏览器的底部，可以随时被调用以阅读网站内容，包括所有文本和图像，并帮助用户进行决策。

它能够立即扫描、分析并提供所有所需信息，同时考虑到用户的既定目标——就像另一双眼睛一样。

这一功能具有深远的好处——它可以极大地加速你的工作流程——同时考虑到代理正在阅读和评估你浏览的所有内容，它也具有重大影响，然而，微软已保证，一旦Vision会话关闭，用户共享的所有上下文和信息都将被删除。它还指出，网站数据不会被捕获/存储用于训练底层模型。

“简而言之，我们优先考虑版权、创作者以及我们用户的隐私和安全——并将它们置于首位。”Copilot团队在宣布该功能预览的博客文章中写道。

基于反馈进行扩展

目前，美国已报名参加早期访问Copilot Labs计划的部分Copilot Pro订阅用户将能够在其Edge浏览器中使用视觉功能。该功能为可选加入，这意味着用户不必担心AI一直在读取他们的屏幕。

此外，在这一阶段，该功能将仅适用于部分网站。微软表示，它将根据早期用户的反馈逐步改进该功能，并扩大对更多Pro用户和其他网站的支持。

从长远来看，该公司甚至可能将这些功能扩展到其生态系统中的其他产品，如OneDrive和Excel，从而让企业用户能够更轻松地工作和做出决策，然而，目前尚无官方确认。更不用说，鉴于此处所表明的谨慎态度，这可能需要一些时间才能实现。

微软推出Copilot Vision预览之际，正是竞争对手在代理式AI领域不断提高标准之时。Salesforce已在其Customer 360产品中推出了AgentForce，以实现跨销售、营销和服务等领域的工作流程自动化。

与此同时，Anthropic推出了“Computer Use”，允许开发者整合Claude以与计算机桌面环境进行交互，执行以前仅由人类工作者处理的任务，如打开应用程序、与界面互动和填写表单。

GitHub Copilot 推出视觉功能：图片可秒变代码

GitHub 宣布了其 AI 编程助手 Copilot 的一系列重大更新，此次更新中最引人注目的功能之一是 Copilot 的“Vision”功能。该功能允许用户在聊天中上传截图、照片或图表，Copilot 将基于这些图像生成相应的界面、代码以及替代文本（alt text），从而将用户的视觉想法转化为实际的编程成果。

2/8/2025 9:30:22 AM

远洋

感谢据 CNBC 报道，一位微软工程师向美国联邦贸易委员会 (FTC) 举报该公司的人工智能图片生成器 Copilot Designer 存在安全隐患。这位名叫 Shane Jones 的工程师在微软工作了六年，他致信 FTC 称，尽管他反复警告 Copilot Designer 可能会生成有害图像，但微软却“拒绝”下架该工具。在测试 Copilot Designer 的安全问题和缺陷时，Jones 发现该工具会生成“与堕胎权术语相关的恶魔和怪物、手持突击步枪的青少年、暴力场景中性化的女性图像以及未成年人饮酒和吸毒

3/7/2024 5:36:50 PM

远洋

微软 Microsoft 365 版 Copilot 4 月 1 日面向高校推出，拥有 A3 / A5 许可证可免费用

微软今日宣布将面向更多的教育用户提供 Copilot 及 AI 工具包，希望为教育工作者提供免费的 AI 功能以节省时间。微软表示，具有商业数据保护功能的 Microsoft Copilot 现已嵌入所有 Microsoft 365 教育产品中，包括零成本许可证，将提供给所有 18 岁及以上的教师和高校学生，并将在今年春季启动针对年轻学生的私人预览计划。微软还表示将为高校用户提供一项新优惠：专为保护学生设备而设计的 Microsoft Defender for Endpoint 将提供折扣价。从 2024 年 4

3/7/2024 7:20:26 AM

问舟

资讯热榜

上海AI实验室开源InternVL3系列多模态大型语言模型「交交」媲美GPT-4o！上海交大推出口语对话情感大模型，首个纯学术界自研！ Haisnap横空出世，小白用户也能轻松打造AI应用 kimi开源视觉语言模型 Kimi-VL 与 Kimi-VL-Thinking，多项基准超越 GPT-4o 本地部署DeepSeek+DiFy平台构建智能体应用韩国初创公司 RLWRLD 获 1480 万美元融资，致力于机器人基础模型开发 ChatGPT重磅更新：新增图像库功能，可查看自己用GPT生成的所有图片击败DeepSeek-R1！豆包新推理模型仅用前者参数量1/3！还将开源两个基准，瞄准通用推理能力！

标签云

人工智能 OpenAI AIGC AI ChatGPT DeepSeek AI绘画数据机器人谷歌模型大模型 Midjourney 智能用户学习开源 GPT 微软 Meta AI创作图像技术论文 Stable Diffusion 马斯克 Gemini 算法蛋白质生成式芯片代码英伟达神经网络腾讯计算研究 Sora AI for Science 3D Anthropic AI设计机器学习 GPU 开发者场景华为预测伟达 Transformer 百度苹果深度学习 AI视频模态人形机器人驾驶 xAI 文本搜索字节跳动大语言模型 Copilot Claude 具身智能神器推荐 LLaMA 算力安全应用视频生成科技视觉亚马逊干货合集 2024 AGI 特斯拉 DeepMind 训练

顶部

微软推出Copilot Vision AI助手赋能网页浏览与决策

Copilot Vision能带来什么?

基于反馈进行扩展

相关资讯

GitHub Copilot 推出视觉功能：图片可秒变代码

微软 AI 图片生成器被自家员工举报：可生成有害图像

微软 Microsoft 365 版 Copilot 4 月 1 日面向高校推出，拥有 A3 / A5 许可证可免费用