微软向免费用户开放 Copilot Vision,测试显示 AI 网页助理仍未成熟

2025年3月28日消息,微软向美国免费用户开放Copilot Vision功能。但实测显示该功能有响应中断、交互受限等问题,像“半成品”,实用性低。#微软 #CopilotVision

微软于 2024 年 12 月邀请 Copilot Pro 用户测试之后,现已邀请非 Pro 的美国地区用户,在 Microsoft Edge 浏览器中测试 Copilot Vision 功能。

微软向免费用户开放 Copilot Vision,测试显示 AI 网页助理仍未成熟

AI在线援引科技媒体 Windows Latest 实测结果,显示该功能虽能识别页面内容,但存在响应中断、交互受限、视野范围狭窄等明显缺陷,目前仅适合提取基础信息,尚不具备实用价值。

Copilot Vision 功能原仅限 Copilot Pro 付费用户使用,现已扩展至美国地区免费用户,但需通过 Edge 浏览器侧边栏调用。

操作流程是用户在 Bing 搜索“Copilot Vision”并点击匹配结果,接受条款后,通过侧边栏语音图标激活“眼镜”按钮,按钮高亮即表示可扫描当前网页。

该媒体实测发现该功能目前仍属于“半成品”,测试中多次出现回答中断或陷入循环,需重复提问才能获取不完整答案。例如,要求描述网页内容时,Copilot 中途停止响应 15 秒后突然切换答案。

此外在交互方面,无法执行点击、播放视频等操作,甚至拒绝用户“停止说话”的指令,称“无法访问页面元素”,此外仅能识别屏幕可见区域内容。

在信息处理方面,依赖页面现有文字,无法主动检索网络数据,滚动页面后无法关联此前识别的相关信息。

微软向免费用户开放 Copilot Vision,测试显示 AI 网页助理仍未成熟

微软向免费用户开放 Copilot Vision,测试显示 AI 网页助理仍未成熟

微软向免费用户开放 Copilot Vision,测试显示 AI 网页助理仍未成熟

该媒体认为当前 Copilot Vision 更像“半成品”,其扫描范围窄、逻辑混乱等问题大幅降低实用性。微软需优化滚动浏览、跨页检索等核心功能,才能兑现 AI 助手的潜力。免费开放或许是为收集用户反馈,但现阶段仅建议用于简单页面摘要。

相关阅读:

  • 《微软邀测 Copilot Vision,开启 AI 网页浏览新时代》

  • 《微软 Edge 浏览器推送 Copilot 新 UI:撰写框消失、Vision 来袭》

  • 《微软 Edge 浏览器测试 Copilot Vision:AI 理解页面内容、交互式对话扩展信息》

相关资讯

GitHub Copilot 推出视觉功能:图片可秒变代码

GitHub 宣布了其 AI 编程助手 Copilot 的一系列重大更新,此次更新中最引人注目的功能之一是 Copilot 的“Vision”功能。该功能允许用户在聊天中上传截图、照片或图表,Copilot 将基于这些图像生成相应的界面、代码以及替代文本(alt text),从而将用户的视觉想法转化为实际的编程成果。

免费体验:微软 Copilot 开放“深度思考”,你的专属 AI 策略顾问

科技媒体 Windows Latest 昨日(1 月 24 日)发布博文,报道称微软正开始邀请 Copilot 用户,免费体验“深度思考”(Think Deeper),会花费更多时间分析问题,并逐步剖析推理生成更详细、更符合用户需求的答案。

微软 Copilot 新技能:背靠 500 万 Clipchamp 素材库,秒速生成 AI 视频

Copilot与Clipchamp的集成,为商业用户提供了一个快速、便捷的AI视频创作工具。Visual Creator简化了视频制作流程,降低了门槛,让用户能够更高效地制作高质量的视频内容,应用于各种商业场景,提升工作效率和创造力。