AI

专抓AI“看图说谎”，谷歌哥大用三类陷阱触发幻觉，打造可随技术发展动态演进的评估框架

幻觉（Hallucination），即生成事实错误或不一致的信息，已成为视觉-语言模型 (VLMs）可靠性面临的核心挑战。随着VLMs在自动驾驶、医疗诊断等关键领域的广泛应用，幻觉问题因其潜在的重大后果而备受关注。然而，当前针对幻觉问题的研究面临多重制约：图像数据集的有限性、缺乏针对多样化幻觉触发因素的综合评估体系，以及在复杂视觉问答任务中进行开放式评估的固有困难。

3/31/2025 7:40:00 AM

量子位

AI大模型看手相！图片视频加持深度思考，阿里QVQ-Max“神了神了”

阿里又发了个有意思的大模型——QVQ-Max，第一版视觉推理模型，对任意图像或视频都可以进行深度思考。举个有趣的例子，上传一张你的手掌，再点击Thinking，QVQ-Max就可以给你看手相：可以看到，在深度思考过后，QVQ-Max就开始逐步分析手掌上的线条和其他特征。包括心线、头线、生命线等主要线条的分析，以及戒指手指上的金戒指的象征意义。

3/31/2025 7:30:00 AM

量子位

1个实战案例搞懂AI大模型的"万能手"MCP协议，微软也下场了

最近爆火的 MCP（Model Context Protocol，模型上下文协议）是 Anthropic 公司推出的一种开放协议。目的是让 AI 智能体（如 Claude、ChatGPT 等）能像“万能插座”一样，轻松连接各种外部工具和数据源，比如日历、数据库、邮件系统、代码编辑器等。图片MCP 本质就是一个标准。

3/31/2025 4:00:00 AM

源码

Deepseek V3升级！更快、更准、更聪明！

前言大家好，我是林三心，用最通俗易懂的话讲最难的知识点是我的座右铭，基础是进阶的前提是我的初心~🎈 编程的兄弟们都知道，现阶段咱们的开发真的离不开 AI，尤其是碰到一些代码技术上的难题的时候，AI 简直是太好使了，以前咱们要花几个小时去网上查找资料，而现在通过 AI 给出答案，只需要几秒钟 ❗️❗️❗️但是，现在的AI界也是卷出了新的高度，从年前的DeepSeek到Manus每一次的话题都能引爆全网热议。要问目前AI产品的顶流，问小白现在的发展势头非常迅猛，其凭借着速度快、稳定、方便上手使用、完全免费，受到广大用户好评！我们可以在AI ChatBots发布的全球 AI 网站增长榜中清楚的看到，问小白正在以超高的增速杀入全球前三。

3/31/2025 3:33:00 AM

2025年值得关注的AI编码趋势：开发者工具

AI编码工具井喷！开发者面临选择：增强现有IDE（VS Code GitHub Copilot），拥抱“智能IDE”（Cursor, Warp），或转向云原生IDE（Replit, Amazon CodeCatalyst）。云原生工具如Cog, Modal简化AI开发。

3/31/2025 1:00:00 AM

岱军

DeepSeek V3来了老外评测结果：很不错

近期，DeepSeek-V3-0324正式发布，迅速在全球AI领域引发热议。相较于前作，V3版本虽未实现颠覆性创新，却在推理和编程两大关键领域取得进步，为用户带来新的惊喜。 DeepSeek向来秉持低调策略，在推出新版本时，既不发布白皮书进行详细阐述，也没有召开盛大发布会，仅将模型上传至Hugging Face平台。

3/31/2025 12:00:00 AM

小刀

父母用 AI 自行问诊险误孩子病情，汕头大学医学院第一附属医院提醒“用药诊断应遵循专业医生意见”

汕头大学医学院第一附属医院提醒，AI问诊仅供参考，不可盲目轻信。近期一位幼儿因父母轻信AI诊断，自行用药导致病情延误，最终发展为肺炎需住院治疗。#AI问诊# #医疗安全#

3/29/2025 4:54:20 PM

漾仔

马斯克重磅出击！xAI与X正式合并，AI帝国版图再扩张

全球科技巨头埃隆·马斯克今日通过旗下社交媒体平台X发布重磅消息，证实其人工智能初创公司xAI已与X完成合并。本次交易采取全股票形式，使得xAI的估值飙升至 800 亿美元，远超X此前 330 亿美元的估值。马斯克在X上发文，掷地有声地表示：“xAI和X的命运紧密相连。

3/29/2025 10:18:00 AM

AI在线

Al Agent 产品 Manus 公布收费方案：提供 39 美元和 199 美元两种套餐

AI Agent产品Manus公布收费方案，提供39美元和199美元两种套餐，标志着其从免费测试转向商业化运营。Manus号称“全球首款通用Agent产品”，能自主完成复杂任务。#AI助手 #Manus收费

3/28/2025 5:36:36 PM

远洋

九章云极DataCanvas与新加坡谷络吉签署战略合作备忘录，打造AI创新生态

2025年3月25日，九章云极DataCanvas与谷络吉公司KoolLogix在新加坡签署战略合作备忘录 (MoU)。此次合作旨在依托新科研-谷络吉联合实验室的技术底座，结合九章云极DataCanvas在人工智能领域的行业积淀，共同推动AI技术在数据中心和IT运营中的创新应用。九章云极国际业务负责人徐江博士出席签约仪式，联合实验室由C.K.

3/28/2025 5:08:00 PM

新闻助手

英伟达团队发布最新具身模型 Cosmos-Reason1，在物理世界推理中碾压 Qwen、GPT-4o 等多个 VLM 模型

英伟达 GTC 大会热度飙升。继黄仁勋在英伟达大会上发布基础世界模型 Cosmos 引发业内讨论后，英伟达团队近日又发布了一个新的物理世界大模型：Cosmos-Reason1。作为 Cosmos 系列的一个大模型，顾名思义，Cosmos-Reason1 更强调模型的“Reason”（即“推理”）能力。

3/28/2025 3:41:00 PM

郑佳美

三大模型巨头比拼思考“幻觉”：DeepSeek 不敌 ChatGPT，Gemini 用词最少

近日，智利大学 CIAE 教育研究所的研究员 Roberto Araya 进行了 4 组对照实验：提供相同的提示词，让 Gemini 2.0 Flash、ChatGPT o3-mini、DeepSeek R1 进行推理分析，研究三个模型在应对幻觉问题上的性能对比。其研究发现：ChatGPT 03-mini 在应对大模型幻觉问题上占有绝对优势，能够灵活切换不同的策略进行思考推理。相比之下，DeepSeek R1 和 Gemini 2.0 Flash 虽然能够尝试使用策略，但表现了出对这些策略的抗拒，且推理过程存在错误或混乱。

3/28/2025 3:37:00 PM

郑佳美

vivo 正式进军机器人领域，打造家庭智能助手

在科技发展的浪潮中，手机制造商 vivo 最近宣布将其业务扩展至机器人领域，令人瞩目。在博鳌亚洲论坛2025年年会上，vivo 的高管揭示了 “vivo 机器人实验室” 的成立，旨在研发家庭智能机器人，以适应不断变化的市场需求。 vivo 希望通过其在人工智能（AI）和影像技术方面的积累，结合自研的混合现实头显，构建机器人的 “眼睛” 和 “大脑”。

3/28/2025 2:20:00 PM

AI在线

微软向免费用户开放 Copilot Vision，测试显示 AI 网页助理仍未成熟

2025年3月28日消息，微软向美国免费用户开放Copilot Vision功能。但实测显示该功能有响应中断、交互受限等问题，像“半成品”，实用性低。#微软 #CopilotVision

3/28/2025 12:16:23 PM

故渊

一文读懂AI驱动的Data Agent

周末晚上，深夜11点，一位数据分析师还在办公室加班处理紧急的月度分析报告。面对复杂的数据库和繁琐的SQL查询，他挣扎了几个小时，不禁叹了口气："要是有个助手能理解我的问题，自动生成SQL查询，告诉我想要的答案就好了。 " 如今，这个愿望已经成为现实。

3/28/2025 11:47:38 AM

大数据AI智能圈

AI招聘迷局：当机器人既当裁判又当选手，人类如何突围？

一幅迷宫的概念图代表了求职招聘的流程。在迷宫中，代表AI的机器人阻挡着路径。这幅图还描绘了招聘人员争抢着走出迷宫，而迷宫的结构恰好形成了“AI”一词。

3/28/2025 11:41:33 AM

Taylor Telford

豆包测试新版深度思考功能，支持边想边搜

豆包悄悄将深度思考升级了。记者获悉，AI助手豆包近日测试新版“深度思考”功能。该功能将推理过程的思维链与搜索深度结合，支持“边想边搜”。

3/28/2025 11:11:00 AM