AI在线 AI在线

AI

专抓AI“看图说谎”,谷歌哥大用三类陷阱触发幻觉,打造可随技术发展动态演进的评估框架

幻觉(Hallucination),即生成事实错误或不一致的信息,已成为视觉-语言模型 (VLMs)可靠性面临的核心挑战。 随着VLMs在自动驾驶、医疗诊断等关键领域的广泛应用,幻觉问题因其潜在的重大后果而备受关注。 然而,当前针对幻觉问题的研究面临多重制约:图像数据集的有限性、缺乏针对多样化幻觉触发因素的综合评估体系,以及在复杂视觉问答任务中进行开放式评估的固有困难。
3/31/2025 7:40:00 AM
量子位

AI大模型看手相!图片视频加持深度思考,阿里QVQ-Max“神了神了”

阿里又发了个有意思的大模型——QVQ-Max,第一版视觉推理模型,对任意图像或视频都可以进行深度思考。 举个有趣的例子,上传一张你的手掌,再点击Thinking,QVQ-Max就可以给你看手相:可以看到,在深度思考过后,QVQ-Max就开始逐步分析手掌上的线条和其他特征。 包括心线、头线、生命线等主要线条的分析,以及戒指手指上的金戒指的象征意义。
3/31/2025 7:30:00 AM
量子位

1个实战案例搞懂AI大模型的"万能手"MCP协议,微软也下场了

最近爆火的 MCP(Model Context Protocol,模型上下文协议) 是 Anthropic 公司推出的一种开放协议。 目的是让 AI 智能体(如 Claude、ChatGPT 等) 能像“万能插座”一样,轻松连接各种外部工具和数据源,比如日历、数据库、邮件系统、代码编辑器等。 图片MCP 本质就是一个标准。
3/31/2025 4:00:00 AM
源码

Deepseek V3升级!更快、更准、更聪明!

前言大家好,我是林三心,用最通俗易懂的话讲最难的知识点是我的座右铭,基础是进阶的前提是我的初心~🎈 编程的兄弟们都知道,现阶段咱们的开发真的离不开 AI,尤其是碰到一些代码技术上的难题的时候,AI 简直是太好使了,以前咱们要花几个小时去网上查找资料,而现在通过 AI 给出答案,只需要几秒钟 ❗️❗️❗️但是,现在的AI界也是卷出了新的高度,从年前的DeepSeek到Manus每一次的话题都能引爆全网热议。 要问目前AI产品的顶流,问小白现在的发展势头非常迅猛,其凭借着速度快、稳定、方便上手使用、完全免费,受到广大用户好评! 我们可以在AI ChatBots发布的全球 AI 网站增长榜中清楚的看到,问小白正在以超高的增速杀入全球前三。
3/31/2025 3:33:00 AM

2025年值得关注的AI编码趋势:开发者工具

AI编码工具井喷! 开发者面临选择:增强现有IDE(VS Code GitHub Copilot),拥抱“智能IDE”(Cursor, Warp),或转向云原生IDE(Replit, Amazon CodeCatalyst)。 云原生工具如Cog, Modal简化AI开发。
3/31/2025 1:00:00 AM
岱军

DeepSeek V3来了 老外评测结果:很不错

近期,DeepSeek-V3-0324正式发布,迅速在全球AI领域引发热议。 相较于前作,V3版本虽未实现颠覆性创新,却在推理和编程两大关键领域取得进步,为用户带来新的惊喜。 DeepSeek向来秉持低调策略,在推出新版本时,既不发布白皮书进行详细阐述,也没有召开盛大发布会,仅将模型上传至Hugging Face平台。
3/31/2025 12:00:00 AM
小刀

父母用 AI 自行问诊险误孩子病情,汕头大学医学院第一附属医院提醒“用药诊断应遵循专业医生意见”

汕头大学医学院第一附属医院提醒,AI问诊仅供参考,不可盲目轻信。近期一位幼儿因父母轻信AI诊断,自行用药导致病情延误,最终发展为肺炎需住院治疗。#AI问诊# #医疗安全#
3/29/2025 4:54:20 PM
漾仔

马斯克重磅出击!xAI与X正式合并,AI帝国版图再扩张

全球科技巨头埃隆·马斯克今日通过旗下社交媒体平台X发布重磅消息,证实其人工智能初创公司xAI已与X完成合并。 本次交易采取全股票形式,使得xAI的估值飙升至 800 亿美元,远超X此前 330 亿美元的估值。 马斯克在X上发文,掷地有声地表示:“xAI和X的命运紧密相连。
3/29/2025 10:18:00 AM
AI在线

Al Agent 产品 Manus 公布收费方案:提供 39 美元和 199 美元两种套餐

AI Agent产品Manus公布收费方案,提供39美元和199美元两种套餐,标志着其从免费测试转向商业化运营。Manus号称“全球首款通用Agent产品”,能自主完成复杂任务。#AI助手 #Manus收费
3/28/2025 5:36:36 PM
远洋

九章云极DataCanvas与新加坡谷络吉签署战略合作备忘录,打造AI创新生态

2025年3月25日,九章云极DataCanvas与谷络吉公司KoolLogix在新加坡签署战略合作备忘录 (MoU)。 此次合作旨在依托新科研-谷络吉联合实验室的技术底座,结合九章云极DataCanvas在人工智能领域的行业积淀,共同推动AI技术在数据中心和IT运营中的创新应用。 九章云极国际业务负责人徐江博士出席签约仪式,联合实验室由C.K.
3/28/2025 5:08:00 PM
新闻助手

英伟达团队发布最新具身模型 Cosmos-Reason1,在物理世界推理中碾压 Qwen、GPT-4o 等多个 VLM 模型

英伟达 GTC 大会热度飙升。 继黄仁勋在英伟达大会上发布基础世界模型 Cosmos 引发业内讨论后,英伟达团队近日又发布了一个新的物理世界大模型:Cosmos-Reason1。 作为 Cosmos 系列的一个大模型,顾名思义,Cosmos-Reason1 更强调模型的“Reason”(即“推理”)能力。
3/28/2025 3:41:00 PM
郑佳美

三大模型巨头比拼思考“幻觉”:DeepSeek 不敌 ChatGPT,Gemini 用词最少

近日,智利大学 CIAE 教育研究所的研究员 Roberto Araya 进行了 4 组对照实验:提供相同的提示词,让 Gemini 2.0 Flash、ChatGPT o3-mini、DeepSeek R1 进行推理分析,研究三个模型在应对幻觉问题上的性能对比。 其研究发现:ChatGPT 03-mini 在应对大模型幻觉问题上占有绝对优势,能够灵活切换不同的策略进行思考推理。 相比之下,DeepSeek R1 和 Gemini 2.0 Flash 虽然能够尝试使用策略,但表现了出对这些策略的抗拒,且推理过程存在错误或混乱。
3/28/2025 3:37:00 PM
郑佳美

vivo 正式进军机器人领域,打造家庭智能助手

在科技发展的浪潮中,手机制造商 vivo 最近宣布将其业务扩展至机器人领域,令人瞩目。 在博鳌亚洲论坛2025年年会上,vivo 的高管揭示了 “vivo 机器人实验室” 的成立,旨在研发家庭智能机器人,以适应不断变化的市场需求。 vivo 希望通过其在人工智能(AI)和影像技术方面的积累,结合自研的混合现实头显,构建机器人的 “眼睛” 和 “大脑”。
3/28/2025 2:20:00 PM
AI在线

微软向免费用户开放 Copilot Vision,测试显示 AI 网页助理仍未成熟

2025年3月28日消息,微软向美国免费用户开放Copilot Vision功能。但实测显示该功能有响应中断、交互受限等问题,像“半成品”,实用性低。#微软 #CopilotVision
3/28/2025 12:16:23 PM
故渊

一文读懂AI驱动的Data Agent

周末晚上,深夜11点,一位数据分析师还在办公室加班处理紧急的月度分析报告。  面对复杂的数据库和繁琐的SQL查询,他挣扎了几个小时,不禁叹了口气:"要是有个助手能理解我的问题,自动生成SQL查询,告诉我想要的答案就好了。 " 如今,这个愿望已经成为现实。
3/28/2025 11:47:38 AM
大数据AI智能圈

AI招聘迷局:当机器人既当裁判又当选手,人类如何突围?

一幅迷宫的概念图代表了求职招聘的流程。 在迷宫中,代表AI的机器人阻挡着路径。 这幅图还描绘了招聘人员争抢着走出迷宫,而迷宫的结构恰好形成了“AI”一词。
3/28/2025 11:41:33 AM
Taylor Telford

豆包测试新版深度思考功能,支持边想边搜

豆包悄悄将深度思考升级了。 记者获悉,AI助手豆包近日测试新版“深度思考”功能。 该功能将推理过程的思维链与搜索深度结合,支持“边想边搜”。
3/28/2025 11:11:00 AM
新闻助手

AI算法 | SFT数据篇

1、SFT需要多少条数据SFT所需数据量一般任务:对于大多数常见的自然语言处理任务(如文本分类、情感分析、简单对话等),SFT的数据量通常在2k-10k之间。 这个范围的数据量既能保证模型学习到足够的领域知识,又不会因为数据量过大而导致训练成本过高。 复杂任务:对于复杂的任务,如数学推理、代码生成、多轮对话等,可能需要更多的数据来训练。
3/28/2025 11:10:44 AM
Goldma