AI
专抓AI“看图说谎”,谷歌哥大用三类陷阱触发幻觉,打造可随技术发展动态演进的评估框架
幻觉(Hallucination),即生成事实错误或不一致的信息,已成为视觉-语言模型 (VLMs)可靠性面临的核心挑战。 随着VLMs在自动驾驶、医疗诊断等关键领域的广泛应用,幻觉问题因其潜在的重大后果而备受关注。 然而,当前针对幻觉问题的研究面临多重制约:图像数据集的有限性、缺乏针对多样化幻觉触发因素的综合评估体系,以及在复杂视觉问答任务中进行开放式评估的固有困难。
3/31/2025 7:40:00 AM
量子位
AI大模型看手相!图片视频加持深度思考,阿里QVQ-Max“神了神了”
阿里又发了个有意思的大模型——QVQ-Max,第一版视觉推理模型,对任意图像或视频都可以进行深度思考。 举个有趣的例子,上传一张你的手掌,再点击Thinking,QVQ-Max就可以给你看手相:可以看到,在深度思考过后,QVQ-Max就开始逐步分析手掌上的线条和其他特征。 包括心线、头线、生命线等主要线条的分析,以及戒指手指上的金戒指的象征意义。
3/31/2025 7:30:00 AM
量子位
1个实战案例搞懂AI大模型的"万能手"MCP协议,微软也下场了
最近爆火的 MCP(Model Context Protocol,模型上下文协议) 是 Anthropic 公司推出的一种开放协议。 目的是让 AI 智能体(如 Claude、ChatGPT 等) 能像“万能插座”一样,轻松连接各种外部工具和数据源,比如日历、数据库、邮件系统、代码编辑器等。 图片MCP 本质就是一个标准。
3/31/2025 4:00:00 AM
源码
Deepseek V3升级!更快、更准、更聪明!
前言大家好,我是林三心,用最通俗易懂的话讲最难的知识点是我的座右铭,基础是进阶的前提是我的初心~🎈 编程的兄弟们都知道,现阶段咱们的开发真的离不开 AI,尤其是碰到一些代码技术上的难题的时候,AI 简直是太好使了,以前咱们要花几个小时去网上查找资料,而现在通过 AI 给出答案,只需要几秒钟 ❗️❗️❗️但是,现在的AI界也是卷出了新的高度,从年前的DeepSeek到Manus每一次的话题都能引爆全网热议。 要问目前AI产品的顶流,问小白现在的发展势头非常迅猛,其凭借着速度快、稳定、方便上手使用、完全免费,受到广大用户好评! 我们可以在AI ChatBots发布的全球 AI 网站增长榜中清楚的看到,问小白正在以超高的增速杀入全球前三。
3/31/2025 3:33:00 AM
2025年值得关注的AI编码趋势:开发者工具
AI编码工具井喷! 开发者面临选择:增强现有IDE(VS Code GitHub Copilot),拥抱“智能IDE”(Cursor, Warp),或转向云原生IDE(Replit, Amazon CodeCatalyst)。 云原生工具如Cog, Modal简化AI开发。
3/31/2025 1:00:00 AM
岱军
DeepSeek V3来了 老外评测结果:很不错
近期,DeepSeek-V3-0324正式发布,迅速在全球AI领域引发热议。 相较于前作,V3版本虽未实现颠覆性创新,却在推理和编程两大关键领域取得进步,为用户带来新的惊喜。 DeepSeek向来秉持低调策略,在推出新版本时,既不发布白皮书进行详细阐述,也没有召开盛大发布会,仅将模型上传至Hugging Face平台。
3/31/2025 12:00:00 AM
小刀
父母用 AI 自行问诊险误孩子病情,汕头大学医学院第一附属医院提醒“用药诊断应遵循专业医生意见”
汕头大学医学院第一附属医院提醒,AI问诊仅供参考,不可盲目轻信。近期一位幼儿因父母轻信AI诊断,自行用药导致病情延误,最终发展为肺炎需住院治疗。#AI问诊# #医疗安全#
3/29/2025 4:54:20 PM
漾仔
马斯克重磅出击!xAI与X正式合并,AI帝国版图再扩张
全球科技巨头埃隆·马斯克今日通过旗下社交媒体平台X发布重磅消息,证实其人工智能初创公司xAI已与X完成合并。 本次交易采取全股票形式,使得xAI的估值飙升至 800 亿美元,远超X此前 330 亿美元的估值。 马斯克在X上发文,掷地有声地表示:“xAI和X的命运紧密相连。
3/29/2025 10:18:00 AM
AI在线
Al Agent 产品 Manus 公布收费方案:提供 39 美元和 199 美元两种套餐
AI Agent产品Manus公布收费方案,提供39美元和199美元两种套餐,标志着其从免费测试转向商业化运营。Manus号称“全球首款通用Agent产品”,能自主完成复杂任务。#AI助手 #Manus收费
3/28/2025 5:36:36 PM
远洋
九章云极DataCanvas与新加坡谷络吉签署战略合作备忘录,打造AI创新生态
2025年3月25日,九章云极DataCanvas与谷络吉公司KoolLogix在新加坡签署战略合作备忘录 (MoU)。 此次合作旨在依托新科研-谷络吉联合实验室的技术底座,结合九章云极DataCanvas在人工智能领域的行业积淀,共同推动AI技术在数据中心和IT运营中的创新应用。 九章云极国际业务负责人徐江博士出席签约仪式,联合实验室由C.K.
3/28/2025 5:08:00 PM
新闻助手
英伟达团队发布最新具身模型 Cosmos-Reason1,在物理世界推理中碾压 Qwen、GPT-4o 等多个 VLM 模型
英伟达 GTC 大会热度飙升。 继黄仁勋在英伟达大会上发布基础世界模型 Cosmos 引发业内讨论后,英伟达团队近日又发布了一个新的物理世界大模型:Cosmos-Reason1。 作为 Cosmos 系列的一个大模型,顾名思义,Cosmos-Reason1 更强调模型的“Reason”(即“推理”)能力。
3/28/2025 3:41:00 PM
郑佳美
三大模型巨头比拼思考“幻觉”:DeepSeek 不敌 ChatGPT,Gemini 用词最少
近日,智利大学 CIAE 教育研究所的研究员 Roberto Araya 进行了 4 组对照实验:提供相同的提示词,让 Gemini 2.0 Flash、ChatGPT o3-mini、DeepSeek R1 进行推理分析,研究三个模型在应对幻觉问题上的性能对比。 其研究发现:ChatGPT 03-mini 在应对大模型幻觉问题上占有绝对优势,能够灵活切换不同的策略进行思考推理。 相比之下,DeepSeek R1 和 Gemini 2.0 Flash 虽然能够尝试使用策略,但表现了出对这些策略的抗拒,且推理过程存在错误或混乱。
3/28/2025 3:37:00 PM
郑佳美
vivo 正式进军机器人领域,打造家庭智能助手
在科技发展的浪潮中,手机制造商 vivo 最近宣布将其业务扩展至机器人领域,令人瞩目。 在博鳌亚洲论坛2025年年会上,vivo 的高管揭示了 “vivo 机器人实验室” 的成立,旨在研发家庭智能机器人,以适应不断变化的市场需求。 vivo 希望通过其在人工智能(AI)和影像技术方面的积累,结合自研的混合现实头显,构建机器人的 “眼睛” 和 “大脑”。
3/28/2025 2:20:00 PM
AI在线
微软向免费用户开放 Copilot Vision,测试显示 AI 网页助理仍未成熟
2025年3月28日消息,微软向美国免费用户开放Copilot Vision功能。但实测显示该功能有响应中断、交互受限等问题,像“半成品”,实用性低。#微软 #CopilotVision
3/28/2025 12:16:23 PM
故渊
一文读懂AI驱动的Data Agent
周末晚上,深夜11点,一位数据分析师还在办公室加班处理紧急的月度分析报告。 面对复杂的数据库和繁琐的SQL查询,他挣扎了几个小时,不禁叹了口气:"要是有个助手能理解我的问题,自动生成SQL查询,告诉我想要的答案就好了。 " 如今,这个愿望已经成为现实。
3/28/2025 11:47:38 AM
大数据AI智能圈
AI招聘迷局:当机器人既当裁判又当选手,人类如何突围?
一幅迷宫的概念图代表了求职招聘的流程。 在迷宫中,代表AI的机器人阻挡着路径。 这幅图还描绘了招聘人员争抢着走出迷宫,而迷宫的结构恰好形成了“AI”一词。
3/28/2025 11:41:33 AM
Taylor Telford
豆包测试新版深度思考功能,支持边想边搜
豆包悄悄将深度思考升级了。 记者获悉,AI助手豆包近日测试新版“深度思考”功能。 该功能将推理过程的思维链与搜索深度结合,支持“边想边搜”。
3/28/2025 11:11:00 AM
新闻助手
AI算法 | SFT数据篇
1、SFT需要多少条数据SFT所需数据量一般任务:对于大多数常见的自然语言处理任务(如文本分类、情感分析、简单对话等),SFT的数据量通常在2k-10k之间。 这个范围的数据量既能保证模型学习到足够的领域知识,又不会因为数据量过大而导致训练成本过高。 复杂任务:对于复杂的任务,如数学推理、代码生成、多轮对话等,可能需要更多的数据来训练。
3/28/2025 11:10:44 AM
Goldma
资讯热榜
标签云
人工智能
OpenAI
AIGC
AI
ChatGPT
DeepSeek
AI绘画
数据
机器人
谷歌
模型
大模型
Midjourney
智能
用户
学习
开源
GPT
微软
Meta
AI创作
图像
技术
论文
Stable Diffusion
马斯克
Gemini
算法
蛋白质
生成式
芯片
代码
英伟达
腾讯
神经网络
计算
研究
Sora
AI for Science
3D
Anthropic
AI设计
机器学习
GPU
开发者
场景
华为
预测
伟达
Transformer
百度
人形机器人
苹果
深度学习
AI视频
模态
字节跳动
xAI
驾驶
文本
搜索
大语言模型
Claude
Copilot
具身智能
神器推荐
LLaMA
算力
安全
应用
视频生成
科技
视觉
亚马逊
干货合集
2024
AGI
特斯拉
训练
大型语言模型