AI

对 ChatGPT 说“谢谢”，竟给 OpenAI 带来“数千万美元”开销

OpenAI CEO透露，仅仅是用户与AI进行的日常寒暄和礼貌性交流，例如“谢谢”和“请”等，就给公司带来了“数千万美元”的开销。#AI成本# #人机互动#

4/20/2025 11:36:07 AM

远洋

湖北武汉警方查处一起利用 AI 编造网络谣言案件，涉事公司被行政警告

武汉警方查处一起利用AI技术编造网络谣言的案件。涉事公司为提高网站流量，使用AI智能写作软件自动生成不实文章，未履行审核责任被行政警告。目前公司已公开致歉并整改。#AI监管##网络谣言#

4/20/2025 7:39:35 AM

漾仔

字节 Seedream 3.0 登场：文生图跑分超 GPT-4o，生成 1K 图像仅需约 3 秒

字节跳动最新推出全新文本生成图像模型 Seedream 3.0，其性能在内部和外部评测中均表现出色，超越前代 Seedream 2.0，并与 GPT-4o、Midjourney v6.1 和 Imagen 3 等主流系统一较高下。

4/19/2025 2:55:28 PM

故渊

AI 竞赛压力山大：Meta 被曝资金缺口，向微软、亚马逊求援

科技媒体 The Information 昨日（4 月 18 日）发布博文，报道称 Meta Platforms 在 AI 竞赛中面临巨大成本压力，去年曾向微软、亚马逊等竞争对手寻求资金支持，用于训练其旗舰大语言模型 Llama。

4/19/2025 10:07:45 AM

故渊

27B 显存需求 54 → 14.1GB：谷歌发布 Gemma 3 QAT AI 模型，RTX 3090 显卡可运行

以 int4 量化为例，Gemma 3 27B 显存需求从 54GB 锐减至 14.1GB，Gemma 3 12B 则从 24GB 降至 6.6GB；Gemma 3 1B 仅需 0.5GB 显存。

4/19/2025 9:52:27 AM

故渊

微软推动 AI 互操作性，发布两大 MCP 服务器

Azure MCP Server为多种Azure资源提供通用访问支持，而Azure Database for PostgreSQL Flexible Server专用服务器则专注于数据库操作。这两个服务器均基于开放的MCP标准，简化开发流程，减少为不同数据源定制连接器的需求。

4/19/2025 9:16:15 AM

故渊

谷歌 Gemini 2.5 Flash 混合推理 AI 模型上线：性能成本双优

谷歌公司昨日（4 月 17 日）发布公告，宣布在 Google AI Studio 和 Vertex AI 中，以 Gemini API 的方式推出 Gemini 2.5 Flash Preview 预览 AI 模型。

4/18/2025 2:59:20 PM

故渊

AI 基准测试平台 Chatbot Arena 成立一家新公司

在 AI 行业快速发展的背景下，Chatbot Arena 这个众包 AI 基准测试项目正在扩展其影响力，正式成立了一家名为 Arena Intelligence Inc. 的新公司。根据彭博社的报道，Chatbot Arena 旨在通过这家新公司获取更多资源，从而显著改善其平台的功能和服务。

4/18/2025 12:02:40 PM

AI在线

METR 实测：OpenAI o3 AI 推理模型有“作弊”倾向以提升分数

风险测试机构“机器智能测试风险”（METR）昨日（4 月 17 日）发布报告，与 OpenAI 合作测试其 o3 模型时发现，该模型展现出更强的“作弊”或“黑客行为”倾向，试图通过操控任务评分系统提升成绩。

4/18/2025 11:16:39 AM

故渊

谷歌大模型“性价比之王”来了！混合推理模型，思考深度可自由控制，竞技场排名仅次于自家Pro

紧跟o4-mini，谷歌上新了Gemini 2.5 Flash preview版本。作为更注重效率的Flash，在大模型竞技场上排名并列第二，第一是自家的Gemini 2.5 Pro。这样的表现，让Gemini 2.5 Flash的性价比直接拉满。

4/18/2025 10:43:23 AM

最新万字长文！强化学习之父联合谷歌RL副总裁：未来不是靠强化学习算法而是「经验流」

就像Sam Altman 之前在博客文章中写的那样：回顾人工智能的发展，深度学习确实奏效了！现在强化学习正如火如荼，OpenAI o系列，DeepSeek R0都显示出了强化学习的巨大威力，人类生成的数据推动了人工智能的惊人进步，但接下来会发生什么？谷歌强化学习副总裁 David Silver与图灵奖获得者，强化学习之父Richard Sutton最新论文《Welcome to the Era of Experience》犹如《TheBitterLesson（苦涩的教训）》的续章给我们当头一棒：人类数据正在见顶，经验是下一个超级数据源，真正能推动AI跃升的数据，必须随模型变强而自动增长。

4/18/2025 10:01:41 AM

AI寒武纪

亚洲崛起：DeepSeek、巨额投资与数据中心助力 AI 竞争力

在今年的达沃斯世界经济论坛上，众多商界和政界领袖齐聚一堂，普遍认为美国科技巨头在人工智能（AI）领域占据主导地位，而中国乃至整个亚洲似乎都在这一赛道上滞后。然而，在与会者离开后，这种看法开始遭遇挑战。首先，来自中国的一家名不见经传的对冲基金 —— 深度寻求（DeepSeek）在这一时刻引发了全球的注意。

4/18/2025 10:01:28 AM

AI在线

AI 应用安全挑战与测评实践指南

作者 | 陈达在人工智能蓬勃发展的时代，AI应用广泛融入人们的生活与工作，从智能客服到智能推荐系统，从医疗影像诊断到金融风险预测，AI的身影无处不在。然而，随着AI应用的普及，其潜在风险也逐渐凸显，AI风险测评成为保障应用可信的关键环节。本文将围绕“AI风险测评助力应用可信”这一主题，深入探讨AI应用面临的风险、业界测评方法、实践思路及关键要点。

4/18/2025 9:45:47 AM

Thoughtworks洞见

最强o1也刚刚及格！中科大等团队测试视频CoT推理能力：多数模型不及格

视频理解的CoT推理能力，怎么评？中科大等团队提出了评估基准——VCR-Bench，里面包含七个独立评估维度的任务框架，每个维度针对性地考察模型的不同能力（如时空推理、因果推断等）。为确保评估的全面性和可靠性，每个维度都设计了100余条高质量样本。

4/18/2025 9:13:00 AM

量子位

异议！顶流AI决战「逆转裁判」：o1险胜Gemini 2.5登顶、Llama 4零分垫底

当谈到AI为何能从「预测下一个词」中诞生智慧时，Ilya Sutskever曾用一个生动的比喻来解释。想象你在读一本悬疑小说，如果仅凭前面的线索就能在最后一页推断出罪犯是谁，那么你对这个故事的理解无疑是深刻的。同样，AI通过学习海量文本，掌握了从字面到语义的「线索」，展现出惊人的智能。

4/18/2025 9:07:00 AM

新智元

微软 BitNet b1.58 2B4T 登场：内存占用仅 0.4GB，20 亿参数模型颠覆 AI 计算

微软研究团队推出了一款开源大型语言模型 BitNet b1.58 2B4T，区别于传统训练后量化的方式，这款拥有 20 亿参数的大型语言模型（LLM）以 1.58 位低精度架构原生训练而成。

4/18/2025 8:54:22 AM

故渊

UC伯克利：让推理模型少思考，准确率反而更高了！

让推理模型不要思考，得到的结果反而更准确？ UC伯克利新研究发现，强制要求模型跳过思考过程，推理能力却比正常思考还好。例如在定理证明任务当中，“不思考”模式仅使用30%的Token，就能实现和完整思考一样的准确率。

4/18/2025 8:42:52 AM

量子位

自主式AI对安全专家来说既是福音也是祸患

网络安全在自主式AI面前站在了一个十字路口，我们从未拥有过如此强大的工具，它可以在眨眼之间创建大量的代码，发现并解除威胁，并且可以被如此果断且防御性地使用，这已经被证明是一个巨大的力量倍增器和生产力红利。但虽然功能强大，自主式AI却并不可靠，这就是目前的困境。所创建的代码可能包含微妙的缺陷，并且最终可能会弊大于利，比如通过助长网络钓鱼诱饵和构建新型恶意软件。

4/18/2025 12:10:00 AM

David Strom

资讯热榜

上海AI实验室开源InternVL3系列多模态大型语言模型 Haisnap横空出世，小白用户也能轻松打造AI应用「交交」媲美GPT-4o！上海交大推出口语对话情感大模型，首个纯学术界自研！ OpenAI开源超Agent:Codex CLI,五小时内破 5000 颗星 ChatGPT重磅更新：新增图像库功能，可查看自己用GPT生成的所有图片本地部署DeepSeek+DiFy平台构建智能体应用 kimi开源视觉语言模型 Kimi-VL 与 Kimi-VL-Thinking，多项基准超越 GPT-4o OpenAI 发布“智能体构建实战指南”实用性文档（附文档资源）

标签云

人工智能 OpenAI AIGC AI ChatGPT DeepSeek AI绘画数据机器人谷歌模型大模型 Midjourney 智能用户学习开源 GPT 微软 Meta AI创作图像技术论文 Stable Diffusion 马斯克 Gemini 算法蛋白质生成式芯片代码英伟达腾讯神经网络计算研究 Sora AI for Science 3D Anthropic AI设计机器学习 GPU 开发者场景华为预测伟达 Transformer 百度人形机器人苹果深度学习 AI视频模态字节跳动 xAI 驾驶文本搜索大语言模型 Claude Copilot 具身智能神器推荐 LLaMA 算力安全应用视频生成科技视觉亚马逊干货合集 2024 AGI 特斯拉大型语言模型训练