AI

微软 50 周年现神操作：AI 主持人幽默调侃三任 CEO

微软现任首席执行官（CEO）萨提亚・纳德拉（Satya Nadella）昨日（4 月 4 日）通过官方 X 账号，发布一段 Copilot AI 采访微软三任 CEO 的趣味视频。Copilot 以幽默方式“吐槽”了鲍尔默的热情、盖茨的思考表情和纳德拉对 AI 的痴迷。

4/5/2025 12:25:18 AM

故渊

谷歌拉响通用人工智能警报，首次公开 AI 安全防御蓝图

DeepMind 认为 AGI 即将落地，主张立即行动。AGI 可能将在未来数年实现人类级认知能力，其自主决策特性可能加速医疗、教育等领域的突破，但滥用、目标错位等风险亦需警惕。

4/4/2025 10:25:49 AM

故渊

Claude 3.5首战复现21%顶会论文，人类博士无法取代！OpenAI：AI全是草台班子

AI智能体，能否复现顶会中重磅的AI研究？今天，OpenAI团队发布了全新框架PaperBench，便可评估AI智能体复现顶尖研究的基础能力。论文地址：，AI智能体需从0开始复现20篇ICML 2024 Spotlight和Oral论文，包括理解论文核心文献、开发可运行代码库，以及执行实验并验证结果。

4/4/2025 12:00:00 AM

新智元

人类赢了！OpenAI深夜开源全新Agent评测基准!AI大战顶尖人类，上演机器学习届“神仙打架”；R1排第三，Claude夺冠

编辑 | 李美涵出品 | 51CTO技术栈（微信号：blog51cto）深夜，OpenAI再次发力Agent领域，开源了一个全新的AI Agent评测基准—— PaperBench。这是一个用于评估 AI 智能体复现最前沿 AI 研究能力的基准测试。智能体需从零开始复现 20 篇 ICML 2024 Spotlight 和 Oral 论文，包括理解论文贡献、构建代码库并成功执行实验。

4/3/2025 1:35:49 PM

李美涵

Dify+大模型：重构企业基因的“数智引擎”——解锁AI工业化落地新范式

当AI开发进入“流水线时代”2025年，全球企业AI应用开发呈现“冰火两重天”：一边是OpenAI、DeepSeek等大模型参数突破百万亿级，另一边却是78%的企业困在“PPT智能”阶段——AI应用开发周期长、场景碎片化、数据孤岛难破。 Dify与大模型的结合，正在打破这一僵局。它不仅是工具，更是企业AI能力工业化的流水线，让大模型从“技术狂欢”走向“价值落地”。

4/3/2025 1:07:50 PM

推推君

让AI替码农卷复杂任务，贾佳亚团队提出MoTCoder，准确率刷新SOTA

论文一作李靖瑶，香港中文大学博士生（DV Lab），师从贾佳亚教授。主要研究方向是大语言模型，包括模型预训练、后训练、推理优化。作者陈鹏光、夏彬等均为 DV Lab 成员。

4/3/2025 11:16:10 AM

机器之心

视觉SSL终于追上了CLIP！Yann LeCun、谢赛宁等新作，逆转VQA任务固有认知

在视觉问题解答（VQA）等多模态环境中，当前视觉自监督学习（SSL）的表现还比不上语言图像预训练（CLIP）。这种差距通常归因于语言监督引入的语义，尽管视觉 SSL 模型和 CLIP 模型通常在不同的数据上进行训练。在最近的一项研究中，Yann LeCun、谢赛宁等研究者探讨了一个基本问题：语言监督对于多模态建模的视觉表征预训练是否必要？

4/3/2025 11:11:50 AM

机器之心

为什么AI需要向量数据库？

大模型火遍全球，DeepSeek、OpenAI、谷歌、百度、抖音等科技巨头争相发布自家产品。多数人会想当然认为，大模型越大越强大，参数量越多就越聪明。现实呢？

4/3/2025 11:04:40 AM

DeepMind核心论文禁发6个月，Transformer级研究锁死！CEO：不满意就走人

DeepMind研究成果，已被按下暂停键。 FT爆料称，由Demis Hassabis领导的谷歌AI部门，正对研究论文发布实施更严格的审查机制。总结来说，有这么几种论文不发：会被竞争对手利用的创新成果让Gemini模型相形见绌的研究而那些涉及到GenAI的「战略性研究」，更是有着长达6个月「禁发期」。

4/3/2025 10:03:29 AM

新智元

75年后，图灵测试终被GPT-4.5破解！73%人类被骗过，彻底输给AI

什么？ AI竟然通过了标准的三方图灵测试，而且还是拿出了实打实证据的那种！来自加州大学圣迭戈分校的研究人员系统评估了4个AI系统，证明大语言模型（LLM）通过了图灵测试。

4/3/2025 10:00:52 AM

新智元

企业级AI“脱虚向实”，落地还有几道槛？

从ChatGPT横空出世，到越来越智能化的人形机器人，再到让世人惊艳的Sora文生视频……种种迹象表明，人工智能逐渐迎来产业化的临界点。当全球科技巨头们将AI的边界推向星辰大海时，绝大多数企业仍在经历着AI落地的“高原反应”。某制造业CIO的办公桌上，堆积着三份不同供应商的AI解决方案，却始终无法解答他“如何让AI看懂三十年陈旧的ERP数据”的灵魂拷问。

4/3/2025 10:00:00 AM

科技云报到

稚晖君刚挖来的90后机器人大牛：逆袭履历堪比爽文男主

刚刚，稚晖君旗下创企智元机器人官宣了两个新动向——一则是关于人事变动。具身智能领域的国际领军学者罗剑岚博士，已于近日加盟并出任首席科学家。罗剑岚在该领域已深耕10年，曾担任Google X、Google DeepMind研究科学家，是UC伯克利17万引大佬Sergey Levine团队的核心成员。

4/3/2025 9:37:23 AM

量子位

AI理解27分钟长视频超越GPT-4o，港理工新国立开源新框架：角色化推理+链式LoRA

AI能像人类一样理解长视频。港理工、新加坡国立团队推出VideoMind框架，核心创新在于角色化推理（Role-based Reasoning）和链式LoRA（Chain-of-LoRA）策略。相关论文已上传arXiv，代码和数据全部开源。

4/3/2025 9:34:36 AM

量子位

震惊！用 Redis+AI 模型实现秒级实时风控，这波操作太秀了

兄弟们，有没有遇到过这种情况：凌晨三点在某东抢购显卡，刚提交订单就提示"系统繁忙"，转头发现黄牛已经在海鲜市场挂出同款；扫码支付时突然弹出风险提示，非要验证人脸识别；更绝的是某银行APP，刚输完密码就收到短信提醒："检测到您的账户存在异常操作"——但此时您根本没动过手机。这些让人又爱又恨的操作背后，都藏着一个叫"实时风控"的技术妖怪。今天咱们就来扒一扒，这个妖怪是如何用 Redis 和 AI 模型在 0.1 秒内完成逆天操作的。

4/3/2025 9:30:56 AM

儒猿团队

双人动作生成新SOTA！浙大提出TIMotion框架 | CVPR 2025

双人动作生成新SOTA！针对Human-human motion generation问题，浙江大学提出了一种对双人运动序列进行时序和因果建模的架构TIMotion，论文已发表于CVPR 2025。具体来说，通过分别利用运动序列时间上的因果关系和两人交互过程中的主动被动关系，TIMotion设计了两种有效的序列建模方式。

4/3/2025 9:27:44 AM

量子位

CVPR 2025：单图秒变专业影棚，几何/材质/光影全搞定，数据训练代码全开源

如何从一张普通的单幅图像准确估计物体的三维法线和材质属性，是计算机视觉与图形学领域长期关注的难题。这种单图逆渲染任务存在严重的不确定性，传统方法通常需要多角度或多光源的拍摄条件，难以在日常场景中普遍应用。近日，由香港中文大学、上海人工智能实验室及南洋理工大学的研究团队联合研发的论文《Neural LightRig: Unlocking Accurate Object Normal and Material Estimation with Multi-Light Diffusion》。

4/3/2025 9:25:53 AM

量子位

AI 时代如何更高效开发前端组件？21st.dev 给了一种答案

给大家推荐一个好东西：21st.dev ，大致上你可以将它理解为一个非常前卫的组件托管市场，特别之处在于：它参考 shadcn/ui 的设计理念提供了一种原子化的，Code Out 形式的依赖安装、管理模式；并且更具有启发性的，它为每一个组件都提供了一套用于生成组件代码的 Prompt，用户可以借此在特定项目上下文中生成适配度更高的组件效果。借助 21st.dev 与 cursor，我做了这样一个 demo：这一切都是在 5min 内，不写一行代码的情况下实现的！更值得称谓的是，21st.dev 的功能设计真正做到了 AI 友好，能够很好地应用在各类 AI 工具中(cursor、v0.dev、bolt.new、cline 等等)，并且这套设计逻辑还非常适合复用到各种 TO-D 场景中，21st.dev 是什么21st.dev 是一个开源的 React UI 组件市场，专门为设计工程师和前端开发者提供高质量的 UI 组件。

4/3/2025 9:04:19 AM

范文杰

美国CS专业卷上天，满分学霸惨遭藤校全拒！父亲大受震撼引爆热议

美国大学CS专业，卷到何种程度了？最近，一位父亲痛心发帖：他的儿子成绩全校第一近乎完美——SAT接近满分、18门AP课程全部5分，却在申请季被所有常春藤名校拒绝。唯一伸来橄榄枝的，只有本州的马萨诸塞大学阿默斯特分校（UMass Amherst）。

4/3/2025 8:50:00 AM

新智元

资讯热榜

上海AI实验室开源InternVL3系列多模态大型语言模型 Haisnap横空出世，小白用户也能轻松打造AI应用「交交」媲美GPT-4o！上海交大推出口语对话情感大模型，首个纯学术界自研！ OpenAI开源超Agent:Codex CLI,五小时内破 5000 颗星 ChatGPT重磅更新：新增图像库功能，可查看自己用GPT生成的所有图片本地部署DeepSeek+DiFy平台构建智能体应用 OPPO 小布助手网页版上线，接入满血版 DeepSeek kimi开源视觉语言模型 Kimi-VL 与 Kimi-VL-Thinking，多项基准超越 GPT-4o

标签云

人工智能 OpenAI AIGC AI ChatGPT DeepSeek AI绘画数据机器人谷歌模型大模型 Midjourney 智能用户学习开源 GPT 微软 Meta AI创作图像技术论文 Stable Diffusion 马斯克 Gemini 算法蛋白质生成式芯片代码英伟达腾讯神经网络计算研究 Sora AI for Science 3D Anthropic AI设计机器学习 GPU 开发者场景华为预测伟达 Transformer 百度苹果人形机器人深度学习 AI视频模态 xAI 驾驶字节跳动文本搜索大语言模型 Claude Copilot 具身智能神器推荐 LLaMA 算力安全应用视频生成科技视觉亚马逊干货合集 2024 AGI 特斯拉训练大型语言模型