AI

多模态AI核心技术：CLIP与SigLIP技术原理与应用进展

近年来，人工智能领域在多模态表示学习方面取得了显著进展，这类模型通过统一框架理解并整合不同数据类型间的语义信息，特别是图像与文本之间的关联性。在此领域具有里程碑意义的模型包括OpenAI提出的CLIP（Contrastive Language-Image Pre-training，对比语言-图像预训练）和Google研发的SigLIP（Sigmoid Loss for Language-Image Pre-training，用于语言-图像预训练的Sigmoid损失）。这些模型重新定义了计算机视觉与自然语言处理的交互范式，实现了从图像分类到零样本学习等多种高级应用能力。

4/3/2025 7:00:00 AM

美国奥数题撕碎AI数学神话，顶级模型现场翻车！最高得分5%，DeepSeek唯一逆袭

3月26号，ETH等团队的一项研究一经发布，就引起了圈内热议。这项研究彻底撕开遮羞布，直接击碎了「LLM会做数学题」这个神话！论文地址：，MathArena团队使用最近的2025年美国数学奥林匹克竞赛进行了详细评估，结果令人大吃一惊——所有大模型的得分，都低于5%！

4/3/2025 2:25:00 AM

新智元

基于DeepSeek + VSCode 实现AI辅助编程

随着人工智能技术的飞速发展，AI 辅助编程逐渐成为提升开发效率、优化代码质量的重要工具。本文通过结合 DeepSeek 的强大语言模型和 VSCode 的高效开发环境，展示了如何利用 AI 辅助编程完成一个经典的 MapReduce 词频统计任务。这一实践不仅展示了 AI 在编程中的应用潜力，还为开发者提供了一个高效、便捷的开发流程示例，帮助读者快速上手 AI 辅助编程，并探索其在实际项目中的应用价值。

4/3/2025 12:00:01 AM

加州大学研究：AI 模型 GPT - 4.5 和 Llama 3.1 - 405B 可通过标准图灵测试

美国加州大学圣地亚哥分校研究显示，GPT-4.5和Llama 3.1-405B在PERSONA模式下通过三方图灵测试，提问者难以区分AI与人类。AI有望在社交场景中替代人类。#人工智能##图灵测试#

4/2/2025 3:20:23 PM

远洋

两位华人76页论文解决量子领域核心问题：首次证明伪随机性真实存在

量子领域的一个核心开放问题，就这样被两位华人研究员解决了？事情是这样的。一直以来，量子的随机性在计算和密码学中极为有用。

4/2/2025 9:40:00 AM

量子位

DeepSeek-V3击败R1开源登顶！杭州黑马撼动硅谷AI霸主，抹去1万亿市值神话

DeepSeek依然很能打，春节余波还在扩散！据AI产品分析平台aitools.xyz统计，DeepSeek每月新增网站访问量超过了ChatGPT。作为异军突起的现象级产品，DeepSeek的增长速度除了创造AI产品的增长奇迹，更是重新定义了全球的AI竞赛格局。

4/2/2025 9:21:00 AM

新智元

Vibe Agent: Token成本直降90%，会对话就能创造专属本地Agent

刚刚，Local AI 领域的 Libra 团队发布了一段最新技术演示视频，展示了用户通过自然语言交互直接生成 Agent，并利用本地消费级算力支持 Agent 进行长程 (Long-Horizon) 推理，最终完成复杂任务。 Libra 构建的本地化、即时响应、自我规划方案为行业开辟了一条全新的长程推理 Agent 技术路径，实现了从手工 Agent 设计向端到端 In-Context Vibe Agent 生成范式演进。从官网信息来看，Libra 的技术方案直接回应了制约 Agent 技术普及的两大关键瓶颈：一方面，当前热门 Agent 产品如 Cursor、Devin、Manus 等虽功能强大，但运行成本高昂 —— 专业评测显示单次使用 Manus 可消耗约 1000k Token（起步 2 美元）。

4/2/2025 9:19:00 AM

机器之心

孙正义豪掷1万亿，机器人帝国崛起！总额远超星际之门，劳动力末日翻盘

报道称，在「星际之门」放血5000亿后，软银又拿着1万亿砸向机器人！孙正义将在美国各地创建配备AI工厂的工业园区，用人形机器人助力制造业解决劳动力短缺难题。机器人军团领衔，AI工厂重定义制造业在软银的宏伟蓝图中，AI工厂成为核心。

4/2/2025 9:15:00 AM

新智元

吉卜力太火，奥特曼求饶！GPT-4o免费生图登王座，设计师直呼天塌了

OpenAI再次火爆全网，而且接近一周了，GPT-4o带来的热潮还未停歇。现在免费用户也可以使用生图功能了，更多人涌进了GPT-4o。显然，靠吉卜力图像形成的病毒式传播，让奥特曼和整个OpenAI团队都没想到。

4/2/2025 9:10:00 AM

新智元

超低成本复现QwQ！数学推理模型训练迎来RL暴击，数据代码模型全开源 | 蚂蚁&清华出品

用上这个开源框架，2天时间就能刷新7B数学推理纪录！蚂蚁清华联手开源的强化学习框架AReaL-boba，直接把推理模型训练带到了Next Level——训练成本下降的同时，训练速率、推理能力还大幅提升的那种。除了前面提到的7B模型，在32B模型上，只需两百美元、200条数据，就可以轻松复现QwQ-32B，就是数学推理能力媲美DeepSeek-R1，一战封神的那个。

4/2/2025 9:00:00 AM

量子位

DeepSeek R1本地训练全流程实操指南，手把手教你打通其“任督二脉”

作者 | asher许多关于 DeepSeek R1 的复现文章，主要聚焦在“rewards的设计、训练指标的变化、benchmark测评”这些内容，但是对于“本地训练”这个开启深度探索的关键前置步骤，却很少有人深挖。可能有人觉得，照着readme操作就能轻松训练了吧？太天真啦！

4/2/2025 9:00:00 AM

腾讯技术工程

人工智能应用就是大模型能力+场景，基于大模型构建应用，首先要了解大模型的能力圈

在关于大模型应用方面，虽然也了解和应用过其中的一些技术；但经过这段时间的实践和思考发现，对大模型应用的认识还很浅显，因此在此记录一下自己的思考。大模型应用的思考大模型作为人工智能应用的底座技术，所有应用场景和技术都是构建在大模型之上；但很多时候我们都搞错了一件事，那就是我们没有搞清楚大模型能力和其它技术的关联和区别。因此，在这里我们要搞清楚一个概念，那就是大模型能力；所谓大模型的能力，就是模型开发人员怎么把模型做的更好更强，其中设计到模型的设计，训练等；具体有神经网络架构，模型蒸馏等等。

4/2/2025 8:40:00 AM

DFires

AI在主数据中的十大应用|用例和优势

一概述在当今数字化环境中，企业面临的挑战不仅包括管理海量数据，还包括处理各种复杂数据，尤其是来自物联网 (IoT) 设备和联网技术等新兴来源的数据。云技术的重大转变使这一情况更加复杂，促使企业不再仅仅采购基础设施，而是更加战略性地利用技术和服务，以最大限度地提高数据资产价值。 “数据敏捷性”概念应运而生，成为应对这种情况的关键。

4/2/2025 8:00:00 AM

晓晓

如何识别和预防深度伪造诈骗

这些被篡改的内容在社交媒体、即时通讯应用和视频分享平台上广泛传播，模糊了现实与虚构之间的界限。 “Deepfake”一词是在2017年由一位Reddit用户创造的，当时该用户创建了一个以此命名的子论坛(subreddit)。这个子论坛被用来分享AI生成的视频，其中经常包含名人换脸的色情内容。

4/2/2025 7:30:00 AM

Sinisa

随着OpenAI每小时新增一百万用户，企业AI主导地位的竞争进入新阶段

这一里程碑式的投资凸显了AI日益上升的重要性，也标志着企业技术格局的转变。有了如此庞大的资金储备，OpenAI在与谷歌、AWS等巨头的较量中，将有更强的持久力，在与合作伙伴微软的敏感关系中也将拥有更大的筹码，更不用说还有资金与Anthropic和马斯克创办的新公司xAI等强劲对手抗衡。在这轮融资结束之前，OpenAI是否有资金继续在顶级行列中竞争，仍是个未知数。

4/2/2025 7:00:00 AM

Matt Marshall

深度解析 MCP 与 AI 工具的未来

自 2023 年 OpenAI 发布函数调用功能以来，我一直在思考如何构建一个智能体与工具协同的生态系统。随着基础模型的智能化程度提升，智能体与外部工具、数据和 API 的交互能力变得日益碎片化：开发者需要为每个集成系统单独实现包含特定业务逻辑的智能体。显然，我们需要一个执行、数据获取和工具调用的标准接口。

4/2/2025 3:55:00 AM

MCP