AI

藏在国民APP里的黑科技：美图CVPR 2025五大新突破！

2025年，计算机视觉领域三大顶级会议之一的CVPR（国际计算机视觉与模式识别会议）投稿量再次刷新纪录，超过13000篇工作进入评审流程，录用比例仅为22.1%，相较去年再次下降1.5%。美图旗下美图影像研究院（MT Lab）联合清华大学、新加坡国立大学、北京理工大学、北京交通大学等知名高校发布的5篇论文入选CVPR 2025，均聚焦于图像编辑领域，分布在生成式AI、交互式分割、3D重建三个方面。在研发方面的突破代表美图在核心视觉领域竞争力的持续提升，AI助推下美图产品力持续提升，也带动了更高的用户粘性和付费意愿，深度结合前沿技术与探索可落地的实用价值，成为美图成功在影像与设计领域打造AI产品的重要驱动力。

3/27/2025 3:09:00 PM

新闻助手

Claude 3.7 Sonnet AI 被曝将祭出上下文窗口 50 万 tokens 杀手锏

科技媒体 testingcatalog 昨日（3 月 26 日）发布博文，报道称 AI 公司 Anthropic 正计划“扩容”Claude 3.7 Sonnet 模型，将其上下文窗口将从 20 万 token 跃升至 50 万 token，将刷新行业新纪录。

3/27/2025 1:43:39 PM

故渊

7B模型搞定AI视频通话，阿里最新开源炸场，看听说写全模态打通，开发者企业免费商用

深夜重磅！阿里发布并开源首个端到端全模态大模型——通义千问Qwen2.5-Omni-7B，来了。仅靠一个一体式模型，就能搞定文本、音频、图像、视频全模态，并实时生成文本和自然语音。

3/27/2025 1:23:39 PM

量子位

2025苹果AI学者名单公布，黄子琪、孔令东、北大吉嘉铭、清华顾煜贤等12位年轻华人入选

刚刚，苹果机器学习研究中心（Apple Machine Learning Research）正式公布了 2025 年 AI（人工智能）、ML（机器学习）领域获得博士生奖学金的「苹果学者」名单。今年共有 21 位年轻学者获得了苹果学者计划的资助，华人占了一半多。苹果博士奖学金旨在奖励和支持计算机科学与工程领域极具潜力的博士研究生开展研究，每年颁发一次，今年已是第六年。

3/27/2025 1:02:21 PM

机器之心

AI Infra的起飞前夜，跟两位创业者聊了两小时，从DeepSeek的中国朋友圈，到AI基建演进的价值铁律：流量重赏下的勇夫

作者 | 云昭嘉宾 | 黄新平、谭中意出品 | 51CTO技术栈（微信号：blog51cto）“人生不无聊，有太多变化，太多好玩的事情发生。 ”的确，近期围绕DeepSeek的新发布实在太多了，乱花渐欲迷人眼。从春节期间企业抢先宣布接入DeepSeekR1、继而接入满血版R1，到DeepSeek一体机的出圈，再到国民应用微信的接入，潮潮迭起。

3/27/2025 12:15:44 PM

云昭

纯RGB输入，解决户外场景SLAM！误差降低至9.8%，港科广开源 | ICRA 2025

在自主驾驶、机器人导航、AR/VR等前沿应用中，Simultaneous Localization and Mapping (SLAM) 是核心技术之一。现有基于3D高斯分布（3DGS）的SLAM方法虽在室内场景表现出色，但使用仅RGB输入来处理无界的户外场景仍然面临挑战：准确的深度和尺度估计困难，这影响了姿态精度和3DGS初始化图像重叠有限且视角单一，缺乏有效的约束，导致训练难以收敛为了解决上述挑战，港科广团队提出全新解决方案OpenGS-SLAM，仅凭RGB图像实现高精度定位与逼真场景重建。论文链接：：：，该方法采用了一个点图回归网络来生成帧间一致的点图，储存了来自多个标准视角的3D结构，包含了视角关系、2D到3D的对应关系和场景几何信息，使得相机位姿估计更加稳健，有效缓解了预训练深度网络的误差问题。

3/27/2025 10:54:06 AM

新智元

揭秘MCP：AI大模型的万能接口，开启智能新时代

在人工智能的世界里，最近有个新名字频频被提起：MCP（模型上下文协议，Model Context Protocol）。这个由Anthropic在2024年11月推出的开放标准，正悄然改变着大型语言模型的玩法。它就像一座桥梁，把那些被困在“信息孤岛”里的AI模型和外部世界连接起来，让它们不再只是会聊天，而是能真正干实事。

3/27/2025 10:15:39 AM

AI 文生图新王者：Reve Image 1.0 登顶，低价高质挑战 Midjourney 和 Flux

AI图像生成领域正呈现"三足鼎立"态势：MidJourney坚守艺术品质王座，Flux专注写实突破，Reve则以性价比和文字处理能力切入市场。随着GPT-4o的入局，行业竞争已从单点技术比拼升级为生态体系对抗。下一阶段，用户体验和伦理规范将成为关键胜负手。

3/27/2025 9:57:03 AM

故渊

Ideogram 正式发布 3.0 版本模型：真实感与创意表现再突破

Ideogram 官方宣布推出其最新图像生成模型——Ideogram3.0。这一版本在真实感、创意表现力和风格一致性上实现了显著突破，被认为是图像生成领域的一次重要里程碑。新模型不仅对标 GPT-4o 等顶级 AI 系统，还以其高效性能和创新功能吸引了广泛关注。

3/27/2025 9:53:00 AM

AI在线

清华稀疏Attention，无需训练加速一切模型！

在当今各类大语言模型以及视频模型中，长序列场景越来越普遍，而 Attention 的计算复杂度随着序列长度呈平方增长，成为长序列任务下的主要计算瓶颈。此前，清华大学陈键飞团队提出的即插即用量化的 SageAttention 系列工作已实现 3 倍加速于 FlashAttention，且在各类大模型上均保持了端到端的精度，已被业界和社区广泛使用。为了进一步加速 Attention，清华大学陈键飞团队进一步提出了无需训练可直接使用的稀疏 Attention（SpargeAttn）可用来加速任意模型。

3/27/2025 9:47:23 AM

机器之心

阿里深夜开源Qwen2.5-Omni，7B参数完成看、听、说、写

3 月 27 日凌晨，阿里通义千问团队发布 Qwen2.5-Omni。这是 Qwen 系列中全新的旗舰级多模态大模型，专为全面的多模式感知设计，可以无缝处理包括文本、图像、音频和视频的各种输入，同时支持流式的文本生成和自然语音合成输出。从此以后，你可以像打电话或进行视频通话一样与 Qwen 聊天！

3/27/2025 9:40:59 AM

机器之心

Spring AI + Ollama 实现 deepseek-r1 的API服务和调用

兄弟们，今天咱来聊聊一个超有意思的技术组合 ——Spring AI Ollama 实现 deepseek - r1 的 API 服务和调用。咱都知道，人工智能这几年那可是火得一塌糊涂，各种大模型你方唱罢我登场。 deepseek - r1 就是其中一个挺厉害的模型，那怎么把它用起来，让它为咱们的项目服务呢？

3/27/2025 9:34:42 AM

儒猿团队

OpenAI收入暴增预测：未来几年或实现翻倍增长

根据最新消息，OpenAI正在迎来一波前所未有的需求增长，预计到2025年，其收入将达到127亿美元，较去年的37亿美元实现两倍增长。该公司的乐观预期并不仅限于此，明年预计收入还将继续飙升，可能达到294亿美元。自从 OpenAI 推出 ChatGPT 聊天机器人以来，其产品受到了广泛关注和热烈追捧。

3/27/2025 9:28:00 AM

AI在线

Stable Diffusion变身3D神器！一个LoRA将2D图像转3D模型

在Stable Diffusion当中，只需加入一个LoRA就能根据图像创建3D模型了？港科大（广州）与趣丸科技合作推出了全新三维生成大模型——Kiss3DGen，创新性地将3D生成与成熟的图像生成模型进行了对齐。并且与主流2D扩散模型技术（如ControlNet、Flux-Redux）兼容协同，无需额外训练即可即插即用。

3/27/2025 9:26:30 AM

量子位

轨迹可控视频生成新范式，复旦微软破解视频生成难题，精准控制任意物体运动

轨迹可控的视频生成来了，支持三种不同级别的轨迹控制条件——分别为掩码、边界框和稀疏框。近年来，视频生成技术快速发展,显著提升了视频的视觉质量与时间连贯性。在此基础上，（trajectory-controllable video generation）涌现了许多工作，使得通过明确定义的路径精确控制生成视频中的物体运动轨迹成为可能。

3/27/2025 9:24:16 AM

量子位

人形机器人优雅漫步，强化学习新成果！独角兽Figure创始人：之前大家吐槽太猛

注意看，机器人像人一样从容地走出大门了！甚至，还有一整支机器人队伍迎面走来。人形机器人独角兽Figure，再次带来他们的新成果——利用强化学习实现自然人形行走。

3/27/2025 9:19:57 AM

量子位

突发！英伟达收购贾扬清新创业的Lepton AI

出品 | 51CTO技术栈（微信号：blog51cto）刚刚，有外媒曝出英伟达即将收购成立两年的 AI 创业公司 Lepton AI。 Lepton AI 的创始人是AI圈内知名人士贾扬清。据悉这笔收购交易的金额是数亿美元。

3/27/2025 8:50:38 AM

网络犯罪分子利用11种方式使网络钓鱼比以往更有危害力

网络犯罪分子正在改变其社交攻击的欺诈手段，以提高真实性，更好地绕过过滤器，并更有针对性地瞄准潜在受害者。网络钓鱼一直是安全漏洞的主要来源——这一重大问题，尽管经过了多年的安全意识培训，但至今仍是网络安全方面的首要关注点。不过，由于战术的改进和AI技术的恶意再利用，这种长期存在的社交攻击手段不断演变，网络犯罪分子正在寻找新的方法来诱骗用户点击恶意链接。

3/27/2025 8:00:00 AM

John Leyden

资讯热榜

上海AI实验室开源InternVL3系列多模态大型语言模型 Haisnap横空出世，小白用户也能轻松打造AI应用「交交」媲美GPT-4o！上海交大推出口语对话情感大模型，首个纯学术界自研！ OpenAI开源超Agent:Codex CLI,五小时内破 5000 颗星 ChatGPT重磅更新：新增图像库功能，可查看自己用GPT生成的所有图片本地部署DeepSeek+DiFy平台构建智能体应用 kimi开源视觉语言模型 Kimi-VL 与 Kimi-VL-Thinking，多项基准超越 GPT-4o OpenAI 发布“智能体构建实战指南”实用性文档（附文档资源）

标签云

人工智能 OpenAI AIGC AI ChatGPT DeepSeek AI绘画数据机器人谷歌模型大模型 Midjourney 智能用户学习开源 GPT 微软 Meta AI创作图像技术论文 Stable Diffusion 马斯克 Gemini 算法蛋白质生成式芯片代码英伟达腾讯神经网络计算研究 Sora AI for Science 3D Anthropic AI设计机器学习 GPU 开发者场景华为预测伟达 Transformer 百度人形机器人苹果深度学习 AI视频模态字节跳动 xAI 驾驶文本搜索大语言模型 Claude Copilot 具身智能神器推荐 LLaMA 算力安全应用视频生成科技视觉亚马逊干货合集 2024 AGI 特斯拉大型语言模型训练