数据

DeepSeek前脚发新论文，奥特曼立马跟上：GPT-5就在几个月后啊

有点意思。这不DeepSeek前脚刚刚上新了一篇关于推理时Scaling Law的论文嘛，引得大家纷纷联想是不是R2马上要来了。然鹅……奥特曼这边却发了一条“变卦”的消息：计划改变：我们可能在几周之后先发布o3和o4-mini。

4/7/2025 8:15:00 AM

量子位

Claude 3.5首战复现21%顶会论文，人类博士无法取代！OpenAI：AI全是草台班子

AI智能体，能否复现顶会中重磅的AI研究？今天，OpenAI团队发布了全新框架PaperBench，便可评估AI智能体复现顶尖研究的基础能力。论文地址：，AI智能体需从0开始复现20篇ICML 2024 Spotlight和Oral论文，包括理解论文核心文献、开发可运行代码库，以及执行实验并验证结果。

4/4/2025 12:00:00 AM

新智元

预测精度达93%，个人电脑可部署，科学家开发Transformer新方法预测结合蛋白

编辑丨&结合蛋白通过与特定分子（如 DNA、RNA 或肽）选择性相互作用来调节各种细胞过程，它们能以高特异性识别和结合靶分子，这使得它们在信号传导、转运和酶活性功能上有着至关重要的地位。当前，用于鉴定蛋白质结合肽的传统方法效率低下且性价比极低，而基于序列的方法因过于狭隘地关注近端序列特征而忽略了结构数据，导致没有一种良好的方式进行结合蛋白预测。阿富汗呼罗珊大学（Khurasan University）领导了一项研究，推出一款名为 Deep-ProBind 的强大预测模型，旨在通过整合序列和结构信息对蛋白质结合位点进行分类。

4/2/2025 2:06:00 PM

ScienceAI

让机器人在人群中穿梭自如，港科广&港科大突破社交导航盲区 | ICRA 2025

机器人落地复杂场景，社交导航能力一定是避不开的关键一点。先简单介绍下，社交导航 (SocialNav，Social navigation) 是指在人机共存的环境中，机器人在遵循社会规范的前提下执行导航任务。就拿下图来说，机器人需导航至目标点，而目标恰好位于两名行人未来轨迹的交汇区域。

4/2/2025 9:50:00 AM

量子位

孙正义豪掷1万亿，机器人帝国崛起！总额远超星际之门，劳动力末日翻盘

报道称，在「星际之门」放血5000亿后，软银又拿着1万亿砸向机器人！孙正义将在美国各地创建配备AI工厂的工业园区，用人形机器人助力制造业解决劳动力短缺难题。机器人军团领衔，AI工厂重定义制造业在软银的宏伟蓝图中，AI工厂成为核心。

4/2/2025 9:15:00 AM

新智元

OpenAI重新开源！第一弹就推理模型，还不限制商用，“冲着DeepSeek来的” 关注前沿科技量子位 2025年04月01日 08:38

一夜之间，OpenAI更新三大动向，开源、融资、用户暴增。第一，将开源一个具备推理能力的大语言模型，包含参数权重那种。上一次这样开源还是6年前推出GPT-2。

4/2/2025 8:40:00 AM

量子位

OCR技术选型：数据提取哪家强？

数据是企业运营的核心资产之一。然而，超过 85% 的商业信息以非结构化数据的形式存在，如电子邮件、报告、发票和合同等，这给计算机处理带来了极大挑战。为解决这一问题，光学字符识别（OCR）技术（Mistral OCR：文档处理领域的革新者）应运而生。

4/2/2025 4:00:00 AM

大模型之路

奥赛级AI基准来了：难倒所有模型，GPT-4o仅考34分，上海交大出品

为了进一步挑战AI系统，大家已经开始研究一些最困难的竞赛中的问题，特别是国际奥林匹克竞赛和算法挑战。但目前尚无奥林匹克级别的、多学科的基准，能够全面评估综合解决问题的能力，以全面检验人工智能的综合认知能力。上海交通大学生成式人工智能实验室 (GAIR Lab) 的研究团队推出多学科认知推理基准OlympicArena，即使是GPT-4o 也只达到了 34.01% 的整体准确率，而其他开源模型的整体准确率也难以达到20%。

4/1/2025 9:25:00 AM

量子位

从0编写基因组！史上最大生物学模型Evo-2全面开源：硅基生命能创造细胞？

生命的一切表现，基本都可以从DNA编码中找到答案。基因组（Genome）包含了生物体所有基因以及非编码的DNA序列，承载了生物体发育、生长、繁殖和适应环境所需的全部遗传信息，近年来基因组相关的测序、合成和编辑工具已经彻底改变了生物学研究。然而，基因组的复杂性是巨大的，即使是最简单的微生物，也包含数百万个DNA碱基对，要智能地构建新的生物系统，研究人员还需要深入理解基因组编码的复杂信息。

3/31/2025 9:30:00 AM

新智元

AI Agent来，传统BI危

在互联网时代，数据已成为企业发展的必经之路。从电商平台的用户行为记录，到工业传感器的实时监测，数据渗透在商业活动的每个环节，成为驱动决策的基础资源。然而数据的价值并不在于简单的堆砌，未经梳理与解读的原始数据如同散落的拼图碎片，既无法呈现完整图景，也难以支撑业务判断。

3/31/2025 8:35:00 AM

量子位

3D版DeepSeek卷起开源月：两大基础模型率先SOTA！又是VAST

3D生成版DeepSeek再上新高度！国产、易用、性能强且开源——新模型一露面就刷新SOTA，并且第一时间加入开源全家桶。顺时针转个圈圈给大家看，效果是这样：加上“皮肤”是这样：再来一个，效果是这样：肉眼可见，这次妥妥升级变成了更细节的细节控～以上效果，都来自3D大模型明星初创公司VAST，其刚刚上新的两个基础模型，TripoSG和TripoSF，为团队的最新研发成果。

3/31/2025 8:25:00 AM

量子位

7B模型搞定AI视频通话，阿里最新开源炸场，看听说写全模态打通，开发者企业免费商用

深夜重磅！阿里发布并开源首个端到端全模态大模型——通义千问Qwen2.5-Omni-7B，来了。仅靠一个一体式模型，就能搞定文本、音频、图像、视频全模态，并实时生成文本和自然语音。

3/27/2025 1:23:39 PM

量子位

统一细粒度感知！北大&阿里提出UFO：无需SAM，16个token让MLLM实现精准分割

本文作者来自北京大学和阿里通义万相实验室。其中论文第一作者是汤昊，北京大学 2022 级博士生，目前主要关注统一的多模态任务建模算法。指导教授是王立威老师，北京大学智能学院教授，曾获 NeurIPS 2024 最佳论文奖、ICLR 2023 杰出论文奖及 ICLR 2024 杰出论文提名奖。

3/25/2025 10:13:26 AM

机器之心

DeepSeek-V3深夜惊爆上新！代码数学飙升剑指GPT-5，一台Mac可跑

昨晚，DeepSeek-V3悄然升级！新模型版本为DeepSeek-V3-0324，参数量为6850亿，相较上个版本参数增幅不大（6710亿）。从发布时间和技术特点来看，DeepSeek-V3-0324，很可能是DeepSeek-R2的基础架构。

3/25/2025 9:03:00 AM

新智元

每天2小时成绩逆袭全美前2%！AI助教让学生不再内卷

每天只用2小时就能搞定繁重的学习任务，剩下时间开发自己的兴趣项目，考试成绩还提高了。这样的学校你愿意尝试吗？据福克斯新闻报道，德克萨斯州一家名为Alpha School的私立学校在引入AI「助教」后，学生的考试成绩蹭蹭上涨，提高到了全美国的前2%。

3/24/2025 9:12:00 AM

新智元

Idea撞车何恺明「分形生成模型」！速度领先10倍，性能更强

前不久，大神何恺明刚刚放出新作「分形生成模型」，递归调用原子生成模块，构建了新型的生成模型，形成了自相似的分形架构，将GenAI模型的模块化层次提升到全新的高度。论文地址：地址：，澳大利亚国立大学的研究人员提出了一个全新的图像生成模型ARINAR，在思想上与分形生成模型不谋而合，但是在性能和速度上都显著提升，base模型的FID从11.8提升到2.75，生成时间从2分钟降低到12秒！ ARINAR不仅超越了之前的扩散模型，与目前表现最好的自回归模型MAR相比，ARINAR生成质量相当，速度是MAR的5倍。

3/24/2025 9:08:00 AM

新智元

硅谷投资人爆料：AI爆炸率先发生在中国！芯片扩大1万倍，AI逼近物理极限

如果AI系统能自己设计出更强大的AI，智能爆炸可能很快就要到来了！而人类，会被AI迅速甩在后面。最近，硅谷投资人、EverFi CEO兼创始人Tom Davidson等人发表了一篇长文硬核博客，详细讨论了智能爆炸（Intelligence explosion, IE）的类型以及对应的发生概率。

3/24/2025 8:55:00 AM

新智元

人工智能应用最大的问题是数据问题，而不是技术问题

随着人工智能技术的发展，人工智能也从刚开始的聊天模型变成了能够应用到实际场景中的一项新的技术；而且随着国家大力发展人工智能技术，人工智能就像二十年前的互联网技术一样，充斥着各种机会，但同样也面临着各种各样的挑战。但是，以个人从事一段时间的人工智能技术应用，以及个人对人工智能技术的了解来看；人工智能目前在实际应用中所存在的主要问题就是数据问题，而不仅仅只是技术问题。当然，人工智能技术还需要时间继续发展，但以解决实际问题出发，目前的人工智能模型需要大量的行业数据做支撑。

3/20/2025 8:10:00 AM

AI探索时代

资讯热榜

上海AI实验室开源InternVL3系列多模态大型语言模型「交交」媲美GPT-4o！上海交大推出口语对话情感大模型，首个纯学术界自研！ Haisnap横空出世，小白用户也能轻松打造AI应用 OpenAI开源超Agent:Codex CLI,五小时内破 5000 颗星 kimi开源视觉语言模型 Kimi-VL 与 Kimi-VL-Thinking，多项基准超越 GPT-4o ChatGPT重磅更新：新增图像库功能，可查看自己用GPT生成的所有图片本地部署DeepSeek+DiFy平台构建智能体应用 OPPO 小布助手网页版上线，接入满血版 DeepSeek

标签云

人工智能 OpenAI AIGC AI ChatGPT DeepSeek AI绘画数据机器人谷歌模型大模型 Midjourney 智能用户学习开源 GPT 微软 Meta AI创作图像技术论文 Stable Diffusion 马斯克 Gemini 算法蛋白质生成式芯片代码英伟达神经网络腾讯计算研究 Sora AI for Science 3D Anthropic AI设计机器学习 GPU 开发者场景华为预测伟达 Transformer 百度苹果深度学习 AI视频模态人形机器人 xAI 驾驶文本搜索字节跳动大语言模型 Claude Copilot 具身智能神器推荐 LLaMA 算力安全应用视频生成科技视觉亚马逊干货合集 2024 AGI 特斯拉训练 DeepMind

数据