理论 - AI在线

OpenAI新研究：o1增加推理时间就能防攻击，网友：DeepSeek也受益

OpenAI的新Scaling Law，含金量又提高了。像o1这样的推理模型，随着思考时间的延长，面对对抗性攻击会变得更加稳健。图片随着大语言模型被越来越多地赋予Agent能力，执行现实世界的任务，模型被对抗攻击的风险也与日俱增。

字节要亲手打造AGI了！神秘“Seed Edge”项目被曝光，已设置5大研究方向，探索下一代AI技术，算力不用愁！

编辑 | 伊风出品 | 51CTO技术栈（微信号：blog51cto）中国大厂开始发力AGI了！据媒体报道，字节跳动 AGI 研究团队浮出水面，揭开了字节AGI的秘密布局！报道称：1 月下旬，字节正式设立代号为“Seed Edge”的研究项目，核心目标是做比预训练和大模型迭代更长期、更基础的 AGI 前沿研究。

字节清华开源力作！UI-TARS原生AI智能体，人人都能拥有“智能助手”

年底国内各个AI玩家杀疯了，前两天完全开源的Deepseek R1 震撼整个AI业界，今天字节又联合清华整活，一个强大的原生的开源 AI Agent UI-TARS震撼上线看了UI-TARS的论文，我给大家划划重点【纯视觉感知】：告别文本依赖，像人眼一样“看”懂GUI！传统的GUI自动化方案，很多都依赖于解析网页代码（HTML）或者软件的API接口。但这种方式有两个致命缺陷：一是平台限制，不同平台、不同软件的底层代码和API都不一样，导致自动化方案难以通用；二是容易失效，一旦网页或软件界面改版，代码或API接口变动，自动化脚本就可能直接崩溃。

刚刚，OpenAI发布o1模型新突破，推理时间增强对抗鲁棒性

今天凌晨2点，OpenAI发布了一项新技术研究，通过增加推理时间、算力资源来大幅度提升模型的对抗鲁棒性。与传统的对抗训练样本方法不同的是，OpenAI提出的新方法不需要对大模型进行专门的对抗训练，也不需要提前了解攻击的具体形式。只需要通过增加推理时间和算力资源，模型就可以更充分地利用其推理能力表现出更强的鲁棒性。

NVIDIA提出虚拟试衣新方法EARSB，让时尚与科技完美融合！

在数字化浪潮席卷全球的今天，科技正以前所未有的方式融入我们的生活，包括我们追求时尚的方式。想象一下，无需亲临实体店，只需轻点屏幕，就能轻松试穿心仪的衣物，这不再是遥不可及的梦想。 NVIDIA联合波士顿大学提出了 EARSB，该模型能够智能地识别并修正初始试衣图像中的错误区域，能够针对特定错误进行精准修正，显著提升试衣效果的真实感和细节表现。

「AI没有墙超预期」Anthropic CEO达沃斯惊人预测：2027年实现超人类水平的AI

人类水平的AI或超越所有人类的AI将在两三年内到来,从内部来看，AI的发展没有遇到墙反而超预期 --Anthropic CEO Dario Amodei华尔街日报在达沃斯世界经济论坛对 Anthropic 首席执行官 Dario Amodei 的最新采访。采访内容主要围绕 Anthropic 的 AI 模型 Claude 的未来发展方向、AI 技术的进步速度及其对社会和劳动力市场的影响、以及 Anthropic 在行业竞争和政策监管方面的策略以下结合采访内容给大家划个重点Claude 的未来发展方向网络访问 (Web Access): Anthropic 正在积极开发 Claude 的网络访问功能，预计很快推出。尽管企业用户是 Anthropic 的重点，但他们也认识到网络访问对于消费者和高级用户的重要性。

20K合成数据就能让大模型能力飙升！还能实现模型自我迭代，上海AI Lab数据合成新范式

仅使用20K合成数据，就能让Qwen模型能力飙升——模型主观对话能力显著提升，还能实现模型自我迭代。最近，来自上海AI Lab的研究团队针对合成数据技术展开研究，提出了SFT数据合成引擎Condor，通过世界知识树（World Knowledge Tree）和自我反思（Self-Reflection）机制，探索合成海量高质量SFT数据的方案。结果，他们还意外发现，在增大合成数据量的情况下，模型性能持续提升。

Anthropic CEO惊人预警：27年AI超越人类！Claude今年更新全剧透

失踪人口终于回归了！在互联网消失一段时间后，Anthropic首席执行官Dario Amodei一上来就接受了WSJ、CNBC两家采访，连曝AI大瓜。他坚定地认为，「2027年之前，AI完全可以超越人类智能！

Claude创始人：AI全面超越人类，只剩2-3年

在最新的对话访谈当中，Claude厂家Anthropic的CEO Dario Amodei谈论了他对于AI未来的看法。他认为，AI确有可能在短期内替代部分人类的工作，但让AI与人类形成互补才是对生产力最有益的方式。对于当下的年轻人，Amodei也给出了他的建议，鼓励其学会使用AI工具并培养批判思维能力。

最壕DeepSeek玩家8台Mac跑R1，10万+元凑496GB显存才能跑4bit量化版

DeepSeek-R1，正在接受全球网友真金白银的检验。花30秒用manim代码制作解释勾股定理的动画，一次完成无错误。为了玩上这样的模型，有人花上10多万元，组7台M4 Pro Mac mini 1台M4 Max Macbook Pro的家用超算。

使用 SHAP 使机器学习模型变的可解释！！！

大家好，我是小寒SHAP 是一种用于解释机器学习模型预测结果的方法，它基于博弈论中的 Shapley值。旨在为每个特征分配一个“贡献值”，表明该特征对模型预测结果的影响有多大。 SHAP 为复杂的黑箱模型（如深度学习模型、集成方法等）提供了一种统一且理论上有保障的解释框架，帮助我们理解模型的决策过程，提高模型的透明度和可信度。

灵敏度高达94.9%！牛津团队AI多模态ctDNA检测方法，进行癌症早期筛查

编辑 | 2049在癌症诊疗的漫长征程中，早期检测始终是最具挑战性的环节之一，液体活检技术因其无创性和高灵敏度而备受关注。然而，现有的检测方法大多依赖于深度靶向测序，难以同时整合多模态数据，导致检测灵敏度和特异性受限。正是基于这一技术痛点，牛津大学的研究团队开发了一种基于全基因组 TET 辅助吡啶硼烷测序（TAPS）的多模态循环肿瘤 DNA（ctDNA）检测方法。

AI伪造论文渗透学术圈：Google Scholar成虚假科学温床，如何应对？

编辑 | 1984随着生成式 AI 技术的普及，学术界正面临着一个新的挑战：越来越多疑似由 AI 生成的研究论文正在渗透到学术期刊、档案库和知识库中。这些论文通常借助 ChatGPT 等普及型 AI 应用来模仿学术写作风格，其危害不容忽视。作为广受欢迎的学术搜索引擎，Google Scholar 在展示搜索结果时，并未区分这些可疑论文与经过严格质量把关的研究成果。

一款可快速定位照片的AI工具

由波士顿Graylark Technologies开发的GeoSpy是一款强大的AI工具，可通过分析图像中的建筑风格、植被类型以及建筑物之间的空间关系等特征，在几秒钟内高精度定位照片的拍摄位置。这项技术引起了公众和执法机构的广泛关注，其市场定位为执法部门、威胁情报公司和政府机构提供服务。 GeoSpy经过数百万张全球图片训练，能够识别“显著的地理标志”，如特定的建筑样式、土壤特征及其空间排列关系。

API存在安全风险：如何在不断发展的数字环境中保护数据

云计算和人工智能技术彻底改变了企业的运营方式。这两种技术都提供了更高的灵活性和可扩展性。基于云的基础设施使组织能够更快地进行创新。

UC伯克利等提出具身智能「动作Tokenizer」，效率飙升5倍！

来自π，伯克利和斯坦福的研究者近期提出了FAST，一种为VLA模型设计的高效动作Tokenizer。 FAST旨在解决传统动作Tokenization方法在处理精细任务时面临的挑战，为VLA模型在更复杂、高频的机器人控制任务带来了显著改进。将FAST与π0 VLA结合，在1万小时的机器人数据上对π0-FAST进行训练，效果与最先进的扩散VLA相当，训练时间最多缩短5倍。

截胡OpenAI！清华复旦等抢先开源智能体框架Eko，一句话打造「虚拟员工」

OpenAI的首席执行官Sam Altman最近宣布，2025年将推出「虚拟员工计划」，代号Operator，AI智能体能够自主执行任务，如写代码、预订旅行等，成为企业中的「数字同事」。抢在OpenAI发布Operator之前，清华、复旦和斯坦福的研究者联合提出了名为Eko的 Agent开发框架，开发者可以通过简洁的代码和自然语言，快速构建可用于生产的「虚拟员工」。 AI智能体能够接管用户的电脑和浏览器，代替人类完成各种任务，为工作流程提供自动化支持。

41%博士后逃生学术界，顶刊PNAS揭残酷真相！名校光环背后曝职业危机

去年，随着LLM产品化和工程化的发展，工业界的研究岗迅速缩减，许多AI博士面临巨大的就业压力，纷纷表示后悔读博。工业界机会稀少，学术界同样问题重重。为此，有的博士生甚至转行去当了主播。