研究
攻破OpenAI o1/o3、DeepSeek R1防线,安全推理过程反成大模型「阿喀琉斯之踵」
本文共同第一作者是杜克大学计算进化智能中心的博士生郭士霆、张健一,导师为陈怡然教授。 在通往 AGI 的道路上,大型推理模型(LRMs)正以前所未有的速度迭代进化:OpenAI 的 o 系列模型凭借类人推理能力刷新多项基准,DeepSeek-R1 以极低的训练成本实现完全不输 o 系列模型的性能突破。 然而,在这股追求推理性能的浪潮之下,一个关乎技术伦理的隐忧正在浮现 —— 当模型运用自身强大的推理能力进行安全审查时,「展示安全推理思维链」这种透明化机制是否会暴露安全隐患?
开源框架BioChatter助力生物医学研究,降低LLM使用门槛
近年来,大型语言模型(LLMs)在各个领域的应用日益广泛,从内容创作到编程辅助,再到搜索引擎优化,无不展现出其强大的能力。 然而,在生物医学研究中,这些模型的应用仍面临着透明度、可重复性和定制化等方面的挑战。 针对这一问题,海德堡大学与欧洲生物信息研究所(EMBL-EBI)联合提出了一个开源 Python 框架 ——BioChatter,旨在帮助生物医学研究人员更轻松地使用 LLMs。
CVPR满分论文:一块2080Ti搞定数据蒸馏,GPU占用仅2G,来自上交大“最年轻博导”课题组
只要一块6年前的2080Ti,就能做大模型数据蒸馏? 来自上交大EPIC实验室等机构的一项最新研究,提出了一种新的数据集蒸馏方法——NFCM。 与前SOTA相比,新方法的显存占用只有1/300,并且速度提升了20倍,相关论文获得了CVPR满分。
SymbyAI完成210万美元种子轮融资,打造科研专用AI工作空间
科学研究领域的创新者SymbyAI宣布完成210万美元种子轮融资,投资方包括Drive Capital和CharacterVC等知名机构。 这家专注于用人工智能简化科研流程的SaaS平台正在为研究人员创造一个前所未有的整合式工作环境。 SymbyAI由Ashia Livaudais和Michael House于去年共同创立,其诞生源于Livaudais亲身经历的科研困境。
You.com 发布 AI 研究工具 ARI,可同时处理 400+ 个来源
You.com 推出了一款名为 “高级研究与洞察代理(ARI)” 的人工智能研究工具,这款工具承诺将彻底改变企业进行市场调研的方式。 ARI 能够同时分析超过400个数据源,从而将原本需要几周时间的研究报告生成过程缩短到几分钟。 You.com 的联合创始人兼首席执行官理查德・索彻在接受《VentureBeat》采访时表示:“整个知识工作领域正在发生变化,这将改变企业决策的速度和质量。
谷歌发布最强「科研辅助神器」!能帮你提新idea,三大真实场景实证
在科学探索的过程中,研究人员需要对以往发表的文献进行观察总结,提出一些新颖、可行的研究方向,最后通过全面的实验进行idea验证。 科研人员需要对探索的宽度和深度进行平衡,由于精力有限,不能探索过多的研究方向,同时还要保证对目标主题的研究深度。 最近,谷歌、斯坦福大学等机构的研究人员开发了一个多智能体、基于Gemini 2.0的AI协同科研(AI co-scientist)系统,具备跨复杂主题的综合能力和进行长期规划、推理的能力,除了传统的文献综述、总结功能之外,还可以辅助科研人员提出新的、原创知识,或是基于先前的成果制定研究假设(hypotheses)和计划(proposal)。
与DeepSeek和Claude竞争升级!OpenAI"深度研究"功能面向所有付费ChatGPT用户开放
OpenAI 最近宣布,将其深度研究(Deep Research)功能扩展到所有 ChatGPT Plus、Team、Education 和 Enterprise 用户。 这项功能被许多专家视为自 ChatGPT 以来最具变革性的 AI 助手。 根据官方消息,这些用户每月将获得10次深度研究查询,而 Pro 用户则可享有每月120次查询的特权。
AI蛋白质设计前沿教程,AAAI'25三大机构携手4小时全面剖析
精准预测和设计蛋白质的序列、结构及模拟其动态变化,一直是科学界的重大挑战。 在即将举行的AAAI 2025会议上,加拿大魁北克省人工智能研究所Mila、美国东北大学和MIT的学者将组织一场主题为“人工智能在蛋白质设计中的应用”的教程。 (文末附教程直通车)综观当下,AI与生命科学深度融合背景下,蛋白质研究正经历前所未有的AI驱动变革。
蚕食人类权力不用AGI降临!「温水煮青蛙」足以让AI渐进式失控
在我们的认知中,政府、经济体系等大规模社会系统就应该由人类主导,产生满足人类偏好的结果。 但在AI时代,这个命题就逐渐站不住脚了。 原因在于,人类与这些系统的目标一致性并不是自发的,而是仰赖于两种有效维持目标对齐的方式:明确的人类行为(如选举和消费者用脚投票),以及经由人类劳动和认知过程隐式方式。
物理直觉不再是人类专属?LeCun等新研究揭示AI可如何涌现出此能力
在当今的 AI 领域,图灵奖得主 Yann LeCun 算是一个另类。 即便眼见着自回归 LLM 的能力越来越强大,能解决的任务也越来越多,他也依然坚持自己的看法:自回归 LLM 没有光明的未来。 在近期的一次演讲中,他将自己的观点总结成了「四个放弃」:放弃生成式模型、放弃概率模型、放弃对比方法、放弃强化学习。
复旦主导,中美等8个国家25家单位44名学者联合发布大模型安全技术综述
近年来,随着大模型的快速发展和广泛应用,其安全问题引发了社会各界的广泛关注。 例如,近期发生的「全球首例利用 ChatGPT 策划的恐袭事件」再次敲响了警钟,凸显了大模型安全问题的紧迫性和重要性。 为应对这一挑战,来自中美英德等 8 个国家 25 家高校和科研机构的 44 位 AI 安全领域学者联合发布了一篇系统性技术综述论文。
官宣!OpenAI前CTO新公司:北大校友翁荔加盟,创始29人2/3来自OpenAI
正式官宣! OpenAI前CTO Mira Murati 成立新公司——Thinking Machines Lab。 整个创业团队可以说前所未有之豪华了,三分之二的都是以前的OpenAI旧部追随——其中包括OpenAI前研究(后训练)副总裁Barret Zoph,担任公司CTO;刚刚离职Anthropic、OpenAI离职联创John Schulman,任公司首席科学家,还有包括前OpenAI VP、北大校友翁荔等等。
Nature:全球博士生数量锐减,钱少、事多、前途迷茫
过去几年,一些国家的博士项目申请人数出现下滑,有专家警告称,这是一个令人担忧的趋势。 从澳大利亚、日本到巴西和英国,高昂的生活成本、微薄的助学金以及毕业后有限的就业前景,正在阻碍人们攻读博士学位。 据经合组织(OECD)巴黎总部项目负责人斯拉里科表示,这些下降的数据应该「敲响警钟」。
LLM自主发现发表在Nature上的科学假设?ICLR 2025 论文MOOSE-Chem深度解析
编辑 | ScienceAI人工智能的下一个前沿,不仅是语言、图像,而是科学发现本身。 近年来,人工智能(AI)已经在自然语言处理(NLP)、计算机视觉(CV)等领域取得巨大成功。 但 AI 是否能够帮助科学家发现新的科学理论?
1/10训练数据超越GPT-4o!清华等提出隐式过程奖励模型PRIME,在线刷SOTA
告诉我,我会忘记,教我,我会记住,让我参与,我就能学会。 ——本杰明·富兰克林 打破数据墙,我们还能做些什么? 近日,来自清华UIUC等机构的研究者提出了PRIME(Process Reinforcement through IMplicit REwards):通过隐式奖励来进行过程强化。
DeepMind天才科学家疑自杀!41岁SuperGLUE之父英年早逝,AI圈悲痛不已
就在刚刚,一个令人悲伤的消息传来。 谷歌DeepMind研究科学家Felix Hill,于2024年12月5日英年早逝,年仅41岁。 自2023年初以来,他一直在与严重的精神疾病作斗争。
芝大、清华团队分析了6800万份论文表明,AI可能会降低科学家的创造力?
编辑 | 白菜叶一项新研究表明,采用人工智能工具分析数据和建模结果对年轻科学家的职业前景有着巨大的影响,大大增加了他们在各自领域晋升到有影响力职位的机会。 但这种对个体研究人员的利好似乎以牺牲科学为代价。 芝加哥大学和清华大学的研究人员分析了六个科学学科(生物学、医学、化学、物理学、材料学和地质学,不包括计算机科学)的近 6800 万份研究论文,发现融入人工智能技术的论文被引用的次数更多,但同时也集中在更窄的主题上,而且重复性更强。
对齐、生成效果大增,文本驱动的风格转换迎来进阶版
论文的第一作者是来自西湖大学的研究人员雷明坤,指导老师为西湖大学通用人工智能(AGI)实验室的负责人张驰助理教授。 实验室的研究方向聚焦于生成式人工智能和多模态机器学习。 文本驱动的风格迁移是图像生成中的一个重要任务,旨在将参考图像的风格与符合文本提示的内容融合在一起,生成最终的风格化图片。