理论

USENIX Sec’25 | LLM提示词注入攻击如何防？UC伯克利、Meta最新研究来了
本文介绍对 LLM 提示词注入攻击（prompt injection）的通用防御框架。首篇论文已被安全顶会 USENIX Security 2025 接收，第一作者陈思哲是 UC Berkeley 计算机系博士生，Meta FAIR 访问研究员，研究兴趣为真实场景下的 AI 安全。他的导师是 David Wagner (UCB), 郭川 (Meta), Nicholas Carlini (Go…
理论
- 973
- 0
admin12月18日
3B模型长思考后击败70B！HuggingFace逆向出o1背后技术细节并开源
如果给小模型更长的思考时间，它们性能可以超越更大规模的模型。最近一段时间，业内对小模型的研究热情空前地高涨，通过一些「实用技巧」让它们在性能上超越更大规模的模型。可以说，将目光放到提升较小模型的性能上来有其必然性。
理论
- 979
- 0
机器之心12月17日
举报人「自杀」，OpenAI表示震惊！NYU教授发长文悼念：警钟仍在回响
几天前，消息曝出，曾在OpenAI工作四年，指控公司侵犯版权的Suchir Balaji，上月底在旧金山公寓中被发现死亡，年仅26岁。 Suchir Balaji曾参与了ChatGPT后训练、GPT-4预训练，以及o1推理的研发工作。今年10月，他在自己的一篇博文和「纽约时报」的专访中指出，OpenAI在使用新闻和其他网站的信息训练其AI模型时，违反了「合理使用」原则。
理论
- 976
- 0
新智元12月17日
GPU 资源调度：k8s-device-plugin 知多少？
Hello folks，我是 Luga，今天我们来聊一下人工智能应用场景 - 基于 k8s-device-plugin 机制所实现的 GPU . 资源动态调度。近几年，随着大数据和人工智能技术的迅猛发展，AI 应用场景日益丰富，成为推动产业升级的重要驱动力。
理论
- 972
- 0
Luga Lee12月17日
Differential Transformer: 通过差分注意力机制提升大语言模型性能
Transformer模型已经成为大语言模型（LLMs）的标准架构，但研究表明这些模型在准确检索关键信息方面仍面临挑战。今天介绍一篇名叫Differential Transformer的论文，论文的作者观察到一个关键问题：传统Transformer模型倾向于过分关注不相关的上下文信息，这种"注意力噪声"会影响模型的性能。在这篇论文中，作者注意到transformer模型倾向…
理论
- 972
- 0
佚名12月17日
数据分布检验利器：通过Q-Q图进行可视化分布诊断、异常检测与预处理优化
在机器学习和数据分析中，我们经常需要验证数据是否符合某种特定的分布（如正态分布）。这种验证对于选择合适的统计方法和机器学习模型至关重要。例如许多统计检验和机器学习算法都假设数据服从正态分布。
理论
- 978
- 0
Adarsh Singh12月17日
企业如何应对AI模型中的偏见和隐私挑战
在采访中，Holistic AI的联合首席执行官Emre Kazim讨论了公司从一开始就需要将负责任的AI实践融入其业务战略的必要性。他探讨了如何解决偏见、隐私和透明度等问题，这需要一种积极主动且全面的方法，而不仅仅是遵守法规。公司如何解决AI模型中的偏见、隐私问题和缺乏透明度的情况?为了应对这些挑战及其他更多问题，公司需要制定一个清晰且积极主动的AI治理计划。
理论
- 976
- 0
Mirko Zorz12月17日
视觉模型进入MoE时代！DeepSeek开源全新视觉模型VL2，逆向由图生成代码、梗图解析、几张图生成一篇童话！
编辑 | 言征出品 | 51CTO技术栈（微信号：blog51cto）12月13日晚，国内开源模型玩家深度求索发布了视觉模型 DeepSeek-VL2。这次DeepSeek视觉模型给这一领域带来了不少看新看点：1、模型层面，视觉模型也可以使用 MoE 架构，而且可以配合动态切图2、新增了不少生成玩法，如：视觉定位，模型可以根据提示识别出物体的边界范围，再比如梗图理解和解析。 3、图表理解：可以根…
理论
- 976
- 0
言征12月17日
北大开源全新图像压缩感知网络：参数量、推理时间大幅节省，性能显著提升 | 顶刊TPAMI
压缩感知（Compressed Sensing，CS）是一种信号降采样技术，可大幅节省图像获取成本，其核心思想是「无需完整记录图像信息，通过计算即可还原目标图像」。 CS的典型应用包括：降低相机成本：利用廉价设备就能拍摄出高质量图像；加速医疗成像：将核磁共振成像（MRI）时间从40分钟缩短至10分钟内，减少被检查者的不适；探索未知世界，助力科学研究：将「看不见」的事物变为「看得见」，如观测细胞活动…
理论
- 975
- 0
新智元12月17日
宇树机器人强化学习代码全面开源，还有训练到仿真和实操手把手教学
9.9万元起，还能够大规模量产的国产人形机器人，表现得实在是太6了：而且还走上了开源路线，就在刚刚，宇树机器人开源的强化学习代码又更新了！更新之后不再是只能训练——不仅能够仿真运行，还能部署到实体机器，整个过程所有代码全部开放。一开始，宇树开源的是英伟达Issac Gym平台上的训练代码，这次新增了对MuJoCo模拟仿真的支持。
理论
- 975
- 0
量子位12月17日
语言游戏让AI自我进化，谷歌DeepMind推出苏格拉底式学习
没有外部数据，AI自己也能进化？听起来有点吓人，于是谷歌DeepMind的这项研究很快引起了广泛关注。图片论文地址：「苏格拉底式学习」（Socratic Learning），能够使AI系统自主递归增强，超越初始训练数据的限制。
理论
- 976
- 0
新智元12月17日
开源Llama版o1来了，3B小模型反超80B，逆向工程复现OpenAI新Scaling Law
o1完整版公开仅10天，Scaling Law新范式就被逆向工程复现了！ Hugging Face官方发文，开源了扩展测试时计算的方法。用在小小小模型Llama 1B上，数学分数直接超过8倍大的模型，也超过了计算机科学博士生的平均分数（40%）。
理论
- 975
- 0
量子位12月17日
ChatGPT地位不保？科技爱好者更喜欢拥有“情绪智力”的Claude
Claude是AI企业Anthropic开发的聊天机器人，它的名气远不如ChatGPT，目标也不是让用户与逼真的AI伙伴建立关系，但它仍然给OpenAI带来一些威胁。由于Claude很机智，很敏感，科技爱好者渐渐喜欢上Claude。一些爱好者甚至每天要与Claude对话十几次，向它询问工作建议、健康问题、人际关系问题。
理论
- 973
- 0
极客AI12月17日
为多模态LLM引入ControlNet理念，开源插件解决灾难性遗忘
多模态大模型内嵌语言模型总是出现灾难性遗忘怎么办？像文生图那样有ControlNet即可解决。这就是由360人工智能研究院提出的IAA的核心思路。
理论
- 975
- 0
admin12月17日
张璇、周光敏团队在随机退役条件下基于生成式学习的电池健康状态评估与可持续回收研究中取得新进展
编辑丨ScienceAI随着电动汽车市场的快速发展，动力电池需求量激增，但其设计寿命有限，退役潮已经到来。如何高效、经济、环保地处理这些退役电池，成为亟待解决的挑战。梯次利用和回收利用被视为关键途径，而准确评估退役电池健康状态（SOH）则是实现这一目标的基础。
理论
- 973
- 0
ScienceAI12月17日
AI for Science 是科学的未来，NVIDIA 正加速它的到来
ScienceAI原创作者：萝卜皮近年来人工智能（AI）等新兴技术的突破，正在逐渐改变科学研究的模式。今年诺贝尔物理奖与化学奖均颁发给了 AI 以及计算相关领域的科学家，足见科学界对「AI for Science」这一研究新范式的肯定。尽管如此，AI 科研领域所面临的困难依旧严峻。
理论
- 974
- 0
ScienceAI12月17日
从RPA到智能体：智能自动化迎来革命性飞跃
在过去的一年里，自动化竞赛愈演愈烈，智能体已成为提升企业效率的终极变革者。虽然GenAI工具在过去三年里取得了显著进步，成为企业工作流程中的宝贵助手，但现在焦点正转向能够自主思考、行动和协作的智能体。对于准备迎接下一波智能自动化浪潮的企业而言，了解从聊天机器人到检索增强生成(RAG)应用再到自主多智能体的飞跃至关重要。
理论
- 971
- 0
Rohan Sharma12月17日
清华本科生获NeurIPS Math-AI 杰出论文奖：REBASE算法让小模型实现推理大突破
刚刚由清华大学本科生伍垟圳为一作的论文《推理Scaling Laws：面向语言模型问题求解的计算最优推理实证分析》在顶级AI学术会议NeurIPS 2024 Math-AI上荣获杰出论文奖（Outstanding Paper Award）。这项研究不仅刷新了人们对推理阶段计算优化的理解，还为如何在有限计算资源下实现更高效的大语言模型（LLM）推理提供了全新的思路论文亮点：推理阶段的计算优化新突破…
理论
- 977
- 0
AI寒武纪12月17日
谷歌版Sora升级4K高清！一句话控制镜头运动，跑分叫板可灵海螺
OpenAI直播划水的一天，谷歌版Sora迎来了它的2.0——Veo 2，根据文本或图像生成更为高质量的视频。从官方介绍中看，此次主要有三个方面的升级。比如分辨率能达到4K。
理论
- 971
- 0
量子位12月17日
Nature再发招聘调查：学术界和工业界大不同，帮你避坑从简历到面试的N个细节
从今年6月开始，Nature与伦敦研究咨询公司Thinks Insights & Strategy合作推出了一系列文章，讲述今年对全球科学领域招聘经理开展调查后得出的结果。通过各种途径的宣传，这项调查共找到了来自77个国家的学术界、工业界和其他部门的1134名自荐受访者，包括实验室的PI、招聘负责人和资深成员。完整的调查数据集：，周五下午，你的LinkedIn或邮箱中发来一份工作推荐，…
理论
- 973
- 0
新智元12月17日
视频一键拆分PS层！DeepMind新模型效果碾压同级，物体、背景完美分离，还能脑补
视频数据中通常会包含动态世界中的复杂信号，比如相机运动、关节移动、复杂的场景效果以及物体之间的交互。如果能自动化地把视频分解成一组语义上有意义的、半透明的层，分离前景对象和背景的话，类似PS中的图片，就可以极大提升视频的编辑效率和直观性。现有方法在推断对象及其效果之间复杂的时空相关性时，只能处理静态背景或带有精确相机和深度估计数据的视频，并且无法补全被遮挡区域，极大限制了可应用范围。
理论
- 970
- 0
新智元12月17日
Kimi版o1实装上线，这里是我们的一手测试↑
Kimi新模型来袭，且发布即上线可用！就在数学模型k0-math刚发布后没几天，视觉思考模型k1就来了，多项思考推理测试超越Open AI o1。官方表示，基于强化学习，k1原生支持端到端图像理解和思维链技术。
理论
- 975
- 0
量子位12月17日
ChatGPT搜索与Her打通了！搜索免费开放，居然还剧透明日直播主题
ChatGPT今天带来的是搜索功能方面的一些迭代升级（更像谷歌了）。主要有三点，私以为最大亮点是第二：根据用户反馈，优化搜索体验，移动端搜索更快，并能搜索出多模态信息；结合前几日发布的Her功能，可以在实时通话的时候进行语音搜索；免费，接下来逐步向所有ChatGPT用户开放。官方信息显示，ChatGPT Search背后是微调后的GPT-4o模型，使用新颖的合成数据生成技术进行post-tra…
理论
- 983
- 0
量子位12月17日
华为诺亚解析：推荐系统的技术演进及大模型应用实践
一、推荐系统问题和背景首先来简要介绍一下个性化推荐系统。实际上，我们每个人每天都在与众多推荐系统进行交互。例如，购买衣物、阅读新闻或聆听音乐时，我们打开的每一个应用程序或网页，其展示的内容即为推荐系统所呈现。
理论
- 980
- 0
刘卫文12月17日