AI资讯列表 - AI在线

AI智能体失控时，谁来负责？

保护AI堆栈中的数据意味着了解数据流向何处以及防止滥用。译自Who’s Responsible When AI Agents Go Rogue?，作者 Vrajesh Bhavsar。无论您身处科技界还是与家人共进晚餐，如今都无法逃脱AI的影响。

消息称三星正与 OpenAI 洽谈，有望令 Galaxy AI 整合 ChatGPT 服务

金融分析师 Dan Nystedt 在 X 平台透露称 OpenAI 正在与三星电子洽谈合作计划，讨论将其 ChatGPT 引入三星 Galaxy AI，这种合作模式类似于苹果与 OpenAI 的现有方案。

安全公司披露 PyPI 虚假 GPT / Claude AI 辅助软件包工具，实为木马勒索软件

安全公司卡巴斯基发布通报，声称他们在 PyPI 中发现了两个恶意软件包，该工具包伪装成 GPT 和 Claude AI 平台辅助工具，实际上是木马勒索软件。

对话｜从背景到技术储备：深入解析建“十万卡集群”的必要性

之前坊间还流传一句话：服务器集群的规模越大，其训练出来的人工智能表现就越出色。在这波浪潮之下，全球科技巨头纷纷投入巨资建设高性能AI计算集群，以提升AI算法的效率和能力。谷歌推出了其AI Platform，依托多模态生成式AI模型Gemini，大幅提升了在文本、图像、音频和视频处理上的能力。

研究发现黑客可轻松操控 AI 机器人，将其变成致命武器

宾夕法尼亚大学的研究人员发现，一系列人工智能增强型机器人系统存在严重的漏洞，容易受到黑客攻击和控制。

高精度预测蛋白构象变化，中国科大、上科大通用深度学习模型

编辑 | KX预测蛋白质构象变化是计算生物学和人工智能领域的一大挑战。主流的 AlphaFold 等算法可以高通量预测蛋白质的静态结构，但对蛋白质构象变化预测却束手无策。为了解决这个问题，中国科学技术大学和上海科技大学的研究人员，提出了一种新颖的深度学习策略，即利用高通量生物物理采样来规避与蛋白质构象转变相关的数据匮乏。

DeepSeek首发国产类o1模型！人人可以免费使用！

20日晚8点，DeepSeek在自己官方公众号上放出了一个大杀器：全新自研的DeepSeek-R1-Lite 预览版正式上线。据介绍，DeepSeek R1 系列模型使用强化学习训练，推理过程包含大量反思和验证，思维链长度可达数万字。该系列模型在数学、代码以及各种复杂逻辑推理任务上，取得了媲美 o1-preview 的推理效果，并为用户展现了 o1 没有公开的完整思考过程。

在GenAI的成功没有固定框架，且几乎没有成功的生产案例可供借鉴的情况下，IT领导者们即便开始关注一些最佳实践，也仍然只有粗略的路线图。对于IT领导者而言，将GenAI的潜力转化为商业价值的道路仍然陡峭且令人畏惧，但GenAI路线图的关键组成部分——数据、平台和技能——正在不断发展并变得更加明确。这是上周在MIT举办的Big.AI@MIT活动中，“GenAI在商业中的下一步”小组讨论的关键要点，该讨论由埃森哲的首席AI官(CAIO)兰·关(Lan Guan)主持。

基于AI的深度伪造检测的局限性

在采访中，Reality Defender的首席执行官Ben Colman探讨了在实际应用中检测高质量深度伪造内容(deepfake)所面临的挑战。他讨论了水印技术、基于AI的检测以及新兴技术在确保媒体真实性方面的潜力及其局限性。 Colman还强调了公众教育、针对特定行业的AI实施以及积极的研究合作对于应对快速发展的深度伪造策略的重要性。

我国中部地区最大智算中心在河南郑州正式投产，全部建成后规模超 10 万 P

该中心全部建成后，将成为中部最大、国内领先万卡算力集群，填补河南省在超大规模智算中心方面的空白。

如何为深度学习选择优秀 GPU ？

Hello folks，我是 Luga，今天我们继续来聊一下人工智能生态相关技术 - 用于加速构建 AI 核心算力的 GPU 硬件技术。众所周知，对于绝大多数的深度学习模型的训练，尤其是参数规模较为庞大的模型，其往往是整个开发流程中最耗时、资源消耗最大的环节。在传统的 CPU .

OpenAI怒斥Scaling撞墙论！o1已产生推理直觉潜力巨大

最近，OpenAI高级研究副总裁Mark Chen在炉边谈话中，正式否认「Scaling Law撞墙论」。他表示，并没有看到Scaling Law撞墙，甚至OpenAI还有两个范例——o系列和GPT系列，来保持这种Scaling。用他的话说，「我们准确地掌握了需要解决的技术挑战」。

指令跟随大比拼！Meta发布多轮多语言基准Multi-IF：覆盖8种语言，超4500种任务

在大语言模型（LLMs）不断发展的背景下，如何评估这些模型在多轮对话和多语言环境下的指令遵循（instruction following）能力，成为一个重要的研究方向。现有评估基准多集中于单轮对话和单语言任务，难以揭示复杂场景中的模型表现。最近，Meta GenAI团队发布了一个全新基准Multi-IF，专门用于评估LLM在多轮对话和多语言指令遵循(instruction following)中的表现，包含了4501个三轮对话的多语言指令任务，覆盖英语、中文、法语、俄语等八种语言，以全面测试模型在多轮、跨语言场景下的指令执行能力。