理论
刚刚,DeepSeek官宣:下周将是重磅开源周!网友:真正的OpenAI来了!
DeepSeek在X上发布推文,为即将到来的开源周预热。 下周起,DeepSeek将连续开源5个代码库! DeepSeek的通知翻译如下:我们是一个小团队@deepseek_ai ,正在探索 AGI。
2/21/2025 3:18:20 PM
抛弃OpenAI后,Figure AI发布新一代人形机器人Helix模型
当地时间2月20日,机器人初创公司Figure AI宣布发布其最新成果——Helix模型。 这是一款用于通用人形机器人控制的视觉-语言-动作(VLA)模型,标志着人形机器人技术的重大突破。 Helix模型的关键技术突破.
2/21/2025 2:53:40 PM
Gartner预测到2027年,跨境GenAI滥用引起的AI数据泄露比例将达到40%
Gartner预测,到2027年,跨境生成式人工智能(GenAI)引起的AI相关数据泄露比例将超过40%。 GenAI在终端用户中的普及速度已超过了数据治理和安全措施的发展速度,而支持这些技术所需的集中算力引发了对数据本地化的担忧。 Gartner研究副总裁Joerg .
2/21/2025 2:50:19 PM
DeepSeek开源模型重塑法证审计,个人本地做RAG+微调,25年多试试
全球82亿人口,网民55.6亿,而ChatGPT坐拥3.5亿全球月活,渗透率算下来也有6%左右了。 但这还是DeepSeek-R1开源之前的故事。 1/20 开源以来,DeepSeek-R1属实又硬拉高了一大波全球 AI的渗透率,或者换句话说,是解锁了更多的应用场景。
2/21/2025 2:37:21 PM
韦东东
用户破4亿、企业客户翻倍!OpenAI的GPT-5将推进全球AI战争进入白热化阶段!
用户突破4亿、企业客户翻倍、GPT-5即将上线——OpenAI用数据与野心宣告:全球AI战争进入白热化阶段!据首席运营官布拉德·莱特卡普周四在X平台上的帖子称,OpenAI的ChatGPT周活跃用户已突破4亿大关,这一里程碑彰显了该公司在消费者和企业市场日益扩大的影响力。 在OpenAI面临来自埃隆·马斯克的xAI和DeepSeek等竞争对手日益加剧的竞争之际,ChatGPT实现了快速扩张。 这两家公司最近都推出了旨在打破OpenAI主导地位的高性能模型。
2/21/2025 2:23:17 PM
Michael Nuñez
老旧业务系统会如何限制企业AI进展?
当全球企业争相押注AI革命,一场隐秘的“数据饥荒”正悄然蔓延——IDC数据显示,企业12.8%的IT预算被技术债务吞噬,而遗留系统如同生锈的数据管道,既挤占AI弹药库,又掐断创新血液。 IT专家表示,过时的软件应用程序正在成为许多企业采用AI的障碍,其中数据保留能力有限是主要原因之一。 托管服务提供商Ensono的首席战略官布赖恩·克林格贝尔(Brian Klingbeil)表示,由于当时存储成本高昂,数十年前设计的应用程序只能保留有限的数据量,因此这些应用程序也不太可能轻易与AI工具集成。
2/21/2025 2:18:52 PM
Grant Gross
谷歌超硬核教科书来了!Jeff Dean带货揭Gemini训练秘籍:在TPU上scaling
由于深度学习的「黑箱」本性,从业者自我调侃道:如果说深度神经网络是现代版的「炼金术」,我们在古代就是「炼金术士」。 2018年5月3日, Science发表新闻,标题直指「炼金术」,强调加强AI的科学基础但这次的谷歌的团队,却有不一样的看法:在许多方面,深度学习仍然带有一定的「炼金术」色彩,但理解和优化模型性能并不一定如此——即使是在大规模环境下! 近日,谷歌DeepMind科学家Jacob Austint在X上, 发布了基于JAX和TPU的大模型Scaling教科书《How to Sacle Your Model》。
2/21/2025 1:45:00 PM
新智元
「卖铲子」也疯狂!美国「DeepSeek概念」AI初创,估值达33亿美元
放眼全球,最大的投资风口非AI莫属了。 昨日,美国明星初创Together AI宣布,已完成3.05亿美元B轮融资,总估值达到33亿美元。 Together AI表示,这项投资将加速他们在构建基于开源模型的现代AI应用,以及利用他们即将大规模部署的英伟达Blackwell GPU训练定制模型方面的领先地位,也能巩固他们作为首选AI云供应商的地位。
2/21/2025 1:40:00 PM
新智元
大模型扩展新维度:Scaling Down、Scaling Out
本文由悉尼大学计算机学院王云柯,李言蹊和徐畅副教授完成。 王云柯是悉尼大学博士后,李言蹊是悉尼大学三年级博士生,徐畅副教授是澳洲ARC Future Fellow,其团队长期从事机器学习算法、生成模型等方向的研究。 近年来, Scaling Up 指导下的 AI 基础模型取得了多项突破。
2/21/2025 1:20:00 PM
机器之心
机器人视觉控制新范式!ByteDance Research新算法实现通过性能SOTA
世界模型(World Model)作为近年来机器学习和强化学习的研究热点,通过建立智能体对其所处环境的一种内部表征和模拟,能够加强智能体对于世界的理解,进而更好地进行规划和决策。 在强化学习领域中,世界模型通常被建模为一个神经网络,通过历史状态和动作,预测未来可能出现的状态。 其中,Dreamer 算法在多种模拟环境的成功表现让我们看到了世界模型优秀的表征和泛化能力。
2/21/2025 1:00:00 PM
机器之心
蚕食人类权力不用AGI降临!「温水煮青蛙」足以让AI渐进式失控
在我们的认知中,政府、经济体系等大规模社会系统就应该由人类主导,产生满足人类偏好的结果。 但在AI时代,这个命题就逐渐站不住脚了。 原因在于,人类与这些系统的目标一致性并不是自发的,而是仰赖于两种有效维持目标对齐的方式:明确的人类行为(如选举和消费者用脚投票),以及经由人类劳动和认知过程隐式方式。
2/21/2025 12:58:02 PM
新智元
阿里重回伟大!吴泳铭财报讲话全文曝光:开发者会天然选择阿里云,发布旗舰推理模型!未来三年,阿里对基础设施投资将超过去十年总和!
出品 | 51CTO技术栈(微信号:blog51cto)编辑 | 伊风昨晚,阿里2025财年Q3财报新鲜出炉,同比增长8%,可以说成绩相当亮眼! 淘天增收继续加快,阿里云增速重回加速状态,多项核心业务增速达到年内最佳。 财报显示:阿里第三季度营收增速创逾一年以来最快,资本开支大增,核心业务加速增长,淘天收入增长加快,阿里云收入重回双位数增长(13%),增幅创约两年以来最大,AI相关产品收入连续六季度保持三位数增长。
2/21/2025 12:40:19 PM
伊风
出人意料!DeepSeek-R1用的GRPO其实没必要?规模化强化学习训练用PPO就够了
DeepSeek-R1 非常热门,而在其公布的训练配方中,GRPO(Group Relative Policy Optimization)非常关键,是 DeepSeek-R1 核心的强化学习算法。 PPO 与 GRPO 的对比,来自论文《DeepSeekMath: Pushing the Limits of Mathematical Reasoning in Open Language Models》相较于 PPO,GRPO 去掉了价值模型,而是通过分组分数来估计基线,从而可极大减少训练资源。 DeepSeek-R1 技术报告中写到:「具体来说,我们使用 DeepSeek-V3-Base 作为基础模型,并采用 GRPO 作为强化学习框架来提高模型的推理性能。
2/21/2025 12:24:14 PM
机器之心
“万模裸奔”,DeepSeek正颠覆网络安全行业游戏规则
对于企业而言,AI既是提升生产力的强大工具,同时也为攻击者和恶意内部人员提供了“大杀器”。 随着生成式AI(例如ChatGPT和DeepSeek)在企业和政府机构中的广泛应用和不安全部署,“万模裸奔”产生的数据安全风险已经到了失控的边缘。 2025年是AI安全元年,首席信息安全官(CISO)们必须提前做好准备,应对“万模裸奔”引发的数据安全危机。
2/21/2025 11:23:59 AM
佚名
OpenAI百万美元豪测:顶级大模型取代不了程序员
当Sam Altman宣称大模型将取代"低阶程序员"时,OpenAI自家的最新研究却给出了相反的答案。 该研究联合百名工程师开展SWE-Lancer基准测试,结果显示:面对价值百万美元的真实软件开发任务,三大顶尖大模型的总收入竟不足21%,最强者Claude 3.5也仅解决26%技术问题。 这场AI与人类程序员的"抢饭碗"对决,暂时以机器的惨败告终。
2/21/2025 11:08:46 AM
佚名
前OpenAI CTO 成立思维机器实验室
前OpenAI首席技术官Mira Murati宣布成立新的思维机器实验室(Thinking Machines Lab)。 主要有三个方向:帮助人们调整AI系统以满足他们的具体需求;开发坚实的基础以构建更强大的AI系统;培养开放科学的文化,帮助整个领域理解和改进这些系统。 以下是Thinking Machines Lab的官网介绍:思维机器实验室(Thinking Machines Lab)是一家人工智能研究与产品公司。
2/21/2025 11:00:00 AM
AIGC开放社区
马斯克发布Grok 3:20万GPU激发全球竞争新动力
2025年2月,埃隆·马斯克旗下的人工智能初创企业 xAI 正式发布了其最新大模型——Grok 3。 此次发布不仅标志着 xAI 在算力和推理能力上的重大突破,也预示着全球人工智能领域竞争格局的进一步洗牌。 颠覆性的算力升级据报道,Grok 3 的训练得益于其庞大的数据中心“Colossus”,该中心拥有约20万块英伟达 H100 GPU,相较于上一代 Grok 2,Grok 3 在计算资源上实现了10倍的飞跃。
2/21/2025 10:51:47 AM
不可错过的AI新闻
两万字长文深度解密DeepSeek-R1、Kimi 1.5,强推理模型凭什么火出圈?
刚刚过去的春节,DeepSeek-R1 推理大模型引爆了国内外 AI 社区,并火出了圈。 最近,各个行业又掀起了接入 DeepSeek 的狂潮,大家唯恐落后于人。 北大 AI 对齐团队对包括 DeepSeek-R1、Kimi-K1.5在内的一些强推理模型进行了 2 万字的技术解读,也是此前 o1 解读(北大对齐团队独家解读:OpenAI o1开启「后训练」时代强化学习新范式)的续作。
2/21/2025 10:34:49 AM
机器之心
资讯热榜
标签云
人工智能
OpenAI
AIGC
AI
ChatGPT
DeepSeek
AI绘画
数据
机器人
谷歌
模型
大模型
Midjourney
智能
用户
学习
开源
GPT
微软
Meta
AI创作
图像
技术
论文
Stable Diffusion
马斯克
Gemini
算法
蛋白质
生成式
芯片
代码
英伟达
腾讯
神经网络
计算
研究
Sora
AI for Science
3D
Anthropic
AI设计
机器学习
GPU
开发者
场景
华为
预测
伟达
Transformer
百度
人形机器人
苹果
深度学习
AI视频
模态
字节跳动
xAI
驾驶
文本
搜索
大语言模型
Claude
Copilot
具身智能
神器推荐
LLaMA
算力
安全
应用
视频生成
科技
视觉
亚马逊
干货合集
2024
AGI
特斯拉
大型语言模型
训练