理论

官宣！OpenAI前CTO新公司：北大校友翁荔加盟，创始29人2/3来自OpenAI

正式官宣！ OpenAI前CTO Mira Murati 成立新公司——Thinking Machines Lab。整个创业团队可以说前所未有之豪华了，三分之二的都是以前的OpenAI旧部追随——其中包括OpenAI前研究（后训练）副总裁Barret Zoph，担任公司CTO；刚刚离职Anthropic、OpenAI离职联创John Schulman，任公司首席科学家，还有包括前OpenAI VP、北大校友翁荔等等。

2/19/2025 9:20:30 AM

量子位

Deepseek 这么厉害，普通人怎么用好它？

最近，Deepseek 的风头可谓是一时无两，相关消息一波接着一波。它强大的能力让人惊叹不已，写代码、做翻译、生成文案……简直无所不能！不少小伙伴跃跃欲试，却又担心自己不是程序员、不会写代码，用不好这么“高大上”的工具。

2/19/2025 8:50:05 AM

架构精进之路

本地运行 DeepSeek-R1 的成本究竟多高？

DeepSeek 让人们对大规模生成式模型的追求更进一步，甚至有人想在本地跑下规模高达 671B 参数的版本。但要在家里开这种“巨无霸”，可不是闹着玩的：光是推理就对硬件提出了非常高的要求。这篇文章将大致拆解一下，如果真想在个人电脑上运行 DeepSeek-R1，可能需要的硬件和费用是多少。

2/19/2025 8:33:18 AM

dev

前OpenAI CTO另立门户，2/3 ChatGPT骨干被挖！北大校友Lilian Weng加盟

离职近5个月，OpenAI前CTO Mira Murati终于官宣了！新公司名叫「思考机器实验室」（Thinking Machines Lab），将人类价值观编码到AI模型中，让其更安全、更可靠。 Mira任CEO，OpenAI前后训练研究副总Barret Zoph任CTO，OpenAI联创John Schulman任首席科学家。

2/19/2025 8:29:27 AM

新智元

DeepSeek-R1详细解读！

DeepSeek-R1爆火，今天来详细看下。论文地址：：：：现有LLMs在推理任务上的改进主要依赖监督微调（SFT）和后训练（Post-Training）方法，但这些方法需要大量人工标注数据且成本高昂。 OpenAI的o1系列模型虽通过扩展推理链（Chain-of-Thought, CoT）提升了性能，但其测试时扩展仍存在挑战。

2/19/2025 8:00:00 AM

GoldMa

基于Deepseek的安全分析工具设计实践

一、分享背景DeepSeek近日红的发紫，春节前发现一个叫Deepseek的LLM送 10 RMB的Token!!!，正巧符合生产工作中拥抱大模型的主旋律，又本着有羊毛必薅的原则配合B站ollama本地部署喂饭视频起了阿里qwen2.5(1.5b）就行Coding辅助。 ollama本地部署Coding模型复制step2:step3:效果：二、工具需求分析GUI化，免去命令行操作，12-80年龄段各类人群均适用。固定的LLM回复结果，使每一次提问都能得到相同格式的回答（区分在线提问和工具脚本的关键)。

2/19/2025 7:59:06 AM

沈家伟

超简单：三步教你搞定DeepSeek本地部署

最近，国产AI神器DeepSeek爆火，其深度思考能力完美的体现了DeepSeek先进的算力和优越的性能。可以这么说，DeepSeek的问世，推动了AI大模型的跨越式发展。作为一款AI领域的现象级产品，DeepSeek的用户量在短时间内暴增，服务器也被大量攻击，不少小伙伴在使用DeepSeek时，经常会出现服务器繁忙的提示。

2/19/2025 7:53:19 AM

冰河

新手必看：用DeepSeek轻松产出爆款，三分钟掌握自媒体全流程

今天来分享如何利用 DeepSeek 高效创作自媒体文章，自媒体账号的打造和内容创作是一个系统性工程。本文将详细拆解如何利用 DeepSeek 完成从账号定位到爆款内容创作的全流程，帮助你快速脱颖而出。一、账号定位与赛道分析：知己知彼，精准切入1.

2/19/2025 12:07:56 AM

宇宙之一粟

自动化、高精度，告别人工测量！Meta SAM模型高效解析复杂纳米颗粒

编辑 | 2049在材料科学领域，纳米颗粒的形态特征直接决定了其物理化学性质与应用潜力。然而，面对电子显微镜图像中数以千计的颗粒，传统的人工测量方法需要耗费数十小时，且易受主观偏差影响；而基于分水岭算法等半自动工具，则难以准确分割高度重叠的复杂颗粒结构。德国康斯坦茨大学与巴西米纳斯吉拉斯联邦大学的研究团队提出了一种创新解决方案：利用预训练人工智能模型（Segment Anything Model， SAM）实现纳米颗粒的自动化分割与形态分析。

2/18/2025 4:26:00 PM

ScienceAI

AI应用圈大事周更新，Figure创始人推荐：国产机器人硬抗“胸口碎大石”，宇树机器人丝滑跳舞算法更新，日本惊现攻击人类的机器狗

出品 | 51CTO技术栈（微信号：blog51cto）开工后的第一周，DeepSeek的各种“疯狂接入”有没有把你弄蒙圈了，还是冷静下来看一看有哪些被你忽视的关键AI应用和产品的发布吧！下面这份重要的总结出于Figure创始人Brett Adcock的汇总，值得大家细细研究。 Brett 汇总了来自Booster Robotics、Adobe、OpenAI、Figure、字节跳动、谷歌、Perplexity、Apptronik、Humanoid、Mentee Robotics等公司的最新消息。

2/18/2025 4:25:53 PM

AI看照片，几秒就能地理定位！因太危险被公司主动关闭，正向警方推销

在看刑侦片的时候，每当破案遇阻，你是否想象过，一种能够仅基于一张嫌疑人出现的场景照片，就即刻定位到场景所在地的具体经纬度的技术呢？现在，这种想象，已然成为现实！初创AI公司graylark发布了一项名为「GeoSpy」的系列产品，因其是一个革命性的照片地理定位系统，近来引发热议。

2/18/2025 3:30:00 PM

新智元

“地表最强”Grok 3震撼登场，马斯克演示却“小翻车”，网友调侃：加上擎天柱才是AGI！几个月后还将开源！

出品 | 51CTO技术栈（微信号：blog51cto）编辑 | 伊风、言征跳票多次！ Grok 3终于来了！此前，DeepSeek创造的破圈奇迹，把硅谷的大模型公司全部笼罩在阴影之下。

2/18/2025 3:16:25 PM

伊风

影子AI：CISO常忽视的安全隐患

在企业数字化转型的浪潮中，一股新的力量正悄然兴起，却也让安全领导者和CISO们头疼不已——那就是影子AI。这些并非来自外部攻击者的威胁，而是由本应值得信赖的员工，在没有IT和安全部门监督或批准的情况下，自行创建的AI应用。它们如同数字世界的“兴奋剂”，让使用者能在短时间内完成更细致的工作，却也让企业的安全边界变得岌岌可危。

2/18/2025 3:13:29 PM

Louis Columbus

终于找到答案了！DeepSeek凭啥能给出这么丰富的答案 - 反事实推理（上）

为什么deepseek的回答如此丰富，如此多维度？今天和大家聊聊，deepseek核心技术（之一）：反事实推理。什么是反事实推理？

2/18/2025 3:13:13 PM

58沈剑

企业AI采用规则变革：IT领导者面临的新机遇与挑战

一场AI领域的“地震”正悄然发生，而这场“地震”的震源，正是初创企业DeepSeek推出的R1 AI模型。这一模型的横空出世，不仅让美国科技股市值蒸发万亿，更让OpenAI、Alphabet、Meta等AI巨头措手不及。 DeepSeek声称，其推理模型性能媲美OpenAI的顶尖产品，速度翻倍，成本却仅为十分之一。

2/18/2025 3:11:16 PM

Martin De Saulles

马斯克“地表最强”Grok 3炸场，竞技场首超1400分

刚刚，马斯克xAI的Grok 3终于亮相（超300万人次围观）！一出道即巅峰，竞技场（lmarena.ai）官方给出了这样的评价：Grok 3是首个突破1400分的模型，并且在所有类别中排名第一。而且，Grok 3还是首个在10万张（后扩展到20万）H100集群上训练出的模型。

2/18/2025 3:09:07 PM

量子位

微软开放3.1T token高质量数据！通用/代码/数学/问答，全领域超越开源

过去几年，大型语言模型（LLMs）已经成为人工智能研究的一个关键领域，从大规模的自然语言数据中学习，使其能够以极高的准确率执行各种与语言相关的任务。得益于模型扩展性方面的进展，研究人员能够创建具有前所未有复杂度的模型。当前的研究趋势是致力于构建更大、更复杂的模型，具有数百/数千亿个参数，但大型语言模型的训练需要海量的训练数据，尤其随着模型参数量的上升，对于优质数据数量的要求也将进一步加大，优质数据量的缺乏极大限制了模型能力的进一步增长。

2/18/2025 3:03:58 PM

新智元

强化学习Scaling Law错了？无需蒸馏，数据量只要1/6，效果还更好

DeepSeek-R1带火了使用强化学习训练LLM。在训练中，AI灵机一动，让作者耳目一新，甚至因此惊叹到：这就是强化学习的力与美！ DeepSeek-R1-Zero惊艳了研究人员然而，对RL训练的理解存在空白：这些工作的训练数据的透明度有限，谁知道是方法好还是数据集质量好？

2/18/2025 3:02:13 PM

新智元

资讯热榜

上海AI实验室开源InternVL3系列多模态大型语言模型 Haisnap横空出世，小白用户也能轻松打造AI应用「交交」媲美GPT-4o！上海交大推出口语对话情感大模型，首个纯学术界自研！ OpenAI开源超Agent:Codex CLI,五小时内破 5000 颗星 ChatGPT重磅更新：新增图像库功能，可查看自己用GPT生成的所有图片本地部署DeepSeek+DiFy平台构建智能体应用 kimi开源视觉语言模型 Kimi-VL 与 Kimi-VL-Thinking，多项基准超越 GPT-4o OpenAI 发布“智能体构建实战指南”实用性文档（附文档资源）

标签云

人工智能 OpenAI AIGC AI ChatGPT DeepSeek AI绘画数据机器人谷歌模型大模型 Midjourney 智能用户学习开源 GPT 微软 Meta AI创作图像技术论文 Stable Diffusion 马斯克 Gemini 算法蛋白质生成式芯片代码英伟达腾讯神经网络计算研究 Sora AI for Science 3D Anthropic AI设计机器学习 GPU 开发者场景华为预测伟达 Transformer 百度人形机器人苹果深度学习 AI视频模态字节跳动 xAI 驾驶文本搜索大语言模型 Claude Copilot 具身智能神器推荐 LLaMA 算力安全应用视频生成科技视觉亚马逊干货合集 2024 AGI 特斯拉大型语言模型训练