理论
官宣!OpenAI前CTO新公司:北大校友翁荔加盟,创始29人2/3来自OpenAI
正式官宣! OpenAI前CTO Mira Murati 成立新公司——Thinking Machines Lab。 整个创业团队可以说前所未有之豪华了,三分之二的都是以前的OpenAI旧部追随——其中包括OpenAI前研究(后训练)副总裁Barret Zoph,担任公司CTO;刚刚离职Anthropic、OpenAI离职联创John Schulman,任公司首席科学家,还有包括前OpenAI VP、北大校友翁荔等等。
2/19/2025 9:20:30 AM
量子位
Deepseek 这么厉害,普通人怎么用好它?
最近,Deepseek 的风头可谓是一时无两,相关消息一波接着一波。 它强大的能力让人惊叹不已,写代码、做翻译、生成文案……简直无所不能! 不少小伙伴跃跃欲试,却又担心自己不是程序员、不会写代码,用不好这么“高大上”的工具。
2/19/2025 8:50:05 AM
架构精进之路
本地运行 DeepSeek-R1 的成本究竟多高?
DeepSeek 让人们对大规模生成式模型的追求更进一步,甚至有人想在本地跑下规模高达 671B 参数的版本。 但要在家里开这种“巨无霸”,可不是闹着玩的:光是推理就对硬件提出了非常高的要求。 这篇文章将大致拆解一下,如果真想在个人电脑上运行 DeepSeek-R1,可能需要的硬件和费用是多少。
2/19/2025 8:33:18 AM
dev
前OpenAI CTO另立门户,2/3 ChatGPT骨干被挖!北大校友Lilian Weng加盟
离职近5个月,OpenAI前CTO Mira Murati终于官宣了! 新公司名叫「思考机器实验室」(Thinking Machines Lab),将人类价值观编码到AI模型中,让其更安全、更可靠。 Mira任CEO,OpenAI前后训练研究副总Barret Zoph任CTO,OpenAI联创John Schulman任首席科学家。
2/19/2025 8:29:27 AM
新智元
DeepSeek-R1详细解读!
DeepSeek-R1爆火,今天来详细看下。 论文地址::::现有LLMs在推理任务上的改进主要依赖监督微调(SFT)和后训练(Post-Training)方法,但这些方法需要大量人工标注数据且成本高昂。 OpenAI的o1系列模型虽通过扩展推理链(Chain-of-Thought, CoT)提升了性能,但其测试时扩展仍存在挑战。
2/19/2025 8:00:00 AM
GoldMa
基于Deepseek的安全分析工具设计实践
一、分享背景DeepSeek近日红的发紫,春节前发现一个叫Deepseek的LLM送 10 RMB的Token!!!,正巧符合生产工作中拥抱大模型的主旋律,又本着有羊毛必薅的原则配合B站ollama本地部署喂饭视频起了阿里qwen2.5(1.5b)就行Coding辅助。 ollama本地部署Coding模型复制step2:step3:效果:二、工具需求分析GUI化,免去命令行操作,12-80年龄段各类人群均适用。 固定的LLM回复结果,使每一次提问都能得到相同格式的回答(区分在线提问和工具脚本的关键)。
2/19/2025 7:59:06 AM
沈家伟
超简单:三步教你搞定DeepSeek本地部署
最近,国产AI神器DeepSeek爆火,其深度思考能力完美的体现了DeepSeek先进的算力和优越的性能。 可以这么说,DeepSeek的问世,推动了AI大模型的跨越式发展。 作为一款AI领域的现象级产品,DeepSeek的用户量在短时间内暴增,服务器也被大量攻击,不少小伙伴在使用DeepSeek时,经常会出现服务器繁忙的提示。
2/19/2025 7:53:19 AM
冰河
新手必看:用DeepSeek轻松产出爆款,三分钟掌握自媒体全流程
今天来分享如何利用 DeepSeek 高效创作自媒体文章,自媒体账号的打造和内容创作是一个系统性工程。 本文将详细拆解如何利用 DeepSeek 完成从账号定位到爆款内容创作的全流程,帮助你快速脱颖而出。 一、账号定位与赛道分析:知己知彼,精准切入1.
2/19/2025 12:07:56 AM
宇宙之一粟
自动化、高精度,告别人工测量!Meta SAM模型高效解析复杂纳米颗粒
编辑 | 2049在材料科学领域,纳米颗粒的形态特征直接决定了其物理化学性质与应用潜力。 然而,面对电子显微镜图像中数以千计的颗粒,传统的人工测量方法需要耗费数十小时,且易受主观偏差影响;而基于分水岭算法等半自动工具,则难以准确分割高度重叠的复杂颗粒结构。 德国康斯坦茨大学与巴西米纳斯吉拉斯联邦大学的研究团队提出了一种创新解决方案:利用预训练人工智能模型(Segment Anything Model, SAM)实现纳米颗粒的自动化分割与形态分析。
2/18/2025 4:26:00 PM
ScienceAI
AI应用圈大事周更新,Figure创始人推荐:国产机器人硬抗“胸口碎大石”,宇树机器人丝滑跳舞算法更新,日本惊现攻击人类的机器狗
出品 | 51CTO技术栈(微信号:blog51cto)开工后的第一周,DeepSeek的各种“疯狂接入”有没有把你弄蒙圈了,还是冷静下来看一看有哪些被你忽视的关键AI应用和产品的发布吧! 下面这份重要的总结出于Figure创始人Brett Adcock的汇总,值得大家细细研究。 Brett 汇总了来自Booster Robotics、Adobe、OpenAI、Figure、字节跳动、谷歌、Perplexity、Apptronik、Humanoid、Mentee Robotics等公司的最新消息。
2/18/2025 4:25:53 PM
AI看照片,几秒就能地理定位!因太危险被公司主动关闭,正向警方推销
在看刑侦片的时候,每当破案遇阻,你是否想象过,一种能够仅基于一张嫌疑人出现的场景照片,就即刻定位到场景所在地的具体经纬度的技术呢? 现在,这种想象,已然成为现实! 初创AI公司graylark发布了一项名为「GeoSpy」的系列产品,因其是一个革命性的照片地理定位系统,近来引发热议。
2/18/2025 3:30:00 PM
新智元
“地表最强”Grok 3震撼登场,马斯克演示却“小翻车”,网友调侃:加上擎天柱才是AGI!几个月后还将开源!
出品 | 51CTO技术栈(微信号:blog51cto)编辑 | 伊风、言征跳票多次! Grok 3终于来了! 此前,DeepSeek创造的破圈奇迹,把硅谷的大模型公司全部笼罩在阴影之下。
2/18/2025 3:16:25 PM
伊风
影子AI:CISO常忽视的安全隐患
在企业数字化转型的浪潮中,一股新的力量正悄然兴起,却也让安全领导者和CISO们头疼不已——那就是影子AI。 这些并非来自外部攻击者的威胁,而是由本应值得信赖的员工,在没有IT和安全部门监督或批准的情况下,自行创建的AI应用。 它们如同数字世界的“兴奋剂”,让使用者能在短时间内完成更细致的工作,却也让企业的安全边界变得岌岌可危。
2/18/2025 3:13:29 PM
Louis Columbus
终于找到答案了!DeepSeek凭啥能给出这么丰富的答案 - 反事实推理(上)
为什么deepseek的回答如此丰富,如此多维度? 今天和大家聊聊,deepseek核心技术(之一):反事实推理。 什么是反事实推理?
2/18/2025 3:13:13 PM
58沈剑
企业AI采用规则变革:IT领导者面临的新机遇与挑战
一场AI领域的“地震”正悄然发生,而这场“地震”的震源,正是初创企业DeepSeek推出的R1 AI模型。 这一模型的横空出世,不仅让美国科技股市值蒸发万亿,更让OpenAI、Alphabet、Meta等AI巨头措手不及。 DeepSeek声称,其推理模型性能媲美OpenAI的顶尖产品,速度翻倍,成本却仅为十分之一。
2/18/2025 3:11:16 PM
Martin De Saulles
马斯克“地表最强”Grok 3炸场,竞技场首超1400分
刚刚,马斯克xAI的Grok 3终于亮相(超300万人次围观)! 一出道即巅峰,竞技场(lmarena.ai)官方给出了这样的评价:Grok 3是首个突破1400分的模型,并且在所有类别中排名第一。 而且,Grok 3还是首个在10万张(后扩展到20万)H100集群上训练出的模型。
2/18/2025 3:09:07 PM
量子位
微软开放3.1T token高质量数据!通用/代码/数学/问答,全领域超越开源
过去几年,大型语言模型(LLMs)已经成为人工智能研究的一个关键领域,从大规模的自然语言数据中学习,使其能够以极高的准确率执行各种与语言相关的任务。 得益于模型扩展性方面的进展,研究人员能够创建具有前所未有复杂度的模型。 当前的研究趋势是致力于构建更大、更复杂的模型,具有数百/数千亿个参数,但大型语言模型的训练需要海量的训练数据,尤其随着模型参数量的上升,对于优质数据数量的要求也将进一步加大,优质数据量的缺乏极大限制了模型能力的进一步增长。
2/18/2025 3:03:58 PM
新智元
强化学习Scaling Law错了?无需蒸馏,数据量只要1/6,效果还更好
DeepSeek-R1带火了使用强化学习训练LLM。 在训练中,AI灵机一动,让作者耳目一新,甚至因此惊叹到:这就是强化学习的力与美! DeepSeek-R1-Zero惊艳了研究人员然而,对RL训练的理解存在空白:这些工作的训练数据的透明度有限,谁知道是方法好还是数据集质量好?
2/18/2025 3:02:13 PM
新智元
资讯热榜
标签云
人工智能
OpenAI
AIGC
AI
ChatGPT
DeepSeek
AI绘画
数据
机器人
谷歌
模型
大模型
Midjourney
智能
用户
学习
开源
GPT
微软
Meta
AI创作
图像
技术
论文
Stable Diffusion
马斯克
Gemini
算法
蛋白质
生成式
芯片
代码
英伟达
腾讯
神经网络
计算
研究
Sora
AI for Science
3D
Anthropic
AI设计
机器学习
GPU
开发者
场景
华为
预测
伟达
Transformer
百度
人形机器人
苹果
深度学习
AI视频
模态
字节跳动
xAI
驾驶
文本
搜索
大语言模型
Claude
Copilot
具身智能
神器推荐
LLaMA
算力
安全
应用
视频生成
科技
视觉
亚马逊
干货合集
2024
AGI
特斯拉
大型语言模型
训练