AI
本地运行 DeepSeek-R1 的成本究竟多高?
DeepSeek 让人们对大规模生成式模型的追求更进一步,甚至有人想在本地跑下规模高达 671B 参数的版本。 但要在家里开这种“巨无霸”,可不是闹着玩的:光是推理就对硬件提出了非常高的要求。 这篇文章将大致拆解一下,如果真想在个人电脑上运行 DeepSeek-R1,可能需要的硬件和费用是多少。
谷歌憋大招:Gemini 将内嵌 AI 视频生成,让人人都能是导演
科技媒体 Android Authority 昨日(2 月 18 日)发布博文,报道称谷歌旗下 AI 助手 Gemini 即将具备生成视频能力。该功能虽未正式上线,但种种迹象表明,谷歌正在积极为 Gemini 添加新功能,旨在打造更强大的 AI 工具。
DeepSeek-R1详细解读!
DeepSeek-R1爆火,今天来详细看下。 论文地址::::现有LLMs在推理任务上的改进主要依赖监督微调(SFT)和后训练(Post-Training)方法,但这些方法需要大量人工标注数据且成本高昂。 OpenAI的o1系列模型虽通过扩展推理链(Chain-of-Thought, CoT)提升了性能,但其测试时扩展仍存在挑战。
超简单:三步教你搞定DeepSeek本地部署
最近,国产AI神器DeepSeek爆火,其深度思考能力完美的体现了DeepSeek先进的算力和优越的性能。 可以这么说,DeepSeek的问世,推动了AI大模型的跨越式发展。 作为一款AI领域的现象级产品,DeepSeek的用户量在短时间内暴增,服务器也被大量攻击,不少小伙伴在使用DeepSeek时,经常会出现服务器繁忙的提示。
深圳回应 AI 公务员上岗 :仅辅助政务,不能单独决策
“‘AI 数智员工’是 AI 助手,可辅助开展公共管理和服务,并不能单独决策,不能算是‘AI 公务员’。”深圳市福田区政务服务和数据管理局党组成员、副局长高增在采访中表示。(南方日报)
印度最大支付平台Paytm应用内推出 Perplexity AI 智能搜索功能
最近,Paytm 应用在 Android 和 iPhone 上推出了新的 AI 智能搜索工具 ——Perplexity。 这一新功能被称为 “问 AI”,用户可以在首页的 “免费工具” 部分找到它。 通过这一功能,用户可以提出问题,Perplexity 会在特定的界面上提供带有引用的回答,帮助用户快速获取所需信息。
Kimi大幅削减广告预算,DeepSeek崛起令月之暗面压力倍增
在国内 AI 领域,Kimi 曾是备受关注的创业产品,但随着 DeepSeek 的崛起,这一局面正悄然改变。 近日,月之暗面公司宣布将大幅削减 Kimi 的广告投放预算,暂停多个安卓渠道的推广以及与第三方广告平台的合作,这一决策显然是对 DeepSeek 迅猛发展的直接反应。 根据界面新闻的报道,DeepSeek 在短短数十天内成功吸引了3500万日活跃用户,而 Kimi 在过去一年多的时间内投入大量资金,日活跃用户却未能突破千万。
AI应用圈大事周更新,Figure创始人推荐:国产机器人硬抗“胸口碎大石”,宇树机器人丝滑跳舞算法更新,日本惊现攻击人类的机器狗
出品 | 51CTO技术栈(微信号:blog51cto)开工后的第一周,DeepSeek的各种“疯狂接入”有没有把你弄蒙圈了,还是冷静下来看一看有哪些被你忽视的关键AI应用和产品的发布吧! 下面这份重要的总结出于Figure创始人Brett Adcock的汇总,值得大家细细研究。 Brett 汇总了来自Booster Robotics、Adobe、OpenAI、Figure、字节跳动、谷歌、Perplexity、Apptronik、Humanoid、Mentee Robotics等公司的最新消息。
AI看照片,几秒就能地理定位!因太危险被公司主动关闭,正向警方推销
在看刑侦片的时候,每当破案遇阻,你是否想象过,一种能够仅基于一张嫌疑人出现的场景照片,就即刻定位到场景所在地的具体经纬度的技术呢? 现在,这种想象,已然成为现实! 初创AI公司graylark发布了一项名为「GeoSpy」的系列产品,因其是一个革命性的照片地理定位系统,近来引发热议。
终于找到答案了!DeepSeek凭啥能给出这么丰富的答案 - 反事实推理(上)
为什么deepseek的回答如此丰富,如此多维度? 今天和大家聊聊,deepseek核心技术(之一):反事实推理。 什么是反事实推理?
马斯克“地表最强”Grok 3炸场,竞技场首超1400分
刚刚,马斯克xAI的Grok 3终于亮相(超300万人次围观)! 一出道即巅峰,竞技场(lmarena.ai)官方给出了这样的评价:Grok 3是首个突破1400分的模型,并且在所有类别中排名第一。 而且,Grok 3还是首个在10万张(后扩展到20万)H100集群上训练出的模型。
微软开放3.1T token高质量数据!通用/代码/数学/问答,全领域超越开源
过去几年,大型语言模型(LLMs)已经成为人工智能研究的一个关键领域,从大规模的自然语言数据中学习,使其能够以极高的准确率执行各种与语言相关的任务。 得益于模型扩展性方面的进展,研究人员能够创建具有前所未有复杂度的模型。 当前的研究趋势是致力于构建更大、更复杂的模型,具有数百/数千亿个参数,但大型语言模型的训练需要海量的训练数据,尤其随着模型参数量的上升,对于优质数据数量的要求也将进一步加大,优质数据量的缺乏极大限制了模型能力的进一步增长。
强化学习Scaling Law错了?无需蒸馏,数据量只要1/6,效果还更好
DeepSeek-R1带火了使用强化学习训练LLM。 在训练中,AI灵机一动,让作者耳目一新,甚至因此惊叹到:这就是强化学习的力与美! DeepSeek-R1-Zero惊艳了研究人员然而,对RL训练的理解存在空白:这些工作的训练数据的透明度有限,谁知道是方法好还是数据集质量好?
中国首个AI短剧模型开源,4090秒生好莱坞级大片!人人拍短剧时代来临
2月18日,昆仑万维开源中国首个面向AI短剧创作的视频生成模型SkyReels-V1、中国首个SOTA级别基于视频基座模型的表情动作可控算法SkyReels-A1。 开源地址(SkyReels-V1):(SkyReels-A1):::skyreels.ai针对当前全球AI视频生成模型和产品不开源、用不到、费用高、不好用等痛点,昆仑万维SkyReels一次性开源SkyReels-V1和SkyReels-A1两个SOTA级别的模型和算法,将面向AI短剧创作的技术成果回馈开源社区和AIGC用户。 而这只是在AI视频方向开源道路上的起点,未来将陆续开源更多面向AI短剧的优秀研究成果。
OpenAI突宣开源计划:端侧模型or小模型二选一!奥特曼在线征集投票全球最大开源视频模型,现在也Created in China了,阶跃出品
刚刚,阶跃星辰联合吉利汽车集团,开源了两款多模态大模型! 新模型共2款:全球范围内参数量最大的开源视频生成模型Step-Video-T2V行业内首款产品级开源语音交互大模型Step-Audio多模态卷王开始开源多模态模型,其中Step-Video-T2V采用的还是最为开放宽松的MIT开源协议,可任意编辑和商业应用。 (老规矩,GitHub、抱抱脸、魔搭直通车可见文末)在两款大模型的研发过程中,双方在算力算法、场景训练等领域优势互补,“显著增强了多模态大模型的性能表现”。
嚯!大语言扩散模型来了,何必只预测下一个token | 人大高瓴&蚂蚁
用扩散模型替代自回归,大模型的逆诅咒有解了!人大高瓴人工智能研究院、蚂蚁共同提出LLaDA(a Large Language Diffusion with mAsking)。 LLaDA-8B在上下文学习方面与LLaMA3-8B能力相当,而且在反转诗歌任务中超越GPT-4o。 在大语言模型领域,反转诗歌是一个特殊任务,它用来评估模型在处理语言模型的双向依赖关系和逻辑推理能力。
OpenAI 要开源新模型?CEO 奥尔特曼公开征求意见
OpenAI 首席执行官萨姆・奥尔特曼于当地时间 2 月 17 日在 X 社交平台上发文,就公司下一个开源项目的方向征询公众意见。他提出了两种可能的开源模型方向:一种是“相当小但仍需在 GPU 上运行的 o3-mini 级模型”,另一种则是“尽可能优化的手机大小模型”。这或许意味着 OpenAI 即将开源新的大模型,也将是 2019 年 OpenAI 开源 GPT-2 之后再次开源某个大模型。
OpenAI 联合创始人 Sutskever 的 AI 初创公司估值飙升至 300 亿美元,目标打造安全超级智能
据彭博社报道,知情人士透露,OpenAI 联合创始人伊利亚・苏斯科弗(Ilya Sutskever)正在以超过 300 亿美元(IT之家备注:当前约 2179.12 亿元人民币)的估值为其初创公司 Safe Superintelligence(以下简称 SSI)筹集超过 10 亿美元(当前约 72.64 亿元人民币)的资金,使 SSI 一举跻身全球最有价值的私人科技公司行列。