人工智能
本地运行 DeepSeek-R1 的成本究竟多高?
DeepSeek 让人们对大规模生成式模型的追求更进一步,甚至有人想在本地跑下规模高达 671B 参数的版本。 但要在家里开这种“巨无霸”,可不是闹着玩的:光是推理就对硬件提出了非常高的要求。 这篇文章将大致拆解一下,如果真想在个人电脑上运行 DeepSeek-R1,可能需要的硬件和费用是多少。
2/19/2025 8:33:18 AM
dev
DeepSeek-R1详细解读!
DeepSeek-R1爆火,今天来详细看下。 论文地址::::现有LLMs在推理任务上的改进主要依赖监督微调(SFT)和后训练(Post-Training)方法,但这些方法需要大量人工标注数据且成本高昂。 OpenAI的o1系列模型虽通过扩展推理链(Chain-of-Thought, CoT)提升了性能,但其测试时扩展仍存在挑战。
2/19/2025 8:00:00 AM
GoldMa
超简单:三步教你搞定DeepSeek本地部署
最近,国产AI神器DeepSeek爆火,其深度思考能力完美的体现了DeepSeek先进的算力和优越的性能。 可以这么说,DeepSeek的问世,推动了AI大模型的跨越式发展。 作为一款AI领域的现象级产品,DeepSeek的用户量在短时间内暴增,服务器也被大量攻击,不少小伙伴在使用DeepSeek时,经常会出现服务器繁忙的提示。
2/19/2025 7:53:19 AM
冰河
DeepSeek 推出 NSA 技术:加速长上下文训练与推理
在人工智能领域,DeepSeek 团队于近日发布了最新研究成果,推出了一种名为 NSA(Native Sparse Attention)的创新稀疏注意力机制。 这项技术的核心目标是提升长上下文训练和推理的速度,特别是针对现代硬件进行了优化,使得训练和推理的效率大幅提升。 NSA 技术的推出,为人工智能模型的训练带来了显著的变化。
2/18/2025 8:33:00 PM
AI在线
深圳回应 AI 公务员上岗 :仅辅助政务,不能单独决策
“‘AI 数智员工’是 AI 助手,可辅助开展公共管理和服务,并不能单独决策,不能算是‘AI 公务员’。”深圳市福田区政务服务和数据管理局党组成员、副局长高增在采访中表示。(南方日报)
2/18/2025 7:46:55 PM
浩渺
百度第四季度营收341亿元 李彦宏:AI相关投入将带来更大成果
今日,百度公司正式发布了截至2024年12月31日的第四季度及全年财报。 数据显示,百度在2024年第四季度实现营收341亿元,同比下滑2%;全年总营收达到1331亿元,同比下滑1%。 第四季度归属于百度的净利润为52亿元,不按美国通用会计准则的净利润为67亿元;全年归属于百度的净利润为238亿元,不按美国通用会计准则的净利润为270亿元。
2/18/2025 6:00:24 PM
AI在线
自动化、高精度,告别人工测量!Meta SAM模型高效解析复杂纳米颗粒
编辑 | 2049在材料科学领域,纳米颗粒的形态特征直接决定了其物理化学性质与应用潜力。 然而,面对电子显微镜图像中数以千计的颗粒,传统的人工测量方法需要耗费数十小时,且易受主观偏差影响;而基于分水岭算法等半自动工具,则难以准确分割高度重叠的复杂颗粒结构。 德国康斯坦茨大学与巴西米纳斯吉拉斯联邦大学的研究团队提出了一种创新解决方案:利用预训练人工智能模型(Segment Anything Model, SAM)实现纳米颗粒的自动化分割与形态分析。
2/18/2025 4:26:00 PM
ScienceAI
首批苏州 AI 青年创业园名单揭晓,20家创业园入选
据苏州日报报道,首批苏州 AI 青年创业园名单正式公布,涵盖20家入选的创业园。 报道称,苏州AI青年创业园将加强青年AI人才引育,进一步发挥辐射和带动作用,推动AI产业与应用融合创新,为加快建设具有苏州特色的“人工智能 ”创新发展试验区作出更大贡献。
2/18/2025 3:00:26 PM
AI在线
OpenAI 考虑特别投票权以抵御马斯克等敌意收购
OpenAI 正在探讨一种新的方案,旨在保护其在转型为营利性企业后的控制权。 这一决定主要是为了应对可能的敌意收购,尤其是来自亿万富翁马斯克的威胁。 OpenAI 曾是一个非营利性组织,在人工智能技术迅速发展的背景下,决定向营利性转型,以吸引更多投资和资金。
2/18/2025 2:20:00 PM
AI在线
xAI王炸模型 Grok 3发布: 超越GPT-4o,计算能力提升10倍
埃隆・马斯克旗下的人工智能公司 xAI 于周一晚间发布了其最新的旗舰 AI 模型 Grok3,同时还推出了适用于 iOS 和网页的新功能。 Grok 是 xAI 针对 OpenAI 的 GPT-4o 和谷歌的 Gemini 等模型的回应,具备分析图像和回答问题的能力,并在马斯克的社交网络 X 上提供多项功能。 Grok3的开发经历了数月,虽然最初预期在2024年发布,但最终于周一正式推出。
2/18/2025 2:18:00 PM
AI在线
马斯克推出超级智能聊天机器人 Grok 3,号称 “地球上最聪明的 AI”
马斯克旗下的 xAI 公司于北京时间今天中午12时正式发布了其最新一代的大模型 Grok3。 马斯克对此次发布充满信心,声称 Grok3的能力较其前代产品 Grok2提升了 “一个数量级”。 他更是大胆地称其为 “地球上最聪明的人工智能”。
2/18/2025 1:47:00 PM
AI在线
全球AI大佬如何看待DeepSeek?美日欧心态大不同,有人高兴有人愁
在全球人工智能的舞台上,DeepSeek的崛起如同一颗耀眼的新星,引发了美日欧等科技巨头和专家的高度关注。 这些来自不同地域的AI大佬们,对DeepSeek的技术实力和行业影响力做出了截然不同的评价,非常耐人寻味。 美国:从惊讶到警惕,再到“如坐针毡”美国方面,DeepSeek的出现打破了长期以来由OpenAI和谷歌主导的AI格局。
2/18/2025 1:44:53 PM
舒云
2025年前,商业领袖必须规避GenAI的五大陷阱
在科技浪潮的推动下,一项新的研究揭示了一个震撼的事实:67%的商业领袖坚信,GenAI将在未来两年内为他们的企业带来翻天覆地的变革,然而,在这场技术革命的狂欢中,潜在的陷阱也如影随形,一旦失足,后果可能不堪设想——从名誉扫地到巨额罚款,乃至最致命的客户信任流失。 那么,如何在这场变革中稳健前行,避免踏入雷区?以下,我将为您剖析企业和商业领袖在接下来几年里可能遭遇的五大常见误区,并为您规划出一条避坑之路。 人工监督的缺失:GenAI是把双刃剑GenAI的强大与变革力无可置疑,但其不完美之处同样不容忽视。
2/18/2025 11:36:54 AM
Bernard Marr
OpenAI 联合创始人 Sutskever 的 AI 初创公司估值飙升至 300 亿美元,目标打造安全超级智能
据彭博社报道,知情人士透露,OpenAI 联合创始人伊利亚・苏斯科弗(Ilya Sutskever)正在以超过 300 亿美元(IT之家备注:当前约 2179.12 亿元人民币)的估值为其初创公司 Safe Superintelligence(以下简称 SSI)筹集超过 10 亿美元(当前约 72.64 亿元人民币)的资金,使 SSI 一举跻身全球最有价值的私人科技公司行列。
2/18/2025 11:21:38 AM
远洋
DeepSeek时代:经验已死,提问为王
随着人工智能技术的飞速发展,DeepSeek 等先进 AI 系统的出现,正在彻底改变我们的工作方式和学习模式。 过去依赖的经验和做事思路,在 AI 时代可能已经不再适用。 面对这一变革,我们必须重新审视自己的能力体系,学会问正确的问题,并快速适应新的工作方式。
2/18/2025 11:15:12 AM
数据人创作者联盟
深圳大学与腾讯云达成合作,推出 DeepSeek 人工智能通识课
深圳大学大数据系统计算技术国家工程实验室近日与腾讯云达成合作,共同推出基于 DeepSeek 的人工智能通识课程。该课程旨在通过前沿的人工智能技术教育,帮助学生深入了解人工智能的历史、关键技术及其在科学研究、社会发展中的高效益应用,培养跨学科思维,推动人工智能技术在多领域的深度融合与创新,深大学生本学期即可选课学习。
2/18/2025 11:03:45 AM
远洋
Mistral 推出其首个专业区域语言模型 Saba :专精阿拉伯语和印度起源语言
以 Saba 为代表的专精特定语言的较小模型,更适用于对文化背景、区域限定知识要求更高的场景。
2/18/2025 10:42:14 AM
溯波(实习)
资讯热榜
标签云
人工智能
OpenAI
AIGC
AI
ChatGPT
DeepSeek
AI绘画
数据
机器人
谷歌
模型
大模型
Midjourney
智能
用户
学习
开源
GPT
微软
Meta
AI创作
图像
技术
论文
Stable Diffusion
马斯克
Gemini
算法
蛋白质
生成式
芯片
代码
英伟达
腾讯
神经网络
计算
研究
Sora
AI for Science
3D
Anthropic
AI设计
机器学习
GPU
开发者
场景
华为
预测
伟达
Transformer
百度
人形机器人
苹果
深度学习
AI视频
模态
字节跳动
xAI
驾驶
文本
搜索
大语言模型
Claude
Copilot
具身智能
神器推荐
LLaMA
算力
安全
应用
视频生成
科技
视觉
亚马逊
干货合集
2024
AGI
特斯拉
训练
大型语言模型