DeepSeek
爆肝48小时!学会这8招,让DeepSeek变得超好用!
更多相关介绍:. 重磅好文! 8个章节带你全方位了解DeepSeek这两天,DeepSeek-R1 火的飞起,在中日美三个 Appstore 榜上登顶。
硅基流动助力华为小艺接入 DeepSeek-R1 模型
鸿蒙 HarmonyOS NEXT 的小艺 App 在 2 月 5 日正式上架 DeepSeek-R1 Beta 版,支持代码编写、数学计算、逻辑推理等功能。其中,DeepSeek-R1 模型的计算服务依托于昇腾算力,由硅基流动与华为云联合提供推理加速支持。
紫光股份:自研一站式大模型服务平台软件已实现对 DeepSeek V3 / R1 模型纳管和上架
紫光股份自研一站式大模型服务平台软件-灵犀使能平台(LinSeer Hub)已经实现对 DeepSeek V3 / R1 模型的纳管和上架,适配了不同尺寸的蒸馏模型及原生模型,并支持演示体验。
阿里云 PAI 支持云上一键部署 DeepSeek-V3、DeepSeek-R1 系列模型
阿里巴巴(中国)有限公司今日发文宣布,阿里云 PAI Model Gallery 已经支持 DeepSeek-V3、DeepSeek-R1 以及所有蒸馏小参数模型(DeepSeek-R1-Distill)的一键部署。
消息称荣耀 YOYO 会在近期接入 DeepSeek
博主 @旺仔百事通 今日爆料称,荣耀 YOYO 会在近期接入 DeepSeek,不知道会不会有联网搜索功能。
离线、在线都支持,深度 deepin UOS AI 接入 DeepSeek-R1 模型
深度操作系统今日发文宣布,UOS AI 现已适配接入 DeepSeek-R1 端侧模型,官方提供「离线部署」和「在线接入」两种方式在 UOS AI 中使用 DeepSeek-R1 模型。
澎峰科技 + 海光 DCU:自研推理框架全面支持 DeepSeek 系列模型
澎峰科技在近日正式宣布,其自主研发的 PerfXLM + 推理框架已基于海光 DCU,完成对 DeepSeek 全系列模型的深度适配与优化。
网易有道全面拥抱DeepSeek-R1,加速AI教育应用商业化落地
1月20日,DeepSeek震撼发布DeepSeek-R1,这款推理大模型在数学、编程及逻辑推理等多个领域展现出了与OpenAI顶尖模型比肩的实力,同时实现了API调用成本90%-95%的大幅缩减,无疑为科技界投下了一颗开年“重磅炸弹”。 DeepSeek-R1的深度推理能力不仅为AI产业的多元化发展开辟了新航道,也为包括教育在内的多个行业带来了革新动力。 作为教育科技企业,网易有道坚持深入挖掘教育场景下的大模型应用价值。
「鲶鱼」DeepSeek 正在搅动上下游
作者|朱可轩编辑|陈彩娴春节结束,DeepSeek 热度不减,而要说刚刚过去的春节假期,留给科技圈的印象可能是“卷上加卷”,几乎无人不在热议分析着 DeepSeek 这条“鲶鱼”。 硅谷方面迎来了空前的危机感:开源的信徒们声量再度走高,甚至连 OpenAI 都在反思闭源的决策是否正确;低算力成本的新范式引发芯片巨头英伟达连锁反应,创下美股史上最大规模单日市值蒸发纪录;政府部门下场调查 DeepSeek 使用芯片的合规性......在海外对 DeepSeek 评价褒贬不一的同时,国内也迎来了空前繁荣。 DeepSeek 发布 R1 模型后上线的 APP 接到泼天流量,初步验证了应用端增长将会拉动整个 AI 生态发展。
历史时刻:DeepSeek GitHub星数超越OpenAI,仅用时两个月
开源 AI 世界的里程碑事件! 我们正在见证历史:DeepSeek 项目在全球最大代码托管平台 GitHub 上的 Star 量超过了 OpenAI。 截至本周五下午两点,DeepSeek 旗下热度最高的项目 DeepSeek-V3 大模型 Star 量已达 7.77 万,超越了同平台中 OpenAI 最热门项目。
DeepSeek被禁!最高判刑20年,外交部回应!
过去几周,中国人工智能公司DeepSeek的崛起,在全球范围内引发了一场前所未有的争议。 这款凭借“低成本、高性能”迅速抢占市场的AI工具,不仅一度超越ChatGPT登顶美国应用下载榜,还导致多国科技股震荡下跌。 然而,其“高光时刻”很快被多国的禁令与限制措施打破——美国、意大利、澳大利亚、印度、韩国、日本等国相继以“国家安全”“数据隐私风险”为由,禁止或限制DeepSeek在政府及企业中的使用。
你的提示词根本只是在浪费算力,让deepseek达到最佳效果的三大原则
最近几周自学deepseek原理 应用 实践,一些成果,和大家分享。 与deepseek这类AI对话,为了达到最佳效果,提示词应当遵循哪三大原则? 清晰性;结构化;细节化;为什么?
行业首款 DeepSeek 量产车型落地,消息称岚图知音、梦想家已深度融合 R1 大模型
岚图知音车机云端还将持续融合和蒸馏DeepSeek R1模型。基于对DeepSeek做模型蒸馏,岚图一方面可以优化车机的智能化体验,做到技术的快速迭代;同时还可以降低智能座舱的开发和使用成本。
Andrej Karpathy 最新视频盛赞 DeepSeek:R1 正在发现人类思考的逻辑并进行复现
继近日斯坦福李飞飞、Percy Liang 等人推出 S1 后,李飞飞的学生、OpenAI 早期成员与前特斯拉 AI 总监也录制了一期最新长达 3 小时的长视频上传到 YouTube,深入浅出地从神经网络的起源、GPT-2、ChatGPT 到最近 DeepSeek-R1 介绍了 AI 大模型的系列进化:视频链接:,视频讲解十分通俗易懂,即使没有技术背景的观众也能轻松理解! 尤其是在视频的第 2 个小时开始,他对最近爆火的 DeepSeek-R1 论文进行了深入介绍,并直言 DeepSeek R1 在性能方面与 OpenAI 的模型不相上下,它的出现推动了 RL 技术的发展。 除了盛赞 DeepSeek-R1 的技术创新外,Andrej Karpathy 还对纯 RL 的学习能力给予了高度评价,但又指出 RL 非常非常擅长发现一种方法来“欺骗”模型,阻碍了 RLHF 成为专业技术的步伐。
《麻省理工科技评论》点评中国AI“四剑客”,每家都媲美DeepSeek
春节期间,DeepSeek 一跃成为全球瞩目的焦点。 它以仅约十分之一的超低训练成本,成功推出了性能与OpenAI o1近乎相当的开源模型,对全球科技领域带来巨大冲击,先后引发美国科技股的大幅下跌,以及硅谷科技巨头和各国政要的纷纷回应,如今全球各大芯片厂商和智算云服务厂商更是积极响应、跟进适配。 半个月来,DeepSeek相关话题热度居高不下,热搜频频,已成为全球科技、经济乃至政治领域的重要话题。
全球化钓鱼攻击:DeepSeek仿冒网站遍布六国,用户需警惕
奇安信XLab实验室2月6日发布最新安全报告,揭示了一波针对DeepSeek用户的大规模网络钓鱼活动。 数据显示,仿冒DeepSeek的钓鱼网站数量已超过2000个,且仍在持续增长。 根据报告,在2024年12月1日至2025年2月3日期间,共发现2650个仿冒DeepSeek的域名。
架构创新×模型创新!清微智能全面适配DeepSeek模型推理和训练
随着大模型技术向多场景渗透,算力需求呈现「大规模、高弹性、低成本」三重挑战。 清微智能基于全球领先的可重构计算架构(CGRA)推出可重构算力芯片RPU(Reconfigurable Processing Unit),实现单机高效运行千亿级参数模型推理和训练,以动态硬件重构、全栈优化及高能效比,重新定义国产AI芯片的性价比标杆。 新年伊始,DeepSeek的惊艳亮相,不仅在科技圈掀起巨浪,其影响还涉及到经济、社会、政策等多个维度,相关企业迅速跟进。
华人研究团队揭秘:DeepSeek-R1-Zero或许并不存在「顿悟时刻」
自我反思(尤其是肤浅的)有时对模型性能的助益不大。 在过去这半个月里,关于 DeepSeek 的一切都会迅速成为焦点。 一项非常鼓舞人心的发现是:DeepSeek-R1-Zero 通过纯强化学习(RL)实现了「顿悟」。