DeepSeek 频道:探索人工智能前沿,洞见未来科技 - AI在线

欢迎访问我们的 DeepSeek 频道页面,这里汇聚了关于 DeepSeek 技术、应用和最新动态的专业文章。DeepSeek 是一种先进的大语言模型,基于深度学习技术,通过强大的自然语言处理能力,提供精准的语义理解和智能搜索功能。无论您是对大语言模型的基础原理感兴趣,还是希望了解其在各行各业中的应用,我们的文章将为您提供全面的解读。

全球动画第一!AI哪吒走秀引百万网友围观,我们用DeepSeek搞了个

AI好好用报道编辑:杨文哪吒、敖闰、申公豹、太乙真人「走」上巴黎时装秀。 小哪吒创造了传奇。 不仅 16 天破百亿,刷新了中国影史纪录,现如今还直接干到了全球动画电影票房榜第一。

从大模型性能优化到DeepSeek部署

一、背景Deepseek-r1模型的爆火标志着本地部署大模型的需求日益增长。 本文主要探讨如何优化本地部署大模型的性能,并结合我们的实践进行评测分析,文章最后我们将分享如何在本地高效部署满血版Deepseek-r1大模型。 在生产环境中,我们已部署专用的大模型推理集群,并对其性能进行了全面优化。

多地政务服务系统接入DeepSeek大模型 服务效率大提升

随着人工智能技术的迅速发展,越来越多的地方政府开始将 AI 引入政务服务,试图通过智能化手段提升服务质量和效率。 近期,北京经济技术开发区和深圳福田区纷纷上线了基于 DeepSeek 大模型的智能政务助手,标志着 AI 在政务领域的应用迈出了重要一步。 在北京经济技术开发区,新的智能政务小助手经过多家企业的测试后正式投入使用。

DeepSeek 被曝首次考虑进行外部融资,巨头阿里巴巴有意参投

外媒 The Information 报道提到,由于其 AI 模型大受欢迎,因而要增加资源投放以满足明显增加的需求,所以促成内部讨论引入更多投资者。

DeepSeek服务器繁忙?实测30个接入平台,28个快速直达!

一、现象级表现. DeepSeek 自发布以来,热度直逼两年前 ChatGPT 横空出世的时候。 英伟达、亚马逊、微软等巨头率先接入,国内厂商也迅速跟进。

DeepSeek公务员上岗!公务员铁饭碗不保?

图片2月18日,“AI公务员上岗”冲上热搜第一名,在深圳福田区率先推出基于DeepSeek开发的AI数字员工,首批70名上岗。 这一事件标志着智能体技术从实验室走向社会治理的第一线,开启人机协作的新纪元。 据介绍,福田这70名新员工可实现:公文格式修正准确率超 95%,审核时间缩短90%错误率控制在 5%以内;“执法文书生成助手”将执法笔录秒级生成执法文书初稿;民生诉求分拨准确率从70%提升至95%;“AI招商助手”企业分析筛选效率提升 30%……“幸福福田”官微显示,广东深圳福田区推出基于DeepSeek开发的AI数智员工,上线福田区政务大模型2.0版,除了有DeepSeek通用能力外,还结合各部门各单位实际业务流程,量身定制个性化智能体,首批满足240个业务场景使用。

昆仑万维旗下 Opera 接入 DeepSeek R1 模型,支持本地个性化部署

Opera 在 2024 年将内置本地大语言模型(LLM)引入 Web 浏览器,提供超 50 种 LLM 的访问权限。Opera Developer 利用 Ollama 框架(由 llama.cpp 实现)支持了 DeepSeek R1 系列模型部署。

DeepSeek 清华原版宝典:工作、学习、生活、科研中的难题,轻松搞定

这次给大家分享的 PDF 下载,是原汁原味的原版哦,网上有太多卖课者魔改的内置其广告版本。

理想同学 App 接入 DeepSeek R1 满血版

理想汽车官方今日发文宣布,理想汽车旗下人工智能助手理想同学 App 全面接入 DeepSeek R1&V3 671B 满血版,支持与理想自研 MindGPT 大模型的双向切换。

DeepSeek新注意力机制引热议!梁文锋亲自提交预印本,目标明确降低计算成本

DeepSeek新注意力机制论文一出,再次引爆讨论热度。 依然是熟悉的画风,熟悉的味道——那边马斯克疯狂烧了20万张卡训出Grok 3,这厢DeepSeek重点关注的依然是压缩计算和推理成本。 具体来说,新论文提出了一种可原生训练的稀疏注意力机制,名为NSA(Native Sparse Attention)。

李彦宏最新财报会议内容流出:百度从DeepSeek身上学到了一件事;调用量涨30倍百度AI搜索的打法;50亿股票回购回馈股东

编辑 | 言征出品 | 51CTO技术栈(微信号:blog51cto)开年,各大科技巨头都被DeepSeek狠狠冲击已经近三周。 本周将会迎来各大公司的2024的Q4财报会议。 百度率先公开了过去三个月取得的成绩。

Spring Boot 接入 DeepSeek API:实现智能应用的全新路径

在数字化时代,人工智能技术的飞速发展为各行业带来了前所未有的变革机遇。 自然语言处理作为 AI 领域的重要分支,正逐渐渗透到我们日常生活的方方面面,从智能客服、文本生成到知识问答等应用场景,其价值不断凸显。 DeepSeek 作为一种先进且功能强大的自然语言处理 API,为开发者提供了高效、精准的语言理解和生成能力。

Nature推荐的大模型,现如今最好用的AI工具应当更好地助力科学研究

编辑丨toileterAI 大模型的演变随着时间呈现出井喷的增长趋势,几乎每周甚至于没几天就会有全新的 AI 工具被推出,引来蜂拥而至的研究人员去尝试它们。 现如今花样百出的 AI 工具,让研究者们无论在何种需求上都能自行配置最得心应手的模型,每个大型语言模型 (LLM) 都得以适配不同的任务需要。 总部位于华盛顿州西雅图的 Fred Hutchinson 癌症中心的数据科学家 Carrie Wright 表示,尽管 LLM 会产生类似人类的反应,但它们仍然太容易出错,无法单独使用。

浙大满血版 DeepSeek 上线免费使用:无惧系统繁忙,全国 829 所 CARSI 联盟高校开放共享

通过 CARSI 联盟,全国 829 所高校的师生可以直接登录 chat.zju.edu.cn,免费使用 DeepSeek V3 / R1 模型及其它智能体应用,打破校园 IP 的限制。2 月 20 日起,该入口将正式开放。

DeepSeek满血微调秘籍开源!站在巨人肩膀打造私有模型,一手教程在此

DeepSeek爆火甚至引发API低价内卷……但是别忘了开源模型的最大好处是提供了“巨人的肩膀”啊! 微调DeepSeek-V3/R1,低成本打造高质量私有模型、提高业务竞争力,或许才是当下行业内更迫切的需求。 就在刚刚,已收获近4万GitHub StarColossal-AI发布开源大模型后训练工具箱,它包含:DeepSeek-V3/R1满血671B LoRA低成本SFT微调;完整的强化学习工具链PPO、GRPO、DPO、SimPO等;无缝适配DeepSeek系列蒸馏模型在内的HuggingFace开源模型;兼容支持英伟达GPU、华为昇腾NPU等多种硬件;支持混合精度训练,gradient checkpoint等训练加速降低成本;灵活的训练配置接口,支持自定义奖励函数、损失函数等;提供灵活的并行策略配置接口,包括数据并行、模型并行、专家并行、ZeRO和Offload等,以适应不同硬件规模。

​水滴公司接入 DeepSeek,赋能研发 AI 保险专家

水滴公司正式宣布接入 DeepSeek 模型产品,进一步丰富其保险大模型的生态布局。 这一举措将为公司的业务发展注入强劲动力,推动大模型技术在保险行业的广泛应用,尤其是在销售辅助、质量检测、风险控制以及产品创新等关键环节的智能化解决方案方面。 借助这一新技术,水滴公司研发的 “AI 保险专家” 已经能够支持多种交互形式,包括语音和文本。

Spring Boot + DeepSeek:解锁 AI 开发新姿势

在当今数字化时代,人工智能(AI)技术正以前所未有的速度改变着我们的生活和工作方式。 作为开发者,我们一直在寻找更高效、更智能的方式来构建应用程序。 今天,我们要为大家介绍一个强大的组合:Spring Boot DeepSeek,这将为你的应用注入智能新动力,开启 AI 开发的新篇章。

DeepSeek V3+R1满血微调工具上线!一键启动,硬件要求降10倍

DeepSeek V3/ R1 火爆全网,基于原始模型的解决方案和 API 服务已随处可见,陷入低价和免费内卷。 如何站在巨人肩膀上,通过后训练(post-training)结合专业领域数据,低成本打造高质量私有模型,提升业务竞争力与价值? 已收获近 4 万 GitHub Star 的 Colossal-AI,发布开源大模型后训练工具箱,包含:DeepSeek V3/ R1 满血 671B LoRA 低成本 SFT 微调;完整的强化学习工具链 PPO,GRPO,DPO,SimPO 等;无缝适配 DeepSeek 系列蒸馏模型在内的 HuggingFace 开源模型;兼容支持英伟达 GPU、华为昇腾 NPU 等多种硬件;支持混合精度训练,gradient checkpoint 等训练加速降低成本;灵活的训练配置接口,支持自定义奖励函数、损失函数等;提供灵活的并行策略配置接口,包括数据并行、模型并行、专家并行、ZeRO 和 Offload 等,以适应不同硬件规模。