DeepSeek
商汤大装置“万象平台”上架 DeepSeek 系列模型
北京市商汤科技开发有限公司昨日晚发文宣布,企业客户和开发者可在商汤大装置万象平台中,快速部署 DeepSeek-V3、DeepSeek-R1 等模型,可享受 3 个月内 1000 万 tokens 免费使用权益。
为什么中国只有一个 DeepSeek?
DeepSeek 风暴后,中国的大模型创业圈会发生什么样的变化? 近日来,笔者也与多位业内人士进行了探讨,发现国产大模型圈目前出现了两个极端:一个是极端的热血沸腾,另一个则是极端的霜打茄子。 前者以积极拥抱 DeepSeek 生态的算力厂商与模型服务厂商、以及原先没有能力参与大模型“军备竞赛”的开源受益者为代表,后者则以其他中国大模型创业公司(俗称“大模型六小虎”)与过去两年投资了这些公司的 VC 们为主,形成了一个“冰火两重天”的局面。
美格智能:与 DeepSeek 开发公司无业务往来,相关模型适配工作处于早期研发阶段
美格智能在公告中提到,公司股票因被纳入 DeepSeek 概念股而出现异常波动,并澄清公司与 DeepSeek 开发公司杭州深度求索人工智能基础技术有限公司无直接或间接业务往来及股权关系。
斑马智行元神 AI 完成与 DeepSeek 技术融合,意图理解、融合推理和主动服务能力提升
斑马信息科技有限公司昨日晚发文宣布,斑马智行元神 AI 与 DeepSeek 大模型完成技术融合正式上线,首发支持多车型。
奇瑞智能大模型已与 DeepSeek 深度融合校验,逐步应用于更多新车型
奇瑞集团宣布目前已与国内领先的人工智能公司深度求索(DeepSeek)围绕智能化大模型系统展开深度技术融合。
阿里云百炼上线全尺寸 DeepSeek 模型,1 元最高可享受 200 万 tokens
阿里云宣布百炼平台全面上线 DeepSeek-V3、DeepSeek-R1、DeepSeek-R1-Distill-Qwen-32B 等 6 款全尺寸模型。DeepSeek-V3、DeepSeek-R1 满血版可享各 100 万免费 tokens,蒸馏版 1 元最高可享受 200 万 tokens,即日起,所有用户可直接使用。
Sebastian Raschka:关于DeepSeek R1和推理模型,我有几点看法
著名 AI 研究者和博主 Sebastian Raschka 又更新博客了。 这一次,他将立足于 DeepSeek 技术报告,介绍用于构建推理模型的四种主要方法,也就是如何通过推理能力来增强 LLM。 Sebastian Raschka 表示:「我希望这能提供有价值的见解,并帮助你了解围绕这一主题的快速演变的文献和话题炒作。
ai.com 域名现已跳转至 DeepSeek:各大模型薅了个遍,不停蹭热度
据IT之家小伙伴投稿,可能是人工智能企业最想要的域名 —— ai.com 变更了跳转页面,随着国内 AI 模型 DeepSeek 的大热,该域名目前已跳转至 chat.deepseek.com。
DeepSeek深夜再放大招,发布全新多模态大模型Janus-Pro
国产大模型DeepSeek发布了全新的Janus-Pro多模态大模型,正式进军文生图领域。 这一举动标志着DeepSeek在多模态AI技术上的重大突破。 在GenEval和DPG-Bench基准测试中,Janus-Pro-7B不仅击败了OpenAI的DALL-E3,还超越了Stable Diffusion、Emu3-Gen等热门模型。
零跑汽车:部署 DeepSeek-R1 的智能座舱即将上线
目前,小零 GPT 大模型已接入 DeepSeek-R1,其推理与思维链能力将优化座舱交互逻辑,增强自然语言理解与个性化服务响应速度。
攻略在手,轻松玩转 DeepSeek
IT之家已经为大家从全网,搜集总结了一份《DeepSeek 玩法攻略》,帮助大家轻松实现“从入门到精通”。从大模型的能力范围、到提示词该怎么写、再到尝试在自己电脑上本地部署的方案,都有涉猎。
京东云发布 DeepSeek 大模型一体机,内置智能体 + 知识库双引擎及千余种插件
京东云发布DeepSeek大模型一体机,具备国产算力全适配、支持丰富大模型参数规格、AI应用开箱即用等核心特性。
东风旗下自主品牌岚图、猛士、奕派、风神、纳米接入 DeepSeek 全系列模型
东风汽车今日宣布,旗下自主品牌已完成DeepSeek全系列大语言模型接入工作并将于近期陆续搭载,应用于包括东风岚图、东风猛士、东风奕派、东风风神、东风纳米在内的东风自主品牌车型。
工信部:春节期间三家基础电信企业均全面接入 DeepSeek 开源大模型
三家基础电信企业均全面接入DeepSeek开源大模型,实现在多场景、多产品中应用,针对热门的DeepSeek-R1模型提供专属算力方案和配套环境,助力国产大模型性能释放。
七彩虹“虹光 AI”智能模型助手官宣接入满血 DeepSeek R1
其基于 Transformer 架构,采用了 MLA 和 Deep Seek MoE 技术,通过减少缓存显著降低了内存占用,提升了推理效率。
外国专家解读DeepSeek:预算有限,如何复制R1推理模型?纯强化学习不现实!不是任何问题都得问DeepSeek!
出品 | 51CTO技术栈(微信号:blog51cto)Sebastian Raschka是一位外国知名的AI专家。 特别在大型语言模型(LLM)研究方面,有着丰富的研究经验。 近日DeepSeek-R1推理模型的推出,将“任何一款不是o1的模型快速蒸馏成具备强推理能力的o1”成为了可能,而且所需的成本和算力都大大降低。
百度智能云推出四款新应用接入 DeepSeek,助力各行业智能化升级
近日,百度智能云正式推出了四款全新应用 —— 客悦、曦灵、一见和甄知,这些应用已成功接入最新版本的 DeepSeek 模型。 这一举措不仅为企业提供了更为丰富的人工智能解决方案,还旨在满足在智能外呼、数字人视频脚本生成、视觉智能分析及知识管理等高价值业务场景中的多样化需求。 随着数字化转型的加速,百度智能云也在积极推进各行业的应用落地,包括金融、交通、政务、汽车、医疗及工业等领域。
百度智能云:客悦、曦灵、一见、甄知四款大模型应用已接入 DeepSeek
百度智能云正加速推进金融、交通、政务、汽车、医疗、工业等行业应用产品与DeepSeek模型的适配验证工作,积极探索大模型在智能问数、公文写作、理财助手、合规管理、医疗辅诊等行业垂直业务场景中的能力拓展与应用进化。