R1
Light-R1-32B:低成本高性能的数学解题新星闪耀登场
2025年3月6日,一款名为 **Light-R1-32B** 的全新语言模型正式亮相。 这款基于 **Qwen2.5-32B-Instruct** 模型打造的数学解题利器,经过特别训练,以其卓越的数学解题能力、低廉的训练成本以及可复现性,成为人工智能领域的一大亮点。 开发团队xAI表示,Light-R1-32B不仅在性能上超越同类模型,还为学术研究和实际应用提供了极具价值的参考。
三星Galaxy S25系列国行版接入DeepSeek-R1:AI能力全面升级
三星近日宣布,中国市场发售的Galaxy S25系列正式整合DeepSeek-R1大模型,进一步提升其AI功能。 据三星中国官方消息,用户无需额外下载App或注册账号,只需将三星生活助手升级至最新版本,或通过三星智慧主页、Bixby中的“智能体中心”选择DeepSeek-R1智能体,即可体验包括深度思考、联网搜索、情绪价值、上下文记忆及视觉解析在内的多项AI功能。 通过接入DeepSeek-R1,Galaxy S25系列实现了多模态感知与跨应用执行能力的显著提升。
中信特钢成功接入 DeepSeek-R1 大模型,推进数字化转型
中信特钢在数字化转型领域迈出了重要一步,近日在互动平台上宣布已成功接入 DeepSeek-R1大模型。 公司表示,未来将致力于推动数字技术与实体经济的深度融合,以此为基础进行全方位的改革,力求加快构建数据资产并挖掘数据的潜在价值。 中信特钢在推进智能运维方面的努力,是企业在激烈市场竞争中的一项战略举措。
DeepSeek开源周第六天:极致推理优化系统,提高GPU计算效率
在人工智能(AI)技术快速发展的今天,DeepSeek 团队推出了其全新的 DeepSeek-V3/R1推理系统。 这一系统旨在通过更高的吞吐量和更低的延迟,推动 AGI(通用人工智能)的高效发展。 为了实现这一目标,DeepSeek 采用了跨节点专家并行(Expert Parallelism,EP)技术,显著提高了 GPU 的计算效率,并在降低延迟的同时,扩展了批处理规模。
DeepSeek揭秘:AI推理系统背后的545%惊人利润率
DeepSeek在知乎开设官方账号,发布了《DeepSeek-V3/R1推理系统概览》技术文章,首次详细披露其模型推理系统的优化细节和成本利润率信息,标志着备受关注的"DeepSeek开源周"正式结束。 文章介绍了DeepSeek-V3/R1推理系统的两大优化目标:"更大的吞吐,更低的延迟"。 为实现这些目标,DeepSeek采用了大规模跨节点专家并行(EP)技术,尽管这增加了系统复杂性。
美的推出首款 DeepSeek 空调,语音控制新时代来临!
近日,美的正式发布了其首款搭载 DeepSeek 技术的空调 —— 鲜净感空气机 T6DeepSeek R1满血版。 这款新产品定于3月1日13:30全球首发,备受期待。 T6DeepSeek R1空调以 “空气智驾” 作为卖点,强调其卓越的自适应能力。
中文比R1丝滑、玩宝可梦还贼溜?全球首个混合推理模型Claude 3.7 Sonnet太惊艳,网友直呼“孤独求败”
当地时间 2 月 25 日,Anthropic 正式发布了 Claude 3.7 Sonnet,“这是迄今为止我们最智能的模型,也是市场上首个混合推理模型。 ”Anthropic 官方表示。 简单来说,Claude 3.7 Sonnet 既能提供近乎即时的响应(标准模式,standard),也可以向用户直观展示其长时间的逐步思考过程(扩展思考模式,extended thinking)。
百度教育「拍照搜题」、「AI写作文」接入DeepSeek-R1模型
2月25日,百度宣布其教育产品“拍照搜题”与“AI写作文”正式接入DeepSeek-R1模型,标志着百度在AI教育领域的重大技术升级。 此次接入将为用户带来更加智能、高效的学习体验,开启AI学习新时代。 百度教育产品此次接入DeepSeek-R1模型,旨在通过深度学习技术提升学习工具的智能化水平。
吴泳铭预告的旗舰推理模型更了!阿里重磅推出QwQ-Max预览版,Agent或成正式版王炸;一手实测R1热门问题,各有千秋!
编辑 | 伊风出品 | 51CTO技术栈(微信号:blog51cto)吴泳铭亲自预告过的,阿里旗舰推理模型,新消息来了。 刚刚,它的预览版正式发布和上线体验——就是这个QwQ-Max-Preview! 一眼看去,我愿称之为最萌的推理模型,看blog主页的名称,感觉思维链中的模型正在很努力的思考中……图片Qwen Chat 中已经可以体验预览版模型:,发现这里有一个隐藏彩蛋,内容是由QwQ-Max-Preview自己写的,我们可以看到AI做自我介绍时的思维链:首先,该模型属于 Qwen 系列,是基于 Qwen2.5-Max 构建的。
双擎升级!商汤大装置DeepSeek企业版上线+免费版扩容
今年2月,商汤大装置万象平台正式上线了DeepSeek-R1、DeepSeek-V3等模型,并为免费版提供3个月内千万Token额度,受到客户的热烈响应。 为了更好的服务用户,经过系列优化,,现正式推出企业版,同时完成免费版国产化适配与算力扩容,形成专业强支撑 普惠广覆盖的双擎驱动! 登录官网,即刻体验!
深推理模型崛起!Together AI融资3.05亿美元助推GPU需求
在 AI 行业,Together AI 最近宣布完成了一轮3.05亿美元的 B 轮融资,这一消息引起了广泛关注。 该公司的崛起与其新推出的深度理模型 DeepSeek-R1密切相关。 与最初的担忧相反,许行业专家认为,深度推理的进步并没有降低对基础设施的需求,反而在不断提升这一需求。
微信资源直通DeepSeek-R1啦!打工人:哎呀妈(ima)
AI好好用报道编辑:SiaAI 产品都发现了引流新方法 ——DeepSeek-R1。 打工人の AI 外挂,又双叒升级啦! 今天,腾讯旗下智能工作台 ima.copilot( 简称 ima )喜提「双模双待」:左持腾讯混元大模型,右牵 DeepSeek-R1。
昆仑万维旗下天工AI正式上线DeepSeek R1+联网搜索
昆仑万维旗下天工AI正式上线DeepSeek R1 联网搜索2月8日,昆仑万维旗下「天工AI」正式推出PC版重大更新——上线“DeepSeek R1 联网搜索”功能。 这一全新升级,不仅解决了用户长期以来关注的DeepSeek联网功能无法使用的问题,还优化了R1版本偶尔崩溃的困扰,为用户带来更加稳定、高效、智能的AI体验。 官方地址:www.tiangong.cn自2025年1月下旬发布以来,DeepSeek R1模型迅速席卷全球AI领域。
Sebastian Raschka:关于DeepSeek R1和推理模型,我有几点看法
著名 AI 研究者和博主 Sebastian Raschka 又更新博客了。 这一次,他将立足于 DeepSeek 技术报告,介绍用于构建推理模型的四种主要方法,也就是如何通过推理能力来增强 LLM。 Sebastian Raschka 表示:「我希望这能提供有价值的见解,并帮助你了解围绕这一主题的快速演变的文献和话题炒作。
外国专家解读DeepSeek:预算有限,如何复制R1推理模型?纯强化学习不现实!不是任何问题都得问DeepSeek!
出品 | 51CTO技术栈(微信号:blog51cto)Sebastian Raschka是一位外国知名的AI专家。 特别在大型语言模型(LLM)研究方面,有着丰富的研究经验。 近日DeepSeek-R1推理模型的推出,将“任何一款不是o1的模型快速蒸馏成具备强推理能力的o1”成为了可能,而且所需的成本和算力都大大降低。
山姆·奥特曼揭秘:Deepseek R1性价比之选!
在当今的人工智能领域,大模型之间的竞争日益激烈。 Deepseek 推出的 R1 模型引起了广泛关注。 山姆·奥特曼评价道:“Deepseek 的 R1 是一个令人印象深刻的模型,尤其是在他们能够以这个价格提供的东西方面。
网易有道全面拥抱DeepSeek-R1,推理大模型加速个性化教学升级
1月20日,DeepSeek震撼发布DeepSeek-R1,这款推理大模型在数学、编程及逻辑推理等多个领域展现出了与OpenAI顶尖模型比肩的实力,同时实现了API调用成本90%-95%的大幅缩减,无疑为科技界投下了一颗开年“重磅炸弹”。 DeepSeek-R1的深度推理能力不仅为AI产业的多元化发展开辟了新航道,也为包括教育在内的多个行业带来了革新动力。 作为教育科技企业,网易有道坚持深入挖掘教育场景下的大模型应用价值。
DeepSeek 全面指南:95% 的人都不知道的九个技巧
大家好,我是汤师爷~最近,DeepSeek这款AI工具爆火国内外。 虽然许多人都开始尝试使用它,但有人吐槽说,没想象中那么牛。 其实问题不在工具,很多人的使用姿势就搞错了,用大炮打蚊子,白白浪费DeepSeek的强大功能。