DeepSeek R1
DeepSeek R1也会大脑过载?过度思考后性能下降,少琢磨让计算成本直降43%
原来,大型推理模型(Large Reasoning Model,LRM)像人一样,在「用脑过度」也会崩溃,进而行动能力下降。 近日,加州大学伯克利分校、UIUC、ETH Zurich、CMU 等机构的研究者观察到了这一现象,他们分析了 LRM 在执行智能体任务过程中存在的推理 - 行动困境,并着重强调了过度思考的危险。 论文标题:The Danger of Overthinking: Examining the Reasoning-Action Dilemma in Agentic Tasks论文链接:「单机模式」下,这些模型在实时互动的环境中仍是「思想上的巨人,行动中的矮子」。
3/2/2025 2:07:00 PM
机器之心
仅靠逻辑题,AI数学竞赛能力飙升!微软、九坤投资:7B小模型也能逼近o3-mini
AIxiv专栏是AI在线发布学术、技术内容的栏目。 过去数年,AI在线AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。 如果您有优秀的工作想要分享,欢迎投稿或者联系报道。
2/25/2025 11:29:00 AM
机器之心
昆仑万维旗下 Opera 接入 DeepSeek R1 模型,支持本地个性化部署
Opera 在 2024 年将内置本地大语言模型(LLM)引入 Web 浏览器,提供超 50 种 LLM 的访问权限。Opera Developer 利用 Ollama 框架(由 llama.cpp 实现)支持了 DeepSeek R1 系列模型部署。
2/19/2025 10:13:41 PM
归泷(实习)
200多行代码,超低成本复现DeepSeek R1「Aha Moment」!复旦大学开源
AIxiv专栏是AI在线发布学术、技术内容的栏目。 过去数年,AI在线AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。 如果您有优秀的工作想要分享,欢迎投稿或者联系报道。
2/18/2025 10:24:00 AM
机器之心
免费!「DeepSeek-R1 671B满血版」不卡、不限次!问小白火速支援
最近 DeepSeek 太火,问题来了,你是不是经常遇到这个情况? 不卡顿、联网的、满血版 DeepSeek R1 越来越香,也越来越难享用到? 问小白来了,火速上线、火线支援。
2/14/2025 10:16:00 AM
机器之心
玩转DeepSeek!5个超实用的新手技巧
大家好,我是小六,借着这次 DeepSeek 的热度,给大家分享一些关于 deepseek 的技巧。 这个春节 DeepSeek 成为了互联网圈的热门话题,这两天一度登顶中、日、美三个 App Store 榜首。 几乎一夜之间,所有人都在关注 DeepSeek,甚至在老家完全没用过 AI 的亲戚都在问 DeepSeek 是什么,怎么用。
2/12/2025 12:17:06 AM
Mr.小六
爆肝48小时!学会这8招,让DeepSeek变得超好用!
更多相关介绍:. 重磅好文! 8个章节带你全方位了解DeepSeek这两天,DeepSeek-R1 火的飞起,在中日美三个 Appstore 榜上登顶。
2/8/2025 12:04:55 AM
解决师Blue
免费!潞晨携手华为昇腾,国产算力DeepSeek R1推理API及云镜像服务来了
DeepSeek-R1 系列模型的开源,因其出色的性能和低廉的开发成本,已引发全球的热切讨论和关注。 潞晨科技携手华为昇腾,联合发布基于国产 910B 算力的 DeepSeek R1 系列推理 API,及云镜像服务。 DeepSeek R1 系列推理 API 免费体验在本次发布中,潞晨以自研国产推理引擎为技术底座,成功实现了国产华为昇腾 910B 算力与 DeepSeek R1 系列模型的推理适配优化,性能表现与使用高端 GPU 持平,为开发者提供高效、灵活、稳定的 AI 推理服务,助力企业实现降本增效,加速智能业务基于国产软硬件体系快速部署落地。
2/4/2025 8:39:00 PM
机器之心
o3-mini 碾压DeepSeek R1?一条python程序引发近400万围观
AI 圈的头条被 DeepSeek 承包了十几天,昨天,OpenAI 终于坐不住了,推出了全新推理模型系列 o3-mini。 不仅首次向免费用户开放了推理模型,而且相比之前的 o1 系列,成本更是降低了 15 倍之多。 OpenAI 也称这是其推理模型系列中最新、最具成本效益的模型:刚刚上线,已经有网友迫不及待的拿它和席卷整个大模型圈的国产大模型 DeepSeek R1 进行对比了。
2/2/2025 11:54:00 PM
机器之心
完整的671B MoE DeepSeek R1怎么塞进本地化部署?详尽教程大放送!
AIxiv专栏是AI在线发布学术、技术内容的栏目。 过去数年,AI在线AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。 如果您有优秀的工作想要分享,欢迎投稿或者联系报道。
2/2/2025 11:51:00 PM
机器之心
- 1
资讯热榜
上海AI实验室开源InternVL3系列多模态大型语言模型
Haisnap横空出世,小白用户也能轻松打造AI应用
全日程揭晓!ICLR 2025论文分享会我们北京见
「交交」媲美GPT-4o!上海交大推出口语对话情感大模型,首个纯学术界自研!
5分钟直出46页论文!谷歌Deep Research完爆OpenAI,最强Gemini 2.5加持
kimi开源视觉语言模型 Kimi-VL 与 Kimi-VL-Thinking,多项基准超越 GPT-4o
击败DeepSeek-R1!豆包新推理模型仅用前者参数量1/3!还将开源两个基准,瞄准通用推理能力!
ChatGPT重大更新,能翻出所有历史对话,网友被AI聊破防了
标签云
人工智能
OpenAI
AIGC
AI
ChatGPT
DeepSeek
AI绘画
数据
机器人
谷歌
模型
大模型
Midjourney
智能
用户
学习
开源
GPT
微软
Meta
AI创作
图像
技术
论文
Stable Diffusion
马斯克
Gemini
算法
蛋白质
生成式
芯片
代码
英伟达
神经网络
腾讯
计算
研究
Sora
AI for Science
3D
AI设计
Anthropic
机器学习
GPU
开发者
场景
华为
预测
伟达
Transformer
百度
深度学习
苹果
模态
AI视频
驾驶
文本
人形机器人
xAI
搜索
大语言模型
Copilot
字节跳动
神器推荐
LLaMA
具身智能
Claude
算力
安全
应用
视频生成
科技
视觉
亚马逊
干货合集
2024
AGI
特斯拉
DeepMind
训练