DeepSeek

李彦宏谈训练下一代大模型 当前应聚焦技术进步和成本降低

2025年2月11日,在阿联酋迪拜举办的World Governments Summit峰会上,百度创始人李彦宏与阿联酋AI部长奥马尔·苏丹·奥拉马进行了深入对话,共同探讨AI基础设施的未来发展趋势。 对话中,奥拉马提及近期DeepSeek引发全球关注,导致多家大型芯片厂商和交易所股价大幅波动的事件,询问李彦宏对于数据中心和AI基础设施未来的看法。 李彦宏表示,尽管技术进步迅速,成本不断降低,但持续投入AI基础设施仍是确保处于技术创新前沿的关键。

推理模型新路线开源!与DeepSeek截然不同,抛弃思维链不用人类语言思考

开源推理大模型新架构来了,采用与Deepseek-R1/OpenAI o1截然不同的路线:抛弃长思维链和人类的语言,直接在连续的高维潜空间用隐藏状态推理,可自适应地花费更多计算来思考更长时间。 例如问题:Claire每天早餐都会做一个3个鸡蛋的煎蛋卷。 她在4周内会吃多少个鸡蛋?

20个很强的DeepSeek提问公式

大家好,我是汤师爷~今天直接给大家分享DeepSeek干货内容。 要获得精准的AI回答,关键在于提问方式。 这里为你整理了20个高效提问公式,直接提升回答质量。

一文读懂DeepSeek-V3 技术报告

2023年7月17日,DeepSeek正式成立,由幻方量化提供资金支持。 梁文锋凭借其在金融和AI领域的深厚背景,带领团队开始探索生成式AI技术。 同年11月2日,DeepSeek推出首款开源模型DeepSeek Coder,支持多种编程语言的代码生成、调试和数据分析任务,为AI领域的应用奠定了基础,直到 2024 年 12 月,DeepSeek-V3的发布引发了行业震动和社会广泛关注,在他们的最新技术报告《DeepSeek-V3技术报告》中,团队详细介绍了其最新成果——DeepSeek-V3模型。

本地部署DeepSeek就这么简单...

引言DeepSeek 作为一款优秀的语言模型,结合 Ollama 和 Cherry Studio 可以轻松实现本地部署。 本文将深入浅出地介绍如何使用 Ollama 与 Cherry Studio 本地部署 DeepSeek。 Oallam简介Ollama 是一个简单易用的工具,它允许用户在本地快速部署和运行各种语言模型。

国家超算互联网平台宣布免费开放 3 个月 DeepSeek API 接口

昨日晚间,国家超算互联网平台宣布推出“AI 生态伙伴加速计划”,提供 3 个月 DeepSeek API 接口免费使用、千万卡时算力资源池等激励。据介绍,超算互联网平台已上线 DeepSeek 满血版的模型镜像,并为有需求的企业免费开放 3 个月 DeepSeek API 接口。

DeepSeek+ComfyUI 一天出爆款!如何用AI全流程创作短视频?

短视频时代,AI 工具已经成为设计师和视频创作者的“神助攻”! 尤其是像 DeepSeek 这样的 AI 平台,凭借其强大的 AI 创作能力,正在改变全行业创作的面貌。 今天,我们将通过一个实际案例——制作一个在抖音投放的短视频,来分享如何利用DeepSeek comfy UI 可灵,高效产出AI视频内容。

玩转DeepSeek!5个超实用的新手技巧

大家好,我是小六,借着这次 DeepSeek 的热度,给大家分享一些关于 deepseek 的技巧。 这个春节 DeepSeek 成为了互联网圈的热门话题,这两天一度登顶中、日、美三个 App Store 榜首。 几乎一夜之间,所有人都在关注 DeepSeek,甚至在老家完全没用过 AI 的亲戚都在问 DeepSeek 是什么,怎么用。

外媒:国行iPhone最终选择阿里千问?DeepSeek也出局

苹果对国内 AI 大模型的选择,似乎终于有了结果。 刚刚,据海外媒体 The Information 报道,苹果最终选择了阿里巴巴作为合作伙伴为国内的 iPhone 用户提供 AI 能力。 原文链接:,一位直接知情人士本周二向 The Information 透露,苹果公司最近开始与阿里巴巴集团合作,计划在中国推出人工智能功能。

普通人也能轻松掌握的20个DeepSeek高频提示词(2025版)

一、基础原则1.说人话最重要"不用专业术语,就像和朋友聊天一样描述需求"。 ❌️ 错误示范:"请用SWOT分析法输出新能源汽车行业报告"。 ✅ 正确示范:"我要给老板汇报比亚迪谈判进展,完全不懂电池技术,请用买菜大妈都能听懂的话说明:他们的核心技术强在哪?

AI"自我对抗"玩法火了 一句话让AI破防

最近,一场别开生面的AI对决正在互联网上演。 从唇枪舌战到国际象棋对弈,AI之间的较量不仅展现了它们的语言能力和思维方式,更成为当下最热门的流量话题。 近期,DeepSeek与GPT的对话视频在B站引发广泛关注,播放量突破300万,互动量超50万。

李彦宏谈DeepSeek:称大模型成本每年降低90%以上

近日,世界政府峰会(WGS)在阿联酋迪拜盛大开幕,吸引了全球各界精英的关注。 在峰会期间,百度创始人李彦宏与阿联酋AI部长进行了深入对话,共同探讨了AI领域的最新发展趋势。 李彦宏在对话中特别提到了百度在AI推理领域的创新成果——DeepSeek。

百度李彦宏谈 DeepSeek:大模型推理成本每年降低 90% 以上

“世界政府峰会”于今日在阿联酋迪拜开幕,百度创始人李彦宏在迪拜 WGS 上与阿联酋 AI 部长对谈时谈及 DeepSeek。

4500美元复刻DeepSeek神话,1.5B战胜o1-preview只用RL!训练细节全公开

强化学习迎来重大突破! 近日,来自UC伯克利的研究团队基于Deepseek-R1-Distilled-Qwen-1.5B,通过简单的强化学习(RL)微调,得到了全新的DeepScaleR-1.5B-Preview。 在AIME2024基准中,模型的Pass@1准确率达高达43.1% ——不仅比基础模型提高了14.3%,而且在只有1.5B参数的情况下超越了OpenAI o1-preview!

5000字揭秘!DeepSeek-R1-Zero自我进化的三大特点和三大基石

当前 AI 在推理能力提升上遇到了诸多瓶颈,这在一定程度上限制了其进一步发展和广泛应用。 在传统的 AI 训练中,模型对大量监督数据的依赖是一个显著问题。 监督学习需要大量带有标注的数据来训练模型,使其能够对新的数据进行准确的分类或预测。

一文速通 DeepSeek 家族核心技术点:从 LLM 到 R1!

DeepSeek横空出世并迅速走红,引发了全球科技圈的强烈震动,NVIDIA股价暴跌18%,全球科技股市市值蒸发近1万亿美元。 特朗普也居然公开称赞DeepSeek的崛起具有“积极意义”,并表示这给美国敲响了“警钟”。 Anthropic一方面肯定了DeepSeek的成就,另一方面却呼吁美国政府加强对华芯片管制。

在 DeepSeek 的帮助下,我在 GitHub “战绩区”涂鸦

在每个人的 GitHub 的主页上,有一块儿区域特别显眼,就是 Contributions 日历图,也就是下面这个绿色的小方格子部分。 image.pngGitHub 会记录你每天是否有提交代码,提交了多少代码。 哪年比较勤劳,哪年偷懒了,一眼就能看出来。

​DeepSeek梁文峰或成亚洲顶级科技富豪,估值高达1500亿美元

近日,DeepSeek 的创始人梁文峰凭借其在人工智能领域的成功,可能会成为亚洲顶级科技富豪之一。 根据彭博社对多位初创公司创始人和 AI 专家的调研,DeepSeek 的估值预计将在10亿美元到超过1500亿美元之间。 这意味着梁文峰持有的84% 股份,可能使他跻身亚洲最富有的科技大亨之列。