DeepSeek 频道:探索人工智能前沿,洞见未来科技 - AI在线

欢迎访问我们的 DeepSeek 频道页面,这里汇聚了关于 DeepSeek 技术、应用和最新动态的专业文章。DeepSeek 是一种先进的大语言模型,基于深度学习技术,通过强大的自然语言处理能力,提供精准的语义理解和智能搜索功能。无论您是对大语言模型的基础原理感兴趣,还是希望了解其在各行各业中的应用,我们的文章将为您提供全面的解读。

腾讯元宝接入 DeepSeek R1 模型,支持深度思考 + 联网搜索

其支持对用户的提问进行深度思考、逻辑推理和详细回答,同时也支持联网搜索信息,以提高推理和回答的时新性和权威性。

日本AI专家评DeepSeek:中国AI新星崛起,技术实力接近OpenAI

中国初创企业DeepSeek(深度求索)开发的高性能、低成本生成式AI大规模语言模型(LLM)近日引发全球关注。 日本AI研究领域的权威、东京大学教授松尾丰在接受日本经济新闻采访时,对DeepSeek的技术水平、开源战略及其对日本企业的影响进行了深入分析。   松尾丰表示,DeepSeek的技术非常出色,其性能与美国OpenAI开发的ChatGPT接近。

全球 AI 服务器市场迎来爆发,出货量有望年增近 28%

根据 TrendForce 集邦咨询的最新研究报告,全球 AI 服务器出货量预计在2025年将实现近28% 的年增长。 这一增长主要得益于 DeepSeek 的推动,云服务提供商(CSP)们将更加积极地开发成本较低的自有 ASIC 方案。 此外,市场的重心将从 AI 训练逐步转向 AI 推理,预计到2025年,AI 推理服务器的市场占比将接近50%。

微信资源直通DeepSeek-R1啦!打工人:哎呀妈(ima)

AI好好用报道编辑:SiaAI 产品都发现了引流新方法 ——DeepSeek-R1。 打工人の AI 外挂,又双叒升级啦! 今天,腾讯旗下智能工作台 ima.copilot( 简称 ima )喜提「双模双待」:左持腾讯混元大模型,右牵 DeepSeek-R1。

DeepSeek 系列模型详解之——DeepSeek LLM

DeepSeek LLM发布于2024年1月,收集了2万亿个词元用于预训练,在模型层面沿用了LLaMA的架构,并将余弦退火学习率调度器替换为多阶段学习率调度器,便于持续训练。 并从多种来源收集了超过100万个实例进行监督微调(SFT)。 此外,利用直接偏好优化(DPO)技术进一步提升模型的对话能力。

长虹 AI TV 电视宣布接入 DeepSeek 满血 R1,支持语音对话

目前,长虹电视用户终端的升级工作已全部结束,所有搭载了沧海智能体的长虹 AI TV 均已正式接入 DeepSeek。

美国拒签“巴黎声明”,撕开全球AI竞赛三大裂痕

2月11日,法国巴黎人工智能行动峰会落下帷幕,61国签署的《关于发展包容、可持续的人工智能造福人类与地球的声明》(下称《巴黎声明》),美英两国却选择了拒签和“退群”。 这场看似寻常的国际峰会,撕开了全球AI竞赛的三重裂痕:技术路线之争、治理权博弈与安全观对撞。 一、美式AI霸权:为何拒绝“可持续”紧箍咒?

“日本 AI 研究第一人”松尾丰评 DeepSeek:技术非常出色,出现这种企业并不惊讶

日经中文网今日公布了“日本 AI 研究第一人”东京大学教授松尾丰的专访,涉及 DeepSeek 的最新 AI 模型、安全性方面的风险及对日本企业的影响等问题。

哪些国家封杀了DeepSeek?

在人工智能领域的又一轮"狼来了"预警中,各国政府再次上演了一出集体焦虑的好戏。 这次的主角是人工智能公司 DeepSeek,而各国的反应仿佛看到了什么洪水猛兽。 在这场看似声势浩大的"防范"行动中,各国似乎都在用同一个模板复制粘贴着相似的说辞——"安全风险"、"数据担忧",仿佛这些词汇成了一个万能的理由。

DeepSeek 私有部署最强指南:满血推理,异构多机分布式,国产显卡无缝支持!

还还在为DeepSeek模型部署的各种难题抓狂? 各种教程的下载分片、合并模型、编译环境……这些繁琐的操作是不是让你头大? DeepSeek R1 火了,私有部署需求暴增,教程满天飞,但实际操作起来却麻烦得要命!

没有数据、没有GPU的情况下怎么训练DeepSeek

春节期间,AI 界热闹非凡,到处都是关于 DeepSeek 的报道。 大家都知道,训练好的模型通常需要昂贵的专用 GPU,这对很多想试试微调技术的人来说,真是一道门槛。 好消息来了:你完全可以用免费的 Google Colab Notebook 来实现微调。

顺丰同城接入DeepSeek 正式迈入智慧物流新时代

在物流行业数字化转型的浪潮中,顺丰同城率先打响了革新第一枪。 作为物流行业首批接入DeepSeek大模型的企业,顺丰同城正式迈入智慧物流新时代。 这次合作的亮点在于DeepSeek大模型的三大核心优势:低成本运营、卓越性能表现以及高度开放的系统架构。

奥特曼再谈DeepSeek:每天醒来都有压力

关乎当红炸子鸡DeepSeek,奥特曼最新观点出炉:对DeepSeek的出现并不意外,而且类似的情况会越来越多。 这就是奥特曼在最新一期《泰晤士报》科技播客节目中所提及的内容之一。 并且在被问及是否担心OpenAI会成为AI界的Napster(首个P2P音乐共享平台,后因商业压力以失败告终)时,他表示:唯一不让这种事发生的方法就是每天都为此担心。

DeepSeek-R1技术解码:如何实现大模型推理能力的提升?

1月20日,幻方量化旗下AI公司深度求索(DeepSeek)发布了新一代开源大模型DeepSeek-R1。 作为一款专注于推理能力的AI大模型,DeepSeek-R1凭借着成本低、推理能力强等优势,在人工智能领域掀起了千层巨浪,引起了人们的广泛关注与讨论。 DeepSeek-R1的成功,让我们更加清晰地认识到推理能力在当下人工智能发展中的重要地位。

雷军:钦佩 DeepSeek 所取得的成就,每个人可能都要学习 AI 知识、使用 AI 工具

雷军表示,自己曾在两年前就建议年轻人学习AI,“已经进入了AI时代,每个人可能都要学习AI方面的知识,学会使用AI的各种工具,这会大幅度提高整个工作效率,也会给生活带来很多便利。”

干货:DeepSeek+SpringAI实现流式对话!

前一篇文章我们实现了《SpringAI集成满血版DeepSeek》,但是大模型的响应速度通常是很慢的,为了避免用户用户能够耐心等待输出的结果,我们通常会使用流式输出一点点将结果输出给用户。 那么问题来了,想要实现流式结果输出,后端和前端要如何配合? 后端要使用什么技术实现流式输出呢?

DeepSeek 会是个好DBA吗?

作为近期作为大火的 AI 产品,Deepseek(简称DS) 已经成为现象级的爆款,朋友圈几乎都被刷屏,大家都在探索将 DS 深入千行百业,看如何能发挥出更大价值。 作为数据库从业者,我也在思考这个问题,看 DS 能做点啥。 圈里已经有几位朋友做了分享,我将从使用者的角度来谈谈对 DS 的使用印象。

OpenAI 奥尔特曼再谈 DeepSeek:表现不错、不惊讶有新对手,想见见团队

奥尔特曼表示,DeepSeek 的出现时间让他颇感意外,但并不惊讶于AI领域有新对手的加入。