理论 - AI在线

如何将机器学习模型部署到生产环境？

译者 | 布加迪审校 | 重楼开发机器学习模型只完成了一半工作。除非部署到生产环境、提供业务价值，否则模型仍然毫无用处。知道如何部署自己的模型已成为任何数据科学家的一项基本技能，许多雇主已经要求我们能做到这一点。

「硅基大脑」来了，UCSF华人实验室打造！神经科学未来不是碳基？

AI起源于人类利用「电脑」模拟「大脑」，希望计算机和人类一样可以处理各种任务。或许，计算机还没有产生和人类一样的「智慧」。但不妨设想一下「硅基大脑」—— 高级的AI模型，它能够破译人类的思维，让「哑巴」重新说话，也许有朝一日，甚至能预测大脑的「一举一动」。

GPT-4价格已被砍成1/150 !OpenAI副总裁回应DeepSeek的竞争，揭秘内部员工花式使用自家产品，有很多工程难题

编辑 | 言征2天前，就在马斯克宣布要以 974 亿美元收购 OpenAI 后，OpenAI 工程副总裁斯里尼瓦斯·纳拉亚南（ Srinivas Narayanan）接受了华尔街日报的一次线下对话，这次对话同样也是出于一场中美 AI 博弈的新语境下：DeepSeek R1低成本训练出可以对标 Open AI o1的强推理模型，甚至登顶了应用排行榜，美国现在已经封禁了DeepSeek应用的下载。主持人当然没有放过斯里尼瓦斯，问了他这个非常敏感的问题。那么 OpenAI 内部究竟是如何看待 DeepSeek 的？

DeepSeek官方发布R1模型推荐设置，这才是正确用法

自春节以来，DeepSeek 就一直是 AI 领域最热门的关键词，甚至可能没有之一，其官方 App 成为了史上最快突破 3000 万日活的应用。最近一段时间，各家 AI 或云服务厂商更是掀起了部署 DeepSeek-R1 服务的狂潮，甚至让薅羊毛的用户们都有点忙不过来了。就在刚刚，DeepSeek 官网 X 帐号终于更新了（上一次更新还是在 1 月 28 日），官方下场推荐了部署 DeepSeek-R1 的设置。

李飞飞看中的万亿赛道，中国首个自研空间智能AI登场！单张图即生3D世界

就在刚刚，昆仑万维正式发布了一款全新自研的Matrix-Zero世界模型。 Matrix-Zero世界模型包含两款子模型：昆仑万维自研的3D场景生成大模型与昆仑万维自研的可交互视频生成大模型。包括两部分功能：支持将用户输入的图片转化为可自由探索的真实合理的3D场景；支持根据用户输入实时生成互动视频效果。

OpenCV | 附代码：使用 ORB 算法检测和跟踪对象

本文中，我将解释什么是ORB，何时应该使用它？并演示如何使用ORB创建一个对象跟踪器。文末附完整代码及C 实现。

当消费陷阱披上 DeepSeek 外衣：你看透"二次支付"背后的双倍收割了吗？

在 AI 浪潮中，真正的竞争力不在于收藏多少课程，而在于保持独立判断和持续学习的能力。 DeepSeek 付费群异军突起，我们还在重复李一舟式的狂欢吗？去年，也差不多是这个时刻，售卖 AI 课的“中国 AI 教父”李一舟陷入学历和虚假宣传争议，最后，他的课程被下架，今天这股热潮还在继续，仿佛是消费主义对技术革命的异化。

DeepSeek671B提到的MOE是什么？图解MOE（混合专家模型）

本文仅做记录，图挺形象的。原文：，你可能会在标题中看到“MoE”这个词。那么，这个“MoE”到底代表什么？

“RAG界的DeepSeek”开源-企业复杂私域知识理解与推理框架PIKE-RAG

PIKE-RAG框架的设计目标是提供一个灵活且可扩展的RAG系统，应对工业应用中复杂多样的任务需求。框架的核心是通过有效的知识提取、理解和组织，以及构建连贯的推理逻辑，解决了RAG系统在工业应用中的局限性。下面来看下PIKE-RAG框架及其实现过程，供参考。

网络安全是Agentic AI成功的关键，我们该怎么做？

根据专家预测，Agentic AI将带来两到三倍于当前大语言模型(LLM)的生产力提升，因此2025年或将成为Agentic AI的元年。然而，就如任何强大的新技术一样， Agentic AI具有巨大的潜力，但也存在着重大的安全风险。一旦这些自主系统偏离预期轨道，后果可能是灾难性的。

Spring 宣布接入 DeepSeek

DeepSeek 是深度求索公司发布的大模型，是国产之光。大家应该学会如何使用 DeepSeek 大模型，下面我们将看下如何开发基于 DeepSeek 大模型的智能应用。 DeepSeek 大模型DeepSeek 推出两款模型；DeepSeek V 系列，对于V系列主要对话，模型名称：deepseek-chatDeepSeek R 系统，对于R系统主要推理，模型名称：deepseek-reasonerDeepSeek 官方更新日志，可以看到模型发布和演化的过程。

DeepSeek R1遇难题142次"I give up"，研究还称需增加推理时机控制机制

最新大语言模型推理测试引众议，DeepSeek R1常常在提供错误答案前就“我放弃”了？？ Cursor刚刚参与了一项研究，他们基于NPR周日谜题挑战（The Sunday Puzzle），构建了一个包含近600个问题新基准测试。

全面拥抱 AI 时代：DeepSeek 生态工具大集合

随着人工智能技术的快速发展，越来越多优秀的AI工具正在改变我们的工作和生活方式。今天给大家介绍一下 DeepSeek（深度求索）生态系统中的实用工具集合，帮助你在各种场景下更好地使用AI能力。 📱 日常应用篇桌面应用如果你想在电脑上体验AI助手，这些应用一定不要错过：Chatbox：一款支持Windows、Mac和Linux的多模型桌面客户端，界面简洁，使用方便。

TikTok 推出新 IDE Trae，用于快速构建 AI 应用

字节跳动（TikTok 的母公司）最近发布了一款名为 Trae 的集成开发环境（IDE），基于 Visual Studio Code（VS Code）进一步定制。在 VS Code 原本的强大功能上，Trae 附加了 AI 模块，帮助开发者更轻松地编写、调试和优化代码，有时甚至无需手写任何代码。如果你用过 Cursor AI，应该会觉得 Trae 有点类似。

我用 AI 创作了一首专属前端的歌《像素诗人》，送给各位前端er，还挺好听！

听完这首歌，你觉得怎么样？下面就来简单看看这首歌的创作过程。首先，使用 DeepSeek（）来生成歌词，提问时打开深度思考和联网搜索。

联想智能云深度集成DeepSeek R1大模型驱动企业“智能进阶”

记者今天从联想集团了解到，联想智能云（xCloud）解决方案已将DeepSeek R1及其蒸馏系列大模型全面集成到产品矩阵中，覆盖模型服务、模型开发、智能体构建、智能运维等核心环节。据了解，联想智能云（xCloud）解决方案支持DeepSeek大模型的多种部署方式，包括云端、私有化和一体机/工作站等，可通过完整的AI能力体系和技术整合、场景创新与开源生态的构建，为企业智能化转型注入新动能。全面支持DeepSeek R1-671B满血模型等全系模型。

首个AI儿科医生“上岗” 与13位儿科专家共同完成疑难病例会诊

2025年2月13日，国家儿童医学中心首都医科大学附属北京儿童医院开展了国内首次“AI儿科医生多学科专家”的双医并行多学科会诊。在此次特殊的多学科会诊中，不仅有包括倪鑫院长在内的，来自耳鼻咽喉头颈外科，肿瘤外科，肿瘤内科，神经外科，神经内科，精神科，感染内科，免疫科，骨科，医学影像中心，超声科，放疗科和口腔科等科室的13位知名专家。还有一位引人瞩目的特殊专家——由北京儿童医院与百川智能、小儿方健康科技联合研发，以Baichuan M1大模型为底座打造的“AI儿科医生”！

复旦团队提出Transformer生成的原子嵌入策略，可通过ML提高晶体特性的预测准确性

编辑 | 白菜叶近年来，在化学分子性质与结构预测领域出现了大量基于 Transformer 的训练方法和预测模型，例如 OrbNet、3D-Transformer 等。科学家们认为这些方法和模型，能够充分发挥 Transformer 架构在处理原子相互作用和捕捉三维结构方面的优势，从而高效地表示原子间复杂的相互作用。在这些进步的推动下，复旦大学的研究人员开发了自制的 CrystalTransformer 模型，基于 Transformer 架构生成称为 ct-UAE 的通用原子嵌入，该模型为每个原子学习独特的「指纹」，捕捉它们在材料中的功能和相互作用的本质。

理论