理论

如何将机器学习模型部署到生产环境?

译者 | 布加迪审校 | 重楼开发机器学习模型只完成了一半工作。 除非部署到生产环境、提供业务价值,否则模型仍然毫无用处。 知道如何部署自己的模型已成为任何数据科学家的一项基本技能,许多雇主已经要求我们能做到这一点。

「硅基大脑」来了,UCSF华人实验室打造!神经科学未来不是碳基?

AI起源于人类利用「电脑」模拟「大脑」,希望计算机和人类一样可以处理各种任务。 或许,计算机还没有产生和人类一样的「智慧」。 但不妨设想一下「硅基大脑」—— 高级的AI模型,它能够破译人类的思维,让「哑巴」重新说话,也许有朝一日,甚至能预测大脑的「一举一动」。

GPT-4价格已被砍成1/150 !OpenAI副总裁回应DeepSeek的竞争,揭秘内部员工花式使用自家产品,有很多工程难题

编辑 | 言征2天前,就在马斯克宣布要以 974 亿美元收购 OpenAI 后,OpenAI 工程副总裁斯里尼瓦斯·纳拉亚南( Srinivas Narayanan) 接受了华尔街日报的一次线下对话,这次对话同样也是出于一场中美 AI 博弈的新语境下:DeepSeek R1低成本训练出可以对标 Open AI o1的强推理模型,甚至登顶了应用排行榜,美国现在已经封禁了DeepSeek应用的下载。 主持人当然没有放过斯里尼瓦斯,问了他这个非常敏感的问题。 那么 OpenAI 内部究竟是如何看待 DeepSeek 的?

DeepSeek官方发布R1模型推荐设置,这才是正确用法

自春节以来,DeepSeek 就一直是 AI 领域最热门的关键词,甚至可能没有之一,其官方 App 成为了史上最快突破 3000 万日活的应用。 最近一段时间,各家 AI 或云服务厂商更是掀起了部署 DeepSeek-R1 服务的狂潮,甚至让薅羊毛的用户们都有点忙不过来了。 就在刚刚,DeepSeek 官网 X 帐号终于更新了(上一次更新还是在 1 月 28 日),官方下场推荐了部署 DeepSeek-R1 的设置。

李飞飞看中的万亿赛道,中国首个自研空间智能AI登场!单张图即生3D世界

就在刚刚,昆仑万维正式发布了一款全新自研的Matrix-Zero世界模型。 Matrix-Zero世界模型包含两款子模型:昆仑万维自研的3D场景生成大模型与昆仑万维自研的可交互视频生成大模型。 包括两部分功能:支持将用户输入的图片转化为可自由探索的真实合理的3D场景;支持根据用户输入实时生成互动视频效果。

OpenCV | 附代码:使用 ORB 算法检测和跟踪对象

本文中,我将解释什么是ORB,何时应该使用它? 并演示如何使用ORB创建一个对象跟踪器。 文末附完整代码及C 实现。

当消费陷阱披上 DeepSeek 外衣:你看透"二次支付"背后的双倍收割了吗?

在 AI 浪潮中,真正的竞争力不在于收藏多少课程,而在于保持独立判断和持续学习的能力。 DeepSeek 付费群异军突起,我们还在重复李一舟式的狂欢吗? 去年,也差不多是这个时刻,售卖 AI 课的“中国 AI 教父”李一舟陷入学历和虚假宣传争议,最后,他的课程被下架,今天这股热潮还在继续,仿佛是消费主义对技术革命的异化。

DeepSeek671B提到的MOE是什么?图解MOE(混合专家模型)

本文仅做记录,图挺形象的。 原文:,你可能会在标题中看到“MoE”这个词。 那么,这个“MoE”到底代表什么?

“RAG界的DeepSeek”开源-企业复杂私域知识理解与推理框架PIKE-RAG

PIKE-RAG框架的设计目标是提供一个灵活且可扩展的RAG系统,应对工业应用中复杂多样的任务需求。 框架的核心是通过有效的知识提取、理解和组织,以及构建连贯的推理逻辑,解决了RAG系统在工业应用中的局限性。 下面来看下PIKE-RAG框架及其实现过程,供参考。

网络安全是Agentic AI成功的关键,我们该怎么做?

根据专家预测,Agentic AI将带来两到三倍于当前大语言模型(LLM)的生产力提升,因此2025年或将成为Agentic AI的元年。 然而,就如任何强大的新技术一样, Agentic AI具有巨大的潜力,但也存在着重大的安全风险。 一旦这些自主系统偏离预期轨道,后果可能是灾难性的。

Spring 宣布接入 DeepSeek

DeepSeek 是深度求索公司发布的大模型,是国产之光。 大家应该学会如何使用 DeepSeek 大模型,下面我们将看下如何开发基于 DeepSeek 大模型的智能应用。 DeepSeek 大模型DeepSeek 推出两款模型;DeepSeek V 系列,对于V系列主要 对话,模型名称:deepseek-chatDeepSeek R 系统,对于R系统主要 推理, 模型名称:deepseek-reasonerDeepSeek 官方更新日志,可以看到模型发布和演化的过程。

DeepSeek R1遇难题142次"I give up",研究还称需增加推理时机控制机制

最新大语言模型推理测试引众议,DeepSeek R1常常在提供错误答案前就“我放弃”了? ? Cursor刚刚参与了一项研究,他们基于NPR周日谜题挑战(The Sunday Puzzle),构建了一个包含近600个问题新基准测试。

全面拥抱 AI 时代:DeepSeek 生态工具大集合

随着人工智能技术的快速发展,越来越多优秀的AI工具正在改变我们的工作和生活方式。 今天给大家介绍一下 DeepSeek(深度求索)生态系统中的实用工具集合,帮助你在各种场景下更好地使用AI能力。 📱 日常应用篇桌面应用如果你想在电脑上体验AI助手,这些应用一定不要错过:Chatbox:一款支持Windows、Mac和Linux的多模型桌面客户端,界面简洁,使用方便。

TikTok 推出新 IDE Trae,用于快速构建 AI 应用

字节跳动(TikTok 的母公司)最近发布了一款名为 Trae 的集成开发环境(IDE),基于 Visual Studio Code(VS Code)进一步定制。 在 VS Code 原本的强大功能上,Trae 附加了 AI 模块,帮助开发者更轻松地编写、调试和优化代码,有时甚至无需手写任何代码。 如果你用过 Cursor AI,应该会觉得 Trae 有点类似。

我用 AI 创作了一首专属前端的歌《像素诗人》,送给各位前端er,还挺好听!

听完这首歌,你觉得怎么样? 下面就来简单看看这首歌的创作过程。 首先,使用 DeepSeek()来生成歌词,提问时打开深度思考和联网搜索。

联想智能云深度集成DeepSeek R1大模型驱动企业“智能进阶”​

记者今天从联想集团了解到,联想智能云(xCloud)解决方案已将DeepSeek R1及其蒸馏系列大模型全面集成到产品矩阵中,覆盖模型服务、模型开发、智能体构建、智能运维等核心环节。 据了解,联想智能云(xCloud)解决方案支持DeepSeek大模型的多种部署方式,包括云端、私有化和一体机/工作站等,可通过完整的AI能力体系和技术整合、场景创新与开源生态的构建,为企业智能化转型注入新动能。 全面支持DeepSeek R1-671B满血模型等全系模型。

首个AI儿科医生“上岗” 与13位儿科专家共同完成疑难病例会诊

2025年2月13日,国家儿童医学中心首都医科大学附属北京儿童医院开展了国内首次“AI儿科医生 多学科专家”的双医并行多学科会诊。 在此次特殊的多学科会诊中,不仅有包括倪鑫院长在内的,来自耳鼻咽喉头颈外科,肿瘤外科,肿瘤内科,神经外科,神经内科,精神科,感染内科,免疫科,骨科,医学影像中心,超声科,放疗科和口腔科等科室的13位知名专家。 还有一位引人瞩目的特殊专家——由北京儿童医院与百川智能、小儿方健康科技联合研发,以Baichuan M1大模型为底座打造的“AI儿科医生”!

复旦团队提出Transformer生成的原子嵌入策略,可通过ML提高晶体特性的预测准确性

编辑 | 白菜叶近年来,在化学分子性质与结构预测领域出现了大量基于 Transformer 的训练方法和预测模型,例如 OrbNet、3D-Transformer 等。 科学家们认为这些方法和模型,能够充分发挥 Transformer 架构在处理原子相互作用和捕捉三维结构方面的优势,从而高效地表示原子间复杂的相互作用。 在这些进步的推动下,复旦大学的研究人员开发了自制的 CrystalTransformer 模型,基于 Transformer 架构生成称为 ct-UAE 的通用原子嵌入,该模型为每个原子学习独特的「指纹」,捕捉它们在材料中的功能和相互作用的本质。