理论

AI 赋能！Spring Boot 封装智能模块，轻松实现自动化

在当今数字化时代，人工智能（AI）正以前所未有的速度深入各个行业，成为提升企业竞争力和优化用户体验的重要驱动力。无论是智能客服、自动文本生成，还是数据分析和预测，AI 的应用场景正变得越来越广泛。对于开发者而言，如何高效地将 AI 技术集成到业务系统中，是一个至关重要的问题。

2/8/2025 8:16:16 AM

路条编程

DeepSeek + IDEA！辅助编程太强了！

2025年的春节可以说是人工智能在中国史上飘红的一段历史时刻，年后上班的第一天，便马不停蹄的尝试新技能。今天的科技在飞速发展，编程领域的人工智能工具犹如雨后春笋般涌现。其中，DeepSeek 则以其卓越的性能和智能化的功能，迅速在众多开发者中赢得了青睐。

2/8/2025 8:00:00 AM

码猿技术专栏

LLM时代，计算蛋白质科学进展如何？香港理工大学等发布系统性综述

编辑丨coisini作为生命的基本构建单元，蛋白质在几乎所有基本生命活动中扮演着不可或缺的角色，例如新陈代谢、信号传导、免疫反应等。如下图所示，蛋白质遵循序列 - 结构 - 功能范式。图注：蛋白质遵循序列-结构-功能范式。

2/7/2025 6:25:00 PM

ScienceAI

Nature：OpenAI推出AI研究助手，深度综述能力引发学界关注

编辑 | matrix科技巨头 OpenAI 于 2 月 2 日推出付费工具「Deep Research」，这款工具能将数十或数百个网站的信息综合为带有引用的完整报告。此举紧随谷歌在去年 12 月发布的类似产品，标志着 AI 个人研究助手时代的来临。这类工具最显著的特点是将原本需要数小时的研究工作压缩至数十分钟内完成，引发学界广泛关注。

2/7/2025 6:24:00 PM

ScienceAI

无服务器（Serverless）人工智能推理

无服务器计算是一种云计算模式，云服务提供商（如AWS、Azure和GCP）管理服务器基础设施，并根据需要动态分配资源。开发者可以直接调用API，或者以函数的形式编写代码，云服务商会根据特定事件触发这些函数。这意味着开发者可以自动扩展应用程序，无需担心服务器管理和部署，从而节省成本并提高敏捷性。

2/7/2025 4:45:21 PM

刘睿暄

EvalPlanner：基于“计划-执行”双阶段的大语言模型评估框架

大语言模型(LLM)评估系统在生成思维链(Chain-of-Thought, CoT)序列时，需要系统地捕捉评估过程中的推理步骤。但是由于缺乏人工标注的CoT训练数据，以及预定义评估提示在复杂任务中的局限性，构建高质量的LLM评估模型面临重大挑战。另外手动调整评估指令的方法在面对多样化和复杂任务时表现出明显的局限性。

2/7/2025 4:07:39 PM

SACHIN KUMAR

AI时代的数据安全革命：企业智能转型的洁净数据法则

在采访中，Pangea的CEO Oliver Friedrichs深入剖析了企业AI化进程中数据卫生管理的关键作用。随着AI应用处理敏感数据规模呈指数级增长，陈旧的访问控制体系与过时的安全策略正衍生出前所未有的风险。问：数据卫生实践如何与整体网络安全战略协同?企业在整合内部数据与大语言模型(LLM)时，正面临全新的数据隐私挑战。

2/7/2025 3:55:25 PM

Mirko Zorz

AI成本革命：DeepSeek-R1与OpenAI的颠覆性突破重构企业智能新范式

AI领域的发展日新月异，如果你跟不上步伐，就会落后。近期的两项进展正在重塑开发者和企业的格局：DeepSeek发布R1模型，以及OpenAI推出新的DeepResearch产品，它们共同重新定义了强大推理模型的成本和可及性，这一点已被广泛报道，然而，较少被讨论的是，它们将如何推动公司采用蒸馏、有监督微调(SFT)、强化学习(RL)和检索增强生成(RAG)等技术，来构建更智能、更专业的AI应用。在DeepSeek惊人成就的初步兴奋感逐渐平息后，开发者和企业决策者需要考虑这对他们意味着什么。

2/7/2025 3:52:20 PM

Matt Marshall

DeepSeek被禁！最高判刑20年，外交部回应！

过去几周，中国人工智能公司DeepSeek的崛起，在全球范围内引发了一场前所未有的争议。这款凭借“低成本、高性能”迅速抢占市场的AI工具，不仅一度超越ChatGPT登顶美国应用下载榜，还导致多国科技股震荡下跌。然而，其“高光时刻”很快被多国的禁令与限制措施打破——美国、意大利、澳大利亚、印度、韩国、日本等国相继以“国家安全”“数据隐私风险”为由，禁止或限制DeepSeek在政府及企业中的使用。

2/7/2025 3:46:17 PM

不才陈某

突破“数据再生产陷阱”：从“语言游戏”迈向超人智能

人类文明的演进始终离不开对信息流通方式的改造：从印刷术到电报，再到互联网，每一次交互门槛的下降都可能催生出新的社会与技术浪潮。在当前的人工智能（AI）领域，这种“门槛降低”也正在发生：近期，开源大语言模型 DeepSeek R1 借助强化学习技术，在多个关键指标上接近了商用顶尖模型 OpenAI O1，引发行业热议。为什么这一进展值得关注？

2/7/2025 3:46:00 PM

新闻助手

你的提示词根本只是在浪费算力，让deepseek达到最佳效果的三大原则

最近几周自学deepseek原理应用实践，一些成果，和大家分享。与deepseek这类AI对话，为了达到最佳效果，提示词应当遵循哪三大原则？清晰性；结构化；细节化；为什么？

2/7/2025 3:11:41 PM

58沈剑

被DeepSeek带火的知识蒸馏，开山之作曾被NeurIPS拒收，Hinton坐镇都没用

DeepSeek带火知识蒸馏，原作者现身爆料：原来一开始就不受待见。称得上是“蒸馏圣经”、由Hinton、Oriol Vinyals、Jeff Dean三位大佬合写的《Distilling the Knowledge in a Neural Network》，当年被NeurIPS 2014拒收。如何评价这篇论文的含金量？

2/7/2025 3:10:00 PM

量子位

自定义训练的 YOLOv8 模型进行邮票整理

还记得人们过去常常寄信和明信片的日子吗？明信片上通常描绘了你所访问的城市或国家的一些风景如画的景色，但对许多人来说，邮票才是主要的吸引力。它们被视为微型艺术品，被认为是非常值得收藏的。

2/7/2025 2:52:11 PM

二旺

架构创新×模型创新！清微智能全面适配DeepSeek模型推理和训练

随着大模型技术向多场景渗透，算力需求呈现「大规模、高弹性、低成本」三重挑战。清微智能基于全球领先的可重构计算架构（CGRA）推出可重构算力芯片RPU（Reconfigurable Processing Unit），实现单机高效运行千亿级参数模型推理和训练，以动态硬件重构、全栈优化及高能效比，重新定义国产AI芯片的性价比标杆。新年伊始，DeepSeek的惊艳亮相，不仅在科技圈掀起巨浪，其影响还涉及到经济、社会、政策等多个维度，相关企业迅速跟进。

2/7/2025 2:04:44 PM

新智元

英伟达联手MIT清北发布SANA 1.5！线性扩散Transformer再刷文生图新SOTA

近年来，文本生成图像的技术不断突破，但随着模型规模的扩大，计算成本也随之急剧上升。为此，英伟达联合MIT、清华、北大等机构的研究人员提出了一种高效可扩展的线性扩散Transformer——SANA，在大幅降低计算需求的情况下，还能保持有竞争力的性能。 SANA1.5在此基础上，聚焦了两个关键问题：线性扩散Transformer的可扩展性如何？

2/7/2025 2:01:20 PM

新智元

DeepSeek 用的 GRPO 占用大量内存？有人给出了些破解方法

自 DeepSeek-R1 发布以来，群组相对策略优化（GRPO）因其有效性和易于训练而成为大型语言模型强化学习的热门话题。 R1 论文展示了如何使用 GRPO 从遵循 LLM（DeepSeek-v3）的基本指令转变为推理模型（DeepSeek-R1）。 GRPO 是一种在线学习算法（online learning algorithm），它通过使用训练过程中由训练模型自身生成的数据来进行迭代改进。

2/7/2025 1:45:58 PM

机器之心

微软官宣All in智能体，SWE Agent首曝光！奥特曼预警2025编程巨变

奥特曼预言，2025年软件工程将迎来巨变。开年智能体大爆发，AI自动化软件工程已成为不争的事实。就在今天，纳德拉官宣，GitHub Copilot将all-in智能体，微软自主的SWE智能体首次亮相。

2/7/2025 1:26:13 PM

新智元

DeepSeek R1 集成难题完美解决：Deepseek4j 已开源

一、为什么需要 deepseek4j？ 1.1 现有框架的局限性思维链内容丢失：R1 最核心的推理过程完全被忽略响应模式不兼容：无法处理"思考在前、结论在后"的输出模式参数限制：temperature、top_p 等关键参数设置失效流式处理不完善：用户体验欠佳虽然笔者上篇博客介绍了如何使用 WebFlux 直接调用 DeepSeek API，但这种方式存在一些问题：开发成本高：直接调用 API 或改造现有框架需要处理大量细节，包括请求构建、响应解析、错误处理等。一不做二不休，为了彻底解决这些问题，笔者基于 OpenAI4J[1] 项目的优秀架构，打造了一个专门面向 DeepSeek 的开箱即用方案 DeepSeek4J[2]增强支持 DeepSeek 独有的思维链和账单特性增加 Project Reactor 的全面响应式支持提供集成 Spring Boot Starter，提供自动配置二、核心特性 ✨ 完整保留思维链能力、账单🚀 响应式流式处理🛠 简单优雅的 API 设计📦 开箱即用的 Spring Boot 集成，同时支持 2.x / 3.x💡 内置调试页面🔍 详细的请求响应日志🔧 灵活的代理配置⚡️ 响应式编程支持三、快速开始 3.1 添加依赖复制3.2 配置参数复制3.3 基础使用复制3.4 进阶配置复制

2/7/2025 1:10:06 PM

冷冷

资讯热榜

上海AI实验室开源InternVL3系列多模态大型语言模型 Haisnap横空出世，小白用户也能轻松打造AI应用「交交」媲美GPT-4o！上海交大推出口语对话情感大模型，首个纯学术界自研！ OpenAI开源超Agent:Codex CLI,五小时内破 5000 颗星 ChatGPT重磅更新：新增图像库功能，可查看自己用GPT生成的所有图片本地部署DeepSeek+DiFy平台构建智能体应用 OPPO 小布助手网页版上线，接入满血版 DeepSeek kimi开源视觉语言模型 Kimi-VL 与 Kimi-VL-Thinking，多项基准超越 GPT-4o

标签云

人工智能 OpenAI AIGC AI ChatGPT DeepSeek AI绘画数据机器人谷歌模型大模型 Midjourney 智能用户学习开源 GPT 微软 Meta AI创作图像技术论文 Stable Diffusion 马斯克 Gemini 算法蛋白质生成式芯片代码英伟达腾讯神经网络计算研究 Sora AI for Science 3D Anthropic AI设计机器学习 GPU 开发者场景华为预测伟达 Transformer 百度苹果人形机器人深度学习 AI视频模态 xAI 驾驶字节跳动文本搜索大语言模型 Claude Copilot 具身智能神器推荐 LLaMA 算力安全应用视频生成科技视觉亚马逊干货合集 2024 AGI 特斯拉训练大型语言模型

理论