理论

AI 重塑运维：基于 Spring AI 的 Docker 自然语言管理实践

MCP (Model Context Protocol) 是一个创新的开源协议，它的核心目标是彻底简化 AI 应用程序的开发流程。通过提供标准化的通信接口，MCP 在 AI 模型与应用程序上下文之间搭建了一座智能桥梁，让开发者能够更加高效地构建和部署 AI 驱动的应用。 MCP Docker 服务器使用指南图片在容器化技术日益普及的今天，Docker 的管理和运维工作往往需要掌握大量的命令和配置知识。

1/26/2025 12:34:46 PM

冷冷

太惨，一个月仅23个下载！盘点2024“理想丰满现实骨感”的大模型们！

整理 | 言征出品 | 51CTO技术栈（微信号：blog51cto）大型语言模型的竞争似乎正在结束，只有少数几个明显的赢家。其中，DeepSeek V3 已成为 2024 年的焦点，引领中国开源模型的发展。据 Hugging Face 称，DeepSeek V3 与 GPT-4 和 Claude 3.5 等闭源巨头正面交锋，上个月的下载量为 45,499 次，与Meta 的 Llama 3.1（491,629 次下载）和谷歌的 Gemma 2（377,651 次下载）并驾齐驱。

1/26/2025 11:38:54 AM

言征

Meta杨立昆引燃全民大讨论：美政府有些人被洗脑了，监管让开源变得像非法一样！Meta也犯过错！大模型不如猫，保质期就3年！

编辑 | 言征出品 | 51CTO技术栈（微信号：blog51cto）1月23日，在冬季达沃斯论坛的“辩论技术”环节，Meta公司副总裁兼首席人工智能科学家Yann Lecun、麻省理工学院媒体实验室主任 Dava Newman、Axios首席技术记者Ina Turpen Fried（主持人）就未来十年前沿科技进行了时长47分钟的“全民”大讨论，话题涵盖了LLM、智能体、消费机器人、脑机接口、跨物种、太空探索，也讨论了非常让Meta敏感的“技术作恶”、审查监管、开闭源之争。观众们更是抓住机会让两位嘉宾抖出了很多猛料。 Lecun表示，现在的大模型并没有达到预期效果，在很多方面都存在不足：“我认为当前 LLM范式的保质期相当短，可能只有3到5年。

1/26/2025 11:35:05 AM

言征

世界模型再进化！博士AdaWM：自适应世界模型规划新SOTA

本文经自动驾驶之心公众号授权转载，转载请联系出处。论文链接：：基于自适应世界模型的自动驾驶规划。基于世界模型的强化学习（RL）已经成为一种有前景的自动驾驶方法，它学习潜在动态模型并且用其训练规划策略。

1/26/2025 11:00:00 AM

自动驾驶专栏

重构的道法术器：探讨AI智能对工具的影响

经过影片出租店的完整演练，对这样一个如麻雀般完整而小的遗留项目展开重构，使得我们对重构建立了一个整体的印象，也有利于我们将前面介绍的各种重构知识串联起来，现在，有必要对整个重构做一次复盘。为了帮助大家更好地理解重构，我认为可以从道、法、术、器这四个层次做一番总结。图片道是万物变迁循环中亘古不变的规律，是自然环境、事物的自然规律和发展方向。

1/26/2025 10:12:13 AM

张逸少

人类最后一次考试，AI惨败正确率＜10%！数百顶级专家联手出题，DeepSeek竟是王者

捍卫「人类智慧」最后一战!刚刚，Scale AI和Center for AI Safety（CAIS）公布了「人类最后一场考试」结果！新基准全称「人类最后一次考试」（Humanity’s Last Exam），简称「HLM」，包含3000个问题，由数百位领域专家开发，用于追寻人类知识推理的边界。目前，最好的模型，准确率也小于10%，而且自信「过头」。

1/26/2025 9:45:00 AM

新智元

解密FedDAT：首个多模态异构联邦学习高效微调框架，突破数据异构与通信瓶颈！

FedDAT: An Approach for Foundation Model Finetuning in Multi-Modal Heterogeneous Federated Learning一、一眼概览FedDAT提出了一种创新的双适配器教师框架（Dual-Adapter Teacher, DAT），结合参数高效微调和互知识蒸馏，解决了多模态异构联邦学习（FL）中的数据异构性问题，并在多个视觉-语言任务基准上取得了最优表现。二、核心问题如何在多模态联邦学习环境中，在数据异构性和通信预算限制下，实现基础模型的高效分布式微调，以提升视觉-语言任务的性能，是本研究的核心问题。三、技术亮点1.

1/26/2025 9:07:46 AM

萍哥学AI

曝DeepSeek让Llama4未发布已落后！小扎坐不住了：2025预算4000亿起步，年底AI算力将达130万卡

Meta这次真的坐不住了，计划在AI上继续加码！匿名员工爆料，黑马DeepSeek的出现，让Llama 4还未发布就已经落后，Meta慌了。就在这一消息沸沸扬扬时，小扎放出消息，2025年继续扩大AI投资。

1/26/2025 9:00:00 AM

量子位

DeepSeek-R1持续震撼硅谷：跻身竞技榜前三，创始人梁文锋采访被“拿放大镜”看

“神秘东方力量”DeepSeek给硅谷带来的影响，还在不断泛起涟漪——刚刚，DeepSeek-R1跻身大模型竞技榜前三。以开源、便宜20倍的“身价”与ChatGPT-4o（2024.11.20）并列。在复杂提示词/风格控制榜单上，R1位列第一。

1/26/2025 8:00:00 AM

量子位

CS本科就业寒冬来袭！名校24届就业率被曝不足50%，企业宁用AI不招应届生

前段时间，UC伯克利CS本科生毕业即失业，以及焦虑的AI博士们在顶会现场后悔读博的故事，曾引起了业界的广泛关注。今天，一条知乎热搜，再次引起了全网热议。（图片经过处理）有传言称，某高校计算机学院的24届本科生，就业不足50%，低于全校平均水平。

1/26/2025 7:45:00 AM

新智元

让AI成为你的React代码专家的3个秘诀

深夜，我盯着眼前庞大的React项目，一行行代码仿佛在跳动。作为一名全栈开发者，我深知重构这样的项目将耗费无数个不眠之夜。然而，当我尝试让AI协助修改代码时，却屡屡遇到挫折：组件太复杂导致AI理解困难，代码结构混乱让AI无从下手，项目依赖关系复杂使得AI难以准确推断......如何让AI真正成为我们的得力助手？

1/26/2025 12:00:30 AM

coderidea

满血o3即将推出，OpenAI的Q1还有硬货！首席产品官：o1 Pro不可能一直傻乎乎地亏钱！今明两年不会推出机器人

出品 | 51CTO技术栈（微信号：blog51cto）前天，OpenAI最大的产品经理，首席产品官Weil刚剧透智能体Q1就发出。一转头，今天就把Operator推出来了？？

1/24/2025 4:52:32 PM

颠覆LLM格局！AI2新模型OLMo2，训练过程全公开，数据架构双升级

最近，非营利研究机构AI2上新了OLMo2系列模型，他们称之为「迄今为止最好的完全开源模型」。 OLMo 2系列包含7B和13B两个型号，相比如Llama 3.1和Qwen 2.5等开源模型达到了同等甚至更优的性能，同时FLOPS计算量更少，在性能和计算效率之间取得了极佳的平衡，为开源LLM开辟了新的可能性。不同大小开源模型的性能对比，OLMo 2的表现优于同参数规模模型在多个下游任务上，OLMo 2展现出了强大的泛化能力和适应能力。

1/24/2025 3:40:00 PM

新智元

六大维度，LLM「问题生成」首次正面PK人类！伯克利等发布最新研究

长期以来，问题生成（Question Generation）任务都是根据「给定事实」来编写各种相关问题，已经发展出了很多自动化的方法。大型语言模型（LLM）的兴起，极大提升了各种自然语言处理（NLP）任务的性能，其中也包括问题生成，虽然应用广泛，但还没有研究讨论过「用LLMs生成问题的特点」。没有额外提示约束时，LLMs是更倾向于生成较长还是较短的问题？

1/24/2025 3:30:00 PM

新智元

OpenAI首个智能体Operator大测评，你也能拥有24小时私人管家！

演唱会抢票终于不用自己蹲守了，公司订餐也可以直接「无脑托管」，这就是OpenAI今天发布的Operator。顾名思义，Operator就是能帮你端到端处理任务的AI智能体。比较有趣的是，OpenAI针对Operator新开了一个网页operator.chatgpt.com，而不是像之前发布的功能都直接统一内置在ChatGPT中。

1/24/2025 3:09:43 PM

新智元

向视觉版o1出击，阶跃张祥雨团队推出“慢感知”，实现感知层面的推理时scaling

视觉版o1的初步探索，阶跃星辰&北航团队推出“慢感知”。研究人员认为：1）目前多模领域o1-like的模型，主要关注文本推理，对视觉感知的关注不够。 2）精细/深度感知是一个复杂任务，且是未来做视觉推理的重要基础。

1/24/2025 3:05:09 PM

量子位

史上最难大模型测试集，千名专家铸成！没有模型得分超过10%，但DeepSeek-R1超o1

史上最难的大模型测试集来了！包括o1在内，没有任何一个模型得分超过10%。题目来自500多家机构的1000多名学者，最终入围的题目有3000多道，全部都是研究生及以上难度。

1/24/2025 3:03:27 PM

量子位

新型人工智能“黑帽”工具：GhostGPT 带来的威胁与挑战

最近，Abnormal Security的研究人员发现了一个专门为网络犯罪创建的无审查AI聊天机器人——GhostGPT，是人工智能用于非法活动的新前沿，可以被用于网络钓鱼计划、恶意软件开发和漏洞利用开发。 GhostGPT的主要特点快速处理：使攻击者能够快速生成恶意内容。无日志政策：声称不记录用户活动，吸引那些寻求匿名的人。

1/24/2025 3:01:19 PM

跳舞的花栗鼠

资讯热榜

上海AI实验室开源InternVL3系列多模态大型语言模型 Haisnap横空出世，小白用户也能轻松打造AI应用「交交」媲美GPT-4o！上海交大推出口语对话情感大模型，首个纯学术界自研！ OpenAI开源超Agent:Codex CLI,五小时内破 5000 颗星 ChatGPT重磅更新：新增图像库功能，可查看自己用GPT生成的所有图片本地部署DeepSeek+DiFy平台构建智能体应用 OPPO 小布助手网页版上线，接入满血版 DeepSeek kimi开源视觉语言模型 Kimi-VL 与 Kimi-VL-Thinking，多项基准超越 GPT-4o

标签云

人工智能 OpenAI AIGC AI ChatGPT DeepSeek AI绘画数据机器人谷歌模型大模型 Midjourney 智能用户学习开源 GPT 微软 Meta AI创作图像技术论文 Stable Diffusion 马斯克 Gemini 算法蛋白质生成式芯片代码英伟达腾讯神经网络计算研究 Sora AI for Science 3D Anthropic AI设计机器学习 GPU 开发者场景华为预测伟达 Transformer 百度苹果人形机器人深度学习 AI视频模态 xAI 驾驶字节跳动文本搜索大语言模型 Claude Copilot 具身智能神器推荐 LLaMA 算力安全应用视频生成科技视觉亚马逊干货合集 2024 AGI 特斯拉训练大型语言模型