工具

6周搞定18个月的工作量，爱彼迎不满老工具，暴力循环大模型怒迁代码，效果出奇好，怎么回事？谷歌亚马逊也做过类似的事

编辑 | 云昭Anthropic首席执行官Dario时不时就会出来发声，声称人工智能即将取代人工编码，或者抛出一个惊人的数字，预测在短短6个月内将有90%的编码工作将被AI取代。这种措辞无疑有夸大的成分，但这里想说的是，这并非空穴来风，或许6个月内AI不会取代90%的程序员，但取代90%的编程工作不无可能！因为企业接纳和适配大模型的速度远比我们想象得要快！

4/18/2025 4:05:39 PM

云昭

从思考到行动：大模型自主工具调用能力的深度实现

本项目由复旦大学知识工场实验室肖仰华教授、梁家卿青年副研究员领导，博士生韩槿一，硕士生李廷云、熊程元、姜子上、王昕奕等同学共同参与完成。 GPT - 4o、Deepseek - R1 等高级模型已展现出令人惊叹的「深度思考」能力：理解上下文关联、拆解多步骤问题、甚至通过思维链（Chain - of - Thought）进行自我验证、自我反思等推理过程。但是，多数主流模型仍在基础问题上犯错，复杂四则运算计算失误，简单「两个小数比大小」出错、甚至连数清楚 strawberry 里有几个「r」都能翻车……即使提示像 R1 这样具备深度思考能力的大模型也要消耗大量的 token 才能勉强答对。

4/17/2025 10:43:00 AM

机器之心

OpenAI开源超火Agent，五小时破5000颗星，霸榜Github

在今天凌晨1点的产品发布中，OpenAI还开源了一个终端轻量级代码Agent智能体——Codex CLI。从凌晨到现在只用了5小时左右，Codex CLI直接破5000星霸榜Github，估计今天能破1万颗星，将成为一款明星级Agent。 OpenAI联合创始人兼总裁Greg Brockman表示，Codex CLI只是第一款代码工具，未来还将继续开源Agent产品。

4/17/2025 9:58:32 AM

AIGC开放社区

刚刚，OpenAI发布最强推理模型o3！图像深度思考首秀，开源编程智能体已揽5k+star

深夜，OpenAI 发布了 o 系列模型的最新成果 o3 和 o4-mini。该系列模型经过训练，会在响应之前进行更长时间的思考。 OpenAI 表示，这是他们迄今为止发布的最智能模型，也标志着 ChatGPT 能力的巨大飞跃。

4/17/2025 9:02:00 AM

机器之心

借助Spring AI，快速为AI Agent搭建API网关

本文教大家如何实现一个API网关，以便AI代理（AI Agents）能够访问REST API服务。一、工具与 AI 代理：大语言模型的得力助手工具或函数是大语言模型（LLM）用于从提示中识别函数调用的机制。大语言模型擅长生成自然语言文本，这对人类而言十分友好，但机器需要的是特定答案，二者需求不同。

4/16/2025 1:00:00 AM

十款能几乎取代整个开发团队的 AI 工具

几年前，如果你告诉我一些工具能够取代整个开发团队 70% 的工作量，我一定会笑出声。但如今，我们已经进入了 2025 年，AI 已经成为独立开发者、个人创客和技术创作者们的无形但强大的合伙人。今天，带你了解这 10 款 AI 工具，它们正在替代开发者、设计师和测试人员完成大部分繁重的工作。

4/10/2025 8:11:06 AM

dev

企业级模型推理部署工具vllm使用指南 - 部署最新deepseek-v3-0324模型

vLLM（Virtual Large Language Model）是由加州大学伯克利分校团队开发的高性能大模型推理框架，其核心特点围绕显存优化、高吞吐量、灵活性和易用性展开。对比 ollama 作为个人开发者部署模型工具而言，vLLM 专注于高并发请求和大规模生产环境，适用于企业级应用和需要高效推理的场景。 vLLM 通过优化内存管理和并发处理，适合处理高负载的生产环境。

4/9/2025 3:25:00 AM

AI Agent来，传统BI危

在互联网时代，数据已成为企业发展的必经之路。从电商平台的用户行为记录，到工业传感器的实时监测，数据渗透在商业活动的每个环节，成为驱动决策的基础资源。然而数据的价值并不在于简单的堆砌，未经梳理与解读的原始数据如同散落的拼图碎片，既无法呈现完整图景，也难以支撑业务判断。

3/31/2025 8:35:00 AM

量子位

2025年颠覆社交媒体运营的七个AI工具

这几年，深刻感受到：做社交媒体真的不容易。写帖子、追热点、管评论……每项任务单独看起来简单，但叠加起来，简直是个全天候的苦差事。好消息是，最近找到了一些令人惊艳的AI工具，它们不仅帮我节省了大量时间，更让我的内容更专业、更出色。

3/28/2025 8:10:54 AM

dev

提升自我的十款顶级AI工具推荐

今天为大家精选了10款能帮助我们提升自我的AI工具，让成长变得更加高效。 1️⃣ BeforeSunset AI：你的专属生产力管家image.png时间总是不够用？ BeforeSunset AI通过智能规划你的日程表，帮助你高效利用每一分钟，让你清晰有序地安排一天的任务。

3/24/2025 12:00:00 AM

dev

提前免费！百度一口气上线文心4.5和X1!实力震惊硅谷！API价格又打下来了，R1还得对半砍！实测首款“有工具箱”的推理模型！

编辑 |伊风、言征出品 | 51CTO技术栈（微信号：blog51cto）百度的步伐也是加速了！原本计划4月1日免费的文心大模型4.5，在两周年之际就提前登场。不仅如此，3月16日，百度搞了个“两连发”，一口气开放了两款模型文心大模型4.5和文心大模型X1。

3/17/2025 1:45:25 PM

伊风

AI搜索风靡，但高达60%引用出错！付费版甚至更糟

近四分之一的美国人表示他们已经用AI取代了传统搜索引擎。最新研究发现，AI搜索工具在回答问题时，常常出现自信却错误百出的情况。研究对比了8款具有实时搜索功能的AI工具，发现它们在引用新闻方面表现不佳，出错比例高达60%。

3/17/2025 9:30:00 AM

新智元

百万美金炼出「调参秘籍」！阶跃星辰开源LLM最优超参工具

近日，阶跃星辰研究团队通过大规模实证探索，耗费了近 100 万 NVIDIA H800 GPU 小时（约百万美元），从头训练了 3,700 个不同规模，共计训了 100 万亿个 token，揭示了 LLM 超参数优化的全新的普适性缩放规律，为更好地提升 LLM 性能，提供了开箱即用的工具。该研究也是第一个全面研究模型最优超参随着 Model Shape、Dense/MoE、预训练数据分布的变化，是否稳定不变的工作。研究中凸显出 Step Law 的鲁棒性，大大增加了该工具的实用性和普适性。

3/13/2025 9:20:20 AM

机器之心

多步推理碾压GPT-4o，无需训练性能提升10%！斯坦福开源通用框架OctoTools

大型语言模型（LLMs）目前仍然很难处理需要多步骤推理、特定领域知识或外部工具集成的复杂任务，有研究工作探索了使用预先构建的外部工具来增强LLMs处理复杂任务的能力，但这些方法需要对模型进行微调或额外训练以实现工具的集成，在不同任务之间难以灵活适应。现有的方法要么依赖于静态的、预定义的工具集，要么缺乏高效的工具选择和规划机制，这种低效性会导致任务执行出错、计算成本增加，以及在应用于新领域时适应性受限。传统增强LLMs的方法包括少量样本提示（few-shot prompting）、思维链（chain-of-thought reasoning）以及与外部工具接口的功能调用API；有的框架如LangChain和AutoGen允许LLMs够使用外部资源，但通常智能用于指定应用场景或需要大量的预配置，没有提供一种统一的多步骤规划和执行方法，因此在处理复杂推理问题时效果不佳。

3/12/2025 10:38:05 AM

新智元

OpenAI深夜大招暴打Manus！智能体全家桶杀器一统API，4行代码轻松上手

Manus掀起的智能体风暴，再次逼急了OpenAI。凌晨，OpenAI突然开启线上直播，正式放出开发者自主构建智能体的大礼包——一个全新API、三个内置工具，以及一个开源SDK。具体包括：全新Responses API⁠：将Chat Completions API简单性与Assistants API工具使用功能相结合，用于构建智能体内置三大工具：网络搜索⁠、文件搜索⁠和计算机使用全新Agents SDK⁠：用于编排单智能体和多智能体工作流程集成可视化工具：用于追踪和检查智能体工作流程执行情况以往，开发者构建一款智能体应用，需要从不同来源拼凑各种底层API。

3/12/2025 10:32:23 AM