资讯列表

分类

标签

揭秘大模型的魔法：从零开始你的AI冒险

你好，我是写代码的中年人！你有没有想过，那些能写诗、答题、甚至帮你 debug 代码的 AI 到底是怎么回事？它们其实是“大型语言模型”（Large Language Models，简称 LLM）的产物。

4/17/2025 9:00:00 AM

写代码的中年人

OpenAI刚刚宣布推出其最新的o系列模型：o3和o4-mini，与以往模型不同，o3和o4-mini被设计为真正的AI系统，模型甚至能连续调用超过600次工具来完成一项艰巨任务，它们在理解和导航大型代码库（比如OpenAI自己的代码库）方面，超越了人类工程师，极大地提高了开发效率这次发布会我有两个没想到：一是没想到o系列模型变成了一个融合的模型，另外一个是引入图像推理“Thinking with Images”，下面第一时间给大家划个重点全面工具访问与推理能力o3和o4-mini最显著的特点是首次实现了对ChatGPT内所有工具的智能使用和组合能力。它们可以搜索网络、分析上传的文件、处理视觉输入、生成图像，并且能够智能地判断何时以及如何使用这些工具来解决复杂问题。这些模型经过专门训练，能够在大约一分钟内提供详细且经过深思熟虑的答案，以适当的输出格式解决多方面的问题o3,o4mini性能OpenAI o3是目前最强大的推理模型，在编程、数学、科学、视觉感知等领域推动了技术边界。

4/17/2025 8:59:59 AM

AI寒武纪

围绕多智能体黑箱非凸优化共识难题，华南理工大学团队发表系列研究

多智能体系统分布式共识优化的一系列研究来了！在智能城市、智能电网、无人系统等前沿应用不断扩展的今天，多智能体系统（Multi-Agent Systems, MAS）作为新一代智能协同的技术基础，正迎来前所未有的发展机遇。在这些系统中，多个具备计算与通信能力的智能体需要在没有中心协调、通信受限的条件下实现任务协作、资源共享与一致性决策。

4/17/2025 8:55:24 AM

量子位

全网最全「吉卜力」AI神器总结！只要2分钟，照片秒变吉卜力

创建吉卜力风格的图像，现在很流行。甚至还可以根据图像，生成吉卜力动画：「神秘的微笑」蒙娜丽莎，都会主动和你打招呼！但是，97%的人可能不知道如何创建它们。

4/17/2025 8:51:20 AM

新智元

“最佳 AI 拍档”合作裂痕初现：OpenAI 谋求独立、微软转向自研

微软与OpenAI的合作关系出现裂痕，OpenAI宣布5000亿美元的Stargate项目，寻求独立发展，不再完全依赖微软云服务。微软则计划投入800亿美元用于AI研发，重心转向自身AI能力。#微软# #OpenAI#

4/17/2025 8:39:42 AM

故渊

开发者值得关注的六大AI调试工具

译者 | 核子可乐审校 | 重楼AI驱动的调试工具正在颠覆开发者识别、诊断和修复代码问题的方式。这些工具利用机器学习和AI技术自动化传统调试流程，节省时间并提高代码质量。本文将带大家了解六大最受欢迎的AI调试工具及其核心功能、所需技能和比较优势。

4/17/2025 8:36:30 AM

核子可乐

微软最新报告教你“防诈”：如何避开 AI 生成的虚假招聘与诈骗网站

微软16日发布了最新一期《网络安全信号报告》，详细说明了如何应对当今网络安全领域中的新型威胁、诈骗及欺诈行为，并阐述了AI如何使开发恶意软件变得“比以往任何时候都更加容易”。

4/17/2025 8:05:59 AM

清源

OpenAI发布两款多模态推理模型o4-mini、满血版o3

在今天凌晨1点的技术直播中，OpenAI正式推出其最新且最强大的多模态模型o4-mini和满血版o3。这两款模型具备独特优势，不仅能同时处理文本、图像和音频，还可作为智能体自动调用网络搜索、图像生成、代码解析等工具，并且拥有深度思考模式，能在思维链中思考图像。 OpenAI公布的测试数据显示，o4-mini表现卓越。

4/17/2025 8:01:05 AM

AI在线

起亚探索 AI 驱动“声音景观”技术：让视障乘客用听觉“感知”旅行

该公司推出了一种名为“声音景观”的AI驱动概念，将外界景观转化为声音景观——从字面上讲，就是用声音呈现周围的自然景象。

4/17/2025 7:53:10 AM

清源

AI“立功”：谷歌去年封停了 3920 万个广告账号，超 2023 年三倍

谷歌表示，借助大语言模型和通过识别诸如商业冒充、非法支付信息等信号，目前公司能够在广告投放前就暂停“大多数”广告账户。

4/17/2025 7:42:28 AM

清源

ChatGPT首次带图深度思考：OpenAI连发o3/o4 mini，比前代性能更强价格更低

仅隔一天，OpenAI再次突然放大招：一口气，o3和o4 mini同步上线。图片依然是最热门推理模型，并且这一次，它们终于能够调用ChatGPT里的各种工具了，包括网络搜索、Python、图像分析、文件解释和图像生成。也就是说，你现在可以也用o3来生成吉卜力风格的奥特曼抱子图了（doge）。

4/17/2025 7:23:10 AM

消息称 OpenAI 考虑以 30 亿美元收购人工智能编程工具 Windsurf

知情人士透露，OpenAI正谈判以约30亿美元收购AI编程工具Windsurf（原名Codeium），若成功将成为其史上最大收购案。此举将增强OpenAI在AI编程助手市场的竞争力，与GitHub等展开直接竞争。#AI编程##OpenAI收购#

4/17/2025 7:20:02 AM

远洋

微软 Edge 浏览器免费上线 Copilot Vision 功能，AI 助手可实时解读屏幕内容

微软宣布Edge浏览器免费上线Copilot Vision功能，AI助手可实时解读屏幕内容，指导用户操作。目前功能有限，跨应用需订阅Copilot Pro。#微软Copilot##AI助手#

4/17/2025 7:12:06 AM

远洋

五个强大的AI提示词，可助力任何商业创意

你已经有了一个很棒的商业想法，这是一个开始，但要将它付诸实践还有大量工作要做。幸运的是，在这个领域，GenAI可以发挥极大的帮助作用，它虽然不会为你提供万无一失的策略，但它可以帮助你进行商业计划的头脑风暴、研究市场和微调营销内容和信息。不过，这并不是简单地将你的指令输入ChatGPT，然后指望它为你完成所有艰苦的工作。

4/17/2025 7:00:00 AM

Bernard Marr

可实时识别屏幕内容，谷歌 Gemini Live 功能向所有安卓用户免费开放

谷歌宣布Gemini Live功能免费向所有安卓用户开放，可实时识别摄像头和屏幕内容并回应。此前仅限Pixel 9和Galaxy S25用户订阅使用。微软同日也推出类似AI工具Copilot Vision。#谷歌Gemini #AI工具

4/17/2025 6:57:40 AM

远洋

OpenAI 部署新监控系统，防范 o3 和 o4 - mini 提供生物和化学威胁建议

OpenAI宣布部署新监控系统，专门监测其AI模型o3和o4-mini，防止提供有害建议。系统识别风险提示并拒绝回应，阻断比例达98.7%。#AI安全# #OpenAI#

4/17/2025 6:46:36 AM

远洋

奥特曼出席TED 2025：年度最令人不安且最重要的AI采访

“我从未见过任何公司有这样的增长，无论是我参与过的还是没有参与过的，”奥特曼在与TED大会主持人克里斯·安德森(Chris . Anderson)的台上对话中表示。 “ChatGPT的增长——真的很有趣，我深感荣幸，但经历这一切也很疯狂，我们的团队已经筋疲力尽，压力重重。

4/17/2025 5:00:00 AM

Michael

在终端就能跑的轻量级推理智能体，OpenAI 发布完全开源 Codex CLI 工具

Codex CLI 是为已经生活在终端的开发者设计的，他们想要 ChatGPT 级别的推理能力，以及实际运行代码、操作文件和迭代的权力 —— 所有这些都在版本控制之下。

4/17/2025 1:54:04 AM

汪淼

资讯热榜

上海AI实验室开源InternVL3系列多模态大型语言模型 Haisnap横空出世，小白用户也能轻松打造AI应用 OpenAI开源超Agent:Codex CLI,五小时内破 5000 颗星「交交」媲美GPT-4o！上海交大推出口语对话情感大模型，首个纯学术界自研！ kimi开源视觉语言模型 Kimi-VL 与 Kimi-VL-Thinking，多项基准超越 GPT-4o 本地部署DeepSeek+DiFy平台构建智能体应用 ChatGPT重磅更新：新增图像库功能，可查看自己用GPT生成的所有图片击败DeepSeek-R1！豆包新推理模型仅用前者参数量1/3！还将开源两个基准，瞄准通用推理能力！

标签云

人工智能 OpenAI AIGC AI ChatGPT DeepSeek AI绘画数据机器人谷歌模型大模型 Midjourney 智能用户学习开源 GPT 微软 Meta AI创作图像技术论文 Stable Diffusion 马斯克 Gemini 算法蛋白质生成式芯片代码英伟达神经网络腾讯计算研究 Sora AI for Science 3D Anthropic AI设计机器学习 GPU 开发者场景华为预测伟达 Transformer 百度苹果深度学习 AI视频模态人形机器人 xAI 驾驶文本搜索字节跳动大语言模型 Claude Copilot 具身智能神器推荐 LLaMA 算力安全应用视频生成科技视觉亚马逊干货合集 2024 AGI 特斯拉训练 DeepMind