AI在线 AI在线

资讯列表

揭秘大模型的魔法:从零开始你的AI冒险

你好,我是写代码的中年人! 你有没有想过,那些能写诗、答题、甚至帮你 debug 代码的 AI 到底是怎么回事? 它们其实是“大型语言模型”(Large Language Models,简称 LLM)的产物。
4/17/2025 9:00:00 AM
写代码的中年人

OpenAI深夜发布满血o3和o4mini: 两个没想到

OpenAI刚刚宣布推出其最新的o系列模型:o3和o4-mini,与以往模型不同,o3和o4-mini被设计为真正的AI系统,模型甚至能连续调用超过600次工具来完成一项艰巨任务,它们在理解和导航大型代码库(比如OpenAI自己的代码库)方面,超越了人类工程师,极大地提高了开发效率这次发布会我有两个没想到:一是没想到o系列模型变成了一个融合的模型,另外一个是引入图像推理“Thinking with Images”,下面第一时间给大家划个重点全面工具访问与推理能力o3和o4-mini最显著的特点是首次实现了对ChatGPT内所有工具的智能使用和组合能力。 它们可以搜索网络、分析上传的文件、处理视觉输入、生成图像,并且能够智能地判断何时以及如何使用这些工具来解决复杂问题。 这些模型经过专门训练,能够在大约一分钟内提供详细且经过深思熟虑的答案,以适当的输出格式解决多方面的问题o3,o4mini性能OpenAI o3是目前最强大的推理模型,在编程、数学、科学、视觉感知等领域推动了技术边界。
4/17/2025 8:59:59 AM
AI寒武纪

围绕多智能体黑箱非凸优化共识难题,华南理工大学团队发表系列研究

多智能体系统分布式共识优化的一系列研究来了! 在智能城市、智能电网、无人系统等前沿应用不断扩展的今天,多智能体系统(Multi-Agent Systems, MAS)作为新一代智能协同的技术基础,正迎来前所未有的发展机遇。 在这些系统中,多个具备计算与通信能力的智能体需要在没有中心协调、通信受限的条件下实现任务协作、资源共享与一致性决策。
4/17/2025 8:55:24 AM
量子位

全网最全「吉卜力」AI神器总结!只要2分钟,照片秒变吉卜力

创建吉卜力风格的图像,现在很流行。 甚至还可以根据图像,生成吉卜力动画:「神秘的微笑」蒙娜丽莎,都会主动和你打招呼! 但是,97%的人可能不知道如何创建它们。
4/17/2025 8:51:20 AM
新智元

“最佳 AI 拍档”合作裂痕初现:OpenAI 谋求独立、微软转向自研

微软与OpenAI的合作关系出现裂痕,OpenAI宣布5000亿美元的Stargate项目,寻求独立发展,不再完全依赖微软云服务。微软则计划投入800亿美元用于AI研发,重心转向自身AI能力。#微软# #OpenAI#
4/17/2025 8:39:42 AM
故渊

开发者值得关注的六大AI调试工具

译者 | 核子可乐审校 | 重楼AI驱动的调试工具正在颠覆开发者识别、诊断和修复代码问题的方式。 这些工具利用机器学习和AI技术自动化传统调试流程,节省时间并提高代码质量。 本文将带大家了解六大最受欢迎的AI调试工具及其核心功能、所需技能和比较优势。
4/17/2025 8:36:30 AM
核子可乐

微软最新报告教你“防诈”:如何避开 AI 生成的虚假招聘与诈骗网站

微软16日发布了最新一期《网络安全信号报告》,详细说明了如何应对当今网络安全领域中的新型威胁、诈骗及欺诈行为,并阐述了AI如何使开发恶意软件变得“比以往任何时候都更加容易”。
4/17/2025 8:05:59 AM
清源

OpenAI发布两款多模态推理模型o4-mini、满血版o3

在今天凌晨1点的技术直播中,OpenAI正式推出其最新且最强大的多模态模型o4-mini和满血版o3。 这两款模型具备独特优势,不仅能同时处理文本、图像和音频,还可作为智能体自动调用网络搜索、图像生成、代码解析等工具,并且拥有深度思考模式,能在思维链中思考图像。 OpenAI公布的测试数据显示,o4-mini表现卓越。
4/17/2025 8:01:05 AM
AI在线

起亚探索 AI 驱动“声音景观”技术:让视障乘客用听觉“感知”旅行

该公司推出了一种名为“声音景观”的AI驱动概念,将外界景观转化为声音景观——从字面上讲,就是用声音呈现周围的自然景象。
4/17/2025 7:53:10 AM
清源

AI“立功”:谷歌去年封停了 3920 万个广告账号,超 2023 年三倍

谷歌表示,借助大语言模型和通过识别诸如商业冒充、非法支付信息等信号,目前公司能够在广告投放前就暂停“大多数”广告账户。
4/17/2025 7:42:28 AM
清源

ChatGPT首次带图深度思考:OpenAI连发o3/o4 mini,比前代性能更强价格更低

仅隔一天,OpenAI再次突然放大招:一口气,o3和o4 mini同步上线。 图片依然是最热门推理模型,并且这一次,它们终于能够调用ChatGPT里的各种工具了,包括网络搜索、Python、图像分析、文件解释和图像生成。 也就是说,你现在可以也用o3来生成吉卜力风格的奥特曼抱子图了(doge)。
4/17/2025 7:23:10 AM

消息称 OpenAI 考虑以 30 亿美元收购人工智能编程工具 Windsurf

知情人士透露,OpenAI正谈判以约30亿美元收购AI编程工具Windsurf(原名Codeium),若成功将成为其史上最大收购案。此举将增强OpenAI在AI编程助手市场的竞争力,与GitHub等展开直接竞争。#AI编程##OpenAI收购#
4/17/2025 7:20:02 AM
远洋

微软 Edge 浏览器免费上线 Copilot Vision 功能,AI 助手可实时解读屏幕内容

微软宣布Edge浏览器免费上线Copilot Vision功能,AI助手可实时解读屏幕内容,指导用户操作。目前功能有限,跨应用需订阅Copilot Pro。#微软Copilot##AI助手#
4/17/2025 7:12:06 AM
远洋

五个强大的AI提示词,可助力任何商业创意

你已经有了一个很棒的商业想法,这是一个开始,但要将它付诸实践还有大量工作要做。 幸运的是,在这个领域,GenAI可以发挥极大的帮助作用,它虽然不会为你提供万无一失的策略,但它可以帮助你进行商业计划的头脑风暴、研究市场和微调营销内容和信息。 不过,这并不是简单地将你的指令输入ChatGPT,然后指望它为你完成所有艰苦的工作。
4/17/2025 7:00:00 AM
Bernard Marr

可实时识别屏幕内容,谷歌 Gemini Live 功能向所有安卓用户免费开放

谷歌宣布Gemini Live功能免费向所有安卓用户开放,可实时识别摄像头和屏幕内容并回应。此前仅限Pixel 9和Galaxy S25用户订阅使用。微软同日也推出类似AI工具Copilot Vision。#谷歌Gemini #AI工具
4/17/2025 6:57:40 AM
远洋

OpenAI 部署新监控系统,防范 o3 和 o4 - mini 提供生物和化学威胁建议

OpenAI宣布部署新监控系统,专门监测其AI模型o3和o4-mini,防止提供有害建议。系统识别风险提示并拒绝回应,阻断比例达98.7%。#AI安全# #OpenAI#
4/17/2025 6:46:36 AM
远洋

奥特曼出席TED 2025:年度最令人不安且最重要的AI采访

“我从未见过任何公司有这样的增长,无论是我参与过的还是没有参与过的,”奥特曼在与TED大会主持人克里斯·安德森(Chris . Anderson)的台上对话中表示。 “ChatGPT的增长——真的很有趣,我深感荣幸,但经历这一切也很疯狂,我们的团队已经筋疲力尽,压力重重。
4/17/2025 5:00:00 AM
Michael

在终端就能跑的轻量级推理智能体,OpenAI 发布完全开源 Codex CLI 工具

Codex CLI 是为已经生活在终端的开发者设计的,他们想要 ChatGPT 级别的推理能力,以及实际运行代码、操作文件和迭代的权力 —— 所有这些都在版本控制之下。
4/17/2025 1:54:04 AM
汪淼