应用
OpenAI 推出全新推理模型 o3,实现图像思考能力
OpenAI 近期发布了其最新的推理模型 o3和 o4-mini,标志着人工智能领域的一次重大突破。 这两款模型不仅在推理能力上超越了以往的版本,还首次实现了图像思考的能力,能够将视觉信息直接融入到思维过程中。 o3被誉为 “天才级” 模型,尤其在编程和数学等任务中表现出色,准确率高达87.5%。
4/17/2025 9:01:05 AM
AI在线
OpenAI开源超Agent:Codex CLI,五小时内破 5000 颗星
OpenAI 正式发布了其最新开源项目 Codex CLI,这是一款轻量级的代码智能体工具。 该工具的发布迅速引起了极大的关注,仅在短短5小时内,Codex CLI 便突破了5000颗星的评价,预计今天有望突破1万颗星,迅速成为 Github 上的一颗新星。 OpenAI 的联合创始人兼总裁 Greg Brockman 表示,Codex CLI 只是他们代码工具系列的第一款,未来将继续推出更多的智能体产品。
4/17/2025 9:01:05 AM
AI在线
上海人工智能实验室开源小语种多模态数据集万卷·丝路2.0
由上海人工智能实验室发布的“万卷·丝路2.0”多语言多模态语料库正式开源。 该语料库在原有的阿拉伯语、俄语、韩语、越南语、泰语等5个语种基础上,新增了塞尔维亚语、匈牙利语、捷克语3个稀缺语料数据,涵盖文本、图片、音频、视频四大模态,数据总量超过1150万条,音视频时长超过2.6万小时,成为小语种多模态领域的重要资源。 “万卷·丝路2.0”具有多语言、大规模、多模态、高质量的特点。
4/17/2025 9:01:05 AM
AI在线
谷歌 Gemini Live 功能全面开放,安卓用户迎来新体验
近日,谷歌宣布其 Gemini 应用中的 Gemini Live 功能将免费向所有安卓用户开放。 这一功能最早于本月早些时候仅限于 Pixel9和三星 Galaxy S25用户,通过 Gemini Advanced 订阅才能使用。 然而,随着用户对 Gemini Live 功能的积极反馈,谷歌决定改变策略,推动这一功能的普及。
4/17/2025 9:01:05 AM
AI在线
“最佳 AI 拍档”合作裂痕初现:OpenAI 谋求独立、微软转向自研
微软与OpenAI的合作关系出现裂痕,OpenAI宣布5000亿美元的Stargate项目,寻求独立发展,不再完全依赖微软云服务。微软则计划投入800亿美元用于AI研发,重心转向自身AI能力。#微软# #OpenAI#
4/17/2025 8:39:42 AM
故渊
微软最新报告教你“防诈”:如何避开 AI 生成的虚假招聘与诈骗网站
微软16日发布了最新一期《网络安全信号报告》,详细说明了如何应对当今网络安全领域中的新型威胁、诈骗及欺诈行为,并阐述了AI如何使开发恶意软件变得“比以往任何时候都更加容易”。
4/17/2025 8:05:59 AM
清源
OpenAI发布两款多模态推理模型o4-mini、满血版o3
在今天凌晨1点的技术直播中,OpenAI正式推出其最新且最强大的多模态模型o4-mini和满血版o3。 这两款模型具备独特优势,不仅能同时处理文本、图像和音频,还可作为智能体自动调用网络搜索、图像生成、代码解析等工具,并且拥有深度思考模式,能在思维链中思考图像。 OpenAI公布的测试数据显示,o4-mini表现卓越。
4/17/2025 8:01:05 AM
AI在线
起亚探索 AI 驱动“声音景观”技术:让视障乘客用听觉“感知”旅行
该公司推出了一种名为“声音景观”的AI驱动概念,将外界景观转化为声音景观——从字面上讲,就是用声音呈现周围的自然景象。
4/17/2025 7:53:10 AM
清源
AI“立功”:谷歌去年封停了 3920 万个广告账号,超 2023 年三倍
谷歌表示,借助大语言模型和通过识别诸如商业冒充、非法支付信息等信号,目前公司能够在广告投放前就暂停“大多数”广告账户。
4/17/2025 7:42:28 AM
清源
消息称 OpenAI 考虑以 30 亿美元收购人工智能编程工具 Windsurf
知情人士透露,OpenAI正谈判以约30亿美元收购AI编程工具Windsurf(原名Codeium),若成功将成为其史上最大收购案。此举将增强OpenAI在AI编程助手市场的竞争力,与GitHub等展开直接竞争。#AI编程##OpenAI收购#
4/17/2025 7:20:02 AM
远洋
微软 Edge 浏览器免费上线 Copilot Vision 功能,AI 助手可实时解读屏幕内容
微软宣布Edge浏览器免费上线Copilot Vision功能,AI助手可实时解读屏幕内容,指导用户操作。目前功能有限,跨应用需订阅Copilot Pro。#微软Copilot##AI助手#
4/17/2025 7:12:06 AM
远洋
可实时识别屏幕内容,谷歌 Gemini Live 功能向所有安卓用户免费开放
谷歌宣布Gemini Live功能免费向所有安卓用户开放,可实时识别摄像头和屏幕内容并回应。此前仅限Pixel 9和Galaxy S25用户订阅使用。微软同日也推出类似AI工具Copilot Vision。#谷歌Gemini #AI工具
4/17/2025 6:57:40 AM
远洋
OpenAI 部署新监控系统,防范 o3 和 o4 - mini 提供生物和化学威胁建议
OpenAI宣布部署新监控系统,专门监测其AI模型o3和o4-mini,防止提供有害建议。系统识别风险提示并拒绝回应,阻断比例达98.7%。#AI安全# #OpenAI#
4/17/2025 6:46:36 AM
远洋
在终端就能跑的轻量级推理智能体,OpenAI 发布完全开源 Codex CLI 工具
Codex CLI 是为已经生活在终端的开发者设计的,他们想要 ChatGPT 级别的推理能力,以及实际运行代码、操作文件和迭代的权力 —— 所有这些都在版本控制之下。
4/17/2025 1:54:04 AM
汪淼
OpenAI 最强推理模型、能够“思考”图片,o3 和 o4-mini 正式发布
OpenAI 官方介绍称,这是其在 o 系列模型中最新训练的成果,可以在回答前进行更长时间的思考,也宣称是“迄今为止 OpenAI 发布的最智能的模型”,代表了 ChatGPT 能力的一次重大飞跃,从好奇的用户到高级研究人员都将因此受益。
4/17/2025 1:27:45 AM
汪淼
一键出海报!超简单的Coze入门案例实战教程
嗨,大家好! 今天要分享的同样是非常容易入门且可以很快获得成品的工具,那就是扣子。 下面是来自官方对扣子的简介:.
4/17/2025 12:16:31 AM
阿真Irene
OpenAI 预告凌晨直播,满血版 o3 推理模型有望登场
OpenAI CEO 奥尔特曼本月初在社交平台 X 上发文称,可能在数周内发布 o3 和 o4-mini,未来几月内发布 GPT-5。
4/16/2025 10:55:18 PM
汪淼
中国航天科技集团:固体动力人工智能大模型平台完成升级并上线运行
据中国航天科技集团消息,近日,中国航天科技集团有限公司四院固体动力 AI(人工智能)大模型平台完成 DeepSeek 融合升级,平台功能和性能全面提升并正式上线运行。
4/16/2025 10:31:38 PM
归泷
资讯热榜
上海AI实验室开源InternVL3系列多模态大型语言模型
Haisnap横空出世,小白用户也能轻松打造AI应用
OpenAI开源超Agent:Codex CLI,五小时内破 5000 颗星
「交交」媲美GPT-4o!上海交大推出口语对话情感大模型,首个纯学术界自研!
kimi开源视觉语言模型 Kimi-VL 与 Kimi-VL-Thinking,多项基准超越 GPT-4o
本地部署DeepSeek+DiFy平台构建智能体应用
ChatGPT重磅更新:新增图像库功能,可查看自己用GPT生成的所有图片
击败DeepSeek-R1!豆包新推理模型仅用前者参数量1/3!还将开源两个基准,瞄准通用推理能力!
标签云
人工智能
OpenAI
AIGC
AI
ChatGPT
DeepSeek
AI绘画
数据
机器人
谷歌
模型
大模型
Midjourney
智能
用户
学习
开源
GPT
微软
Meta
AI创作
图像
技术
论文
Stable Diffusion
马斯克
Gemini
算法
蛋白质
生成式
芯片
代码
英伟达
神经网络
腾讯
计算
研究
Sora
AI for Science
3D
Anthropic
AI设计
机器学习
GPU
开发者
场景
华为
预测
伟达
Transformer
百度
苹果
深度学习
AI视频
模态
人形机器人
xAI
驾驶
文本
搜索
字节跳动
大语言模型
Claude
Copilot
具身智能
神器推荐
LLaMA
算力
安全
应用
视频生成
科技
视觉
亚马逊
干货合集
2024
AGI
特斯拉
训练
DeepMind