GPT

OpenAI 最新研究揭示：最先进的 AI 仍难以解决编码问题

近日，OpenAI 的研究人员在一篇新发布的论文中坦言，尽管目前的 AI 技术已经相当先进，但这些模型依然无法与人类程序员相媲美。 OpenAI 首席执行官山姆・阿尔特曼曾表示，预计到今年底，AI 将能够战胜 “低级” 软件工程师，但研究结果却显示，这些 AI 模型仍然面临重大挑战。图源备注：图片由AI生成，图片授权服务商Midjourney在研究中，OpenAI 团队使用了一种名为 SWE-Lancer 的新基准测试，评估了从自由职业网站 Upwork 上提取的1400多项软件工程任务的表现。

2/24/2025 9:09:00 AM

AI在线

人刚毕业，代码一点不会，他纯靠ChatGPT写APP，年入千万美金

第一个App年入50万，第二个年入500万，第三个月入100万。我不会编程，却在两年时间内靠 ChatGPT 写代码做 APP，年入千万美金。没开玩笑，这不是拼好饭吃多了的最终幻想，而是现实生活中上演的真人真事。

2/23/2025 5:33:00 PM

机器之心

AI"自我对抗"玩法火了一句话让AI破防

最近，一场别开生面的AI对决正在互联网上演。从唇枪舌战到国际象棋对弈，AI之间的较量不仅展现了它们的语言能力和思维方式，更成为当下最热门的流量话题。近期，DeepSeek与GPT的对话视频在B站引发广泛关注，播放量突破300万，互动量超50万。

2/11/2025 5:57:00 PM

AI在线

4o-mini 只有 8B、o1 也才 300B，微软论文意外曝光 GPT 核心机密

英伟达 2024 年初发布 B200 时，就摊牌了 GPT-4 是 1.8T MoE 也就是 1800B，这里微软的数字更精确，为 1.76T。

1/2/2025 11:14:46 AM

汪淼

本科学历但创造出GPT，奥特曼盛赞为「爱因斯坦级」天才，OpenAI总裁：他想要的，我们都给

奥特曼称他是爱因斯坦级别的天才；OpenAI总裁更是直言：只要他想要的，我们都给。 Alec Radford大神离职OpenAI，现在牵出更多细节：改变世界的GPT，竟然是在Jupyter notebook上诞生的。而他只负责提供背后的灵感，剩下的由工程师来解决。

1/2/2025 7:30:00 AM

剖析BadGPT-40背后的真相：一个从GPT模型中移除护栏的模型

译者 | 晶颜审校 | 重楼出品 | 51CTO技术栈（微信号：blog51cto）大型语言模型（LLM）风靡全球。从通用的智能助手到代码伙伴，这些模型似乎什么都能做——除了可靠地执行其内置的安全准则。 OpenAI等公司安装的广为人知的“护栏”旨在确保负责任的行为，保护用户免受恶意输出、虚假信息和网络利用企图的影响。

12/23/2024 12:52:29 PM

晶颜

公开版 OpenAI Sora 震撼登场！独立产品，开服就被挤爆！视频可控性拉满！奥特曼：视频的GPT时代开启

编辑 | 伊风第三天终于来了！从年初盼到年末，可用的公开版Sora终于华丽登场！！

12/10/2024 8:59:05 AM

伊风

OpenAI 活动首日：完整版 o1 推理 AI 模型登场、月费 200 美元的 ChatGPT Pro 订阅亮相

OpenAI 启动了为期 12 天的“shipmas”新品发布周期，将推出一系列新功能、新产品以及相关演示。在本次活动首日，OpenAI 推出了完整版 o1 模型，并新增了月费为 200 美元的 ChatGPT Pro 订阅。

12/6/2024 2:41:05 AM

故渊

提示词：怎样与大模型沟通

同前面讲大模型特点类似，关于如何使用 GPT，我们也会分成两个视角：用户视角和技术视角。这一讲，我们先从用户视角来看看如何用好 GPT。用好 GPT若要充分发挥 GPT 的效用，需遵循以下步骤：首先是定义任务目标。

11/26/2024 11:44:04 AM

greencoatman

研究人员绕过 GPT-4o 模型安全护栏，利用“十六进制字符串”成功令其编写漏洞攻击程序

网络安全公司 0Din 的研究员 Marco Figueroa 发现了一种新型 GPT 越狱攻击手法，成功突破了 GPT-4o 内置的“安全护栏”措施，能够使其编写出恶意攻击程序。参考 OpenAI 介绍，ChatGPT-4o 内置了一系列“安全护栏”措施，以防止该 AI 遭到用户不当使用，相关防护措施会分析输入的提示文本，判断用户是否要求模型生成恶意内容。 ▲ 图源 Marco Figueroa 博客（下同）不过 Marco Figueroa 尝试设计了一种将恶意指令转化为十六进制的越狱方法，号称能够绕过 GPT-4o 的防护，让 GPT-4o 解码运行用户的恶意指令。

11/4/2024 10:07:29 AM

漾仔

Python 成 GitHub 最受欢迎编程语言，AI 成主要推动力

GitHub 年度报告《Octoverse》显示，Python 首次超越 JavaScript 成为 GitHub 上最受欢迎的编程语言。这主要是受到人工智能（AI）开发需求激增的推动，Python 还被广泛应用于数据科学和开源项目的开发。报告指出，与生成式 AI 相关的项目贡献量在过去一年中增长了 59%，AI 相关的公共项目的贡献量几乎比 2023 年翻了一番，印度、德国、日本和新加坡是这些贡献的主要来源。

10/31/2024 2:00:24 PM

远洋

谷歌 CEO 桑达尔・皮查伊：努力在明年推出具有可视化功能的 AI 助理

北京时间今天凌晨，谷歌 CEO 桑达尔・皮查伊在公司第三季度财报电话会议上透露了“Project Astra”计划的最新进展。他表示，谷歌正在构建能够识别和推理用户周围环境的 AI 体验，“‘Project Astra’代表了这种未来的初步探索。我们正力争在 2025 年尽早推出类似体验。

10/30/2024 7:24:46 AM

清源

阿尔特曼回应 OpenAI 计划推出下一代模型 Orion：假消息失控了

今天午间，OpenAI 首席执行官山姆・阿尔特曼在 X 平台回应了近期有关“下一代模型 Orion”的报道：fake news out of control（假消息失控了）。 AI在线附前情提要：今天早些时候有外媒报道称，OpenAI 计划今年 12 月推出代号为“Orion”的新款前沿模型。 “Orion”采用有别于 GPT-4o 和 o1 的发布模式，不会通过 ChatGPT 广泛发布，而是先授权与其密切合作的公司，帮其构建自己的产品和功能。

10/25/2024 5:58:22 PM

清源

全球最强模型：OpenAI 被曝 12 月推出 Orion，AI 性能百倍级跃升

科技媒体 The Verge 今天（10 月 25 日）发布博文，报道称 OpenAI 计划今年 12 月推出代号为“Orion”的新款前沿模型。 AI在线援引该媒体报道，“Orion”采用有别于 GPT-4o 和 o1 的发布模式，不会通过 ChatGPT 广泛发布，而是先授权与其密切合作的公司，帮其构建自己的产品和功能。此外消息源还表示微软内部工程师正在准备最早于 11 月在 Azure 上托管“Orion”。

10/25/2024 9:53:14 AM

故渊

科大讯飞星火 4.0 Turbo 大模型发布：七大能力全面超越 GPT-4 Turbo

在今日上午的 2024 科大讯飞全球 1024 开发者节上，科大讯飞正式发布“讯飞星火 4.0 Turbo”。讯飞星火 4.0 Turbo 号称迎来全新升级，七大能力全面超越 GPT-4 Turbo，数学能力、代码能力超过 GPT-4o。在数学能力方面，讯飞星火 4.0 Turbo 已完成超长思维链、树搜索和自我反思评价等算法验证，预计今年底可实现类 o1 的高难度数学能力。

10/24/2024 10:17:56 AM

汪淼

把 AI 放进《我的世界》服务器：GPT-4o 杀牛宰羊，Claude3.5 把家拆了

把《我的世界》交给大模型，会怎么样？GPT-4o 鲨牛宰羊，Claude3.5 不停在人类身旁放炸药包和敌人，还把家拆了。GPT-4o mini 玩《我的世界》belike：来到游戏里面，GPT-4o mini（玩家 karolina）一开始还蛮礼貌的：你好世界！

10/21/2024 1:11:17 PM

清源

零一万物新旗舰模型 Yi-Lightning 发布：LMSYS 测试国产首次超越 GPT-4o，中国第一、世界第六

感谢李开复创办的 AI 公司零一万物于 10 月 16 日对外发布新旗舰模型 Yi-Lightning。在盲测榜单 LMSYS 上，Yi-Lightning 超越 OpenAI、Anthropic 所发布的 GPT-4o-2024-05-13、 Claude 3.5 Sonnet，排名世界第六，中国第一。零一万物表示，这是在 LMSYS 这一全球大模型必争的公开擂台上，中国大模型首度实现“超越 OpenAI GPT-4o ”的最佳成绩（AI在线注：此处 GPT-4o 为 OpenAI 于 5 月发布的 GPT-4o-2024-05-13）。

10/17/2024 9:17:06 AM

汪淼

OpenAI GPT-4 解锁新成就：100% 识别性别、74.25% 识别年龄范围，未专门训练可媲美专业算法

科技媒体 The Decoder 昨日（10 月 9 日）发布博文，报道称最新研究表明 OpenAI 的 GPT-4 AI 模型在未经专门微调和训练情况下，能够识别面孔、判断性别，并在照片中估计年龄，其准确度媲美专业算法。来自挪威科技大学、Mizani 及 Idiap 研究所的研究人员推进这项研究，测试了 GPT-4 的生物识别能力，发现其性能和 MobileFaceNet 等专门的面部识别算法不相上下。在性别识别测试中，GPT-4 在 5400 张平衡（balanced）图像的数据集上取得了 100% 的准确率，

10/10/2024 11:56:04 AM

故渊

资讯热榜

上海AI实验室开源InternVL3系列多模态大型语言模型 Haisnap横空出世，小白用户也能轻松打造AI应用「交交」媲美GPT-4o！上海交大推出口语对话情感大模型，首个纯学术界自研！ OpenAI开源超Agent:Codex CLI,五小时内破 5000 颗星 ChatGPT重磅更新：新增图像库功能，可查看自己用GPT生成的所有图片本地部署DeepSeek+DiFy平台构建智能体应用 kimi开源视觉语言模型 Kimi-VL 与 Kimi-VL-Thinking，多项基准超越 GPT-4o OpenAI 发布“智能体构建实战指南”实用性文档（附文档资源）

标签云

人工智能 OpenAI AIGC AI ChatGPT DeepSeek AI绘画数据机器人谷歌模型大模型 Midjourney 智能用户学习开源 GPT 微软 Meta AI创作图像技术论文 Stable Diffusion 马斯克 Gemini 算法蛋白质生成式芯片代码英伟达腾讯神经网络计算研究 Sora AI for Science 3D Anthropic AI设计机器学习 GPU 开发者场景华为预测伟达 Transformer 百度人形机器人苹果深度学习 AI视频模态字节跳动 xAI 驾驶文本搜索大语言模型 Claude Copilot 具身智能神器推荐 LLaMA 算力安全应用视频生成科技视觉亚马逊干货合集 2024 AGI 特斯拉大型语言模型训练

GPT

​OpenAI 最新研究揭示：最先进的 AI 仍难以解决编码问题