AI在线 AI在线

GPT

​OpenAI 最新研究揭示:最先进的 AI 仍难以解决编码问题

近日,OpenAI 的研究人员在一篇新发布的论文中坦言,尽管目前的 AI 技术已经相当先进,但这些模型依然无法与人类程序员相媲美。 OpenAI 首席执行官山姆・阿尔特曼曾表示,预计到今年底,AI 将能够战胜 “低级” 软件工程师,但研究结果却显示,这些 AI 模型仍然面临重大挑战。 图源备注:图片由AI生成,图片授权服务商Midjourney在研究中,OpenAI 团队使用了一种名为 SWE-Lancer 的新基准测试,评估了从自由职业网站 Upwork 上提取的1400多项软件工程任务的表现。
2/24/2025 9:09:00 AM
AI在线

人刚毕业,代码一点不会,他纯靠ChatGPT写APP,年入千万美金

第一个App年入50万,第二个年入500万,第三个月入100万。 我不会编程,却在两年时间内靠 ChatGPT 写代码做 APP,年入千万美金。 没开玩笑,这不是拼好饭吃多了的最终幻想,而是现实生活中上演的真人真事。
2/23/2025 5:33:00 PM
机器之心

AI"自我对抗"玩法火了 一句话让AI破防

最近,一场别开生面的AI对决正在互联网上演。 从唇枪舌战到国际象棋对弈,AI之间的较量不仅展现了它们的语言能力和思维方式,更成为当下最热门的流量话题。 近期,DeepSeek与GPT的对话视频在B站引发广泛关注,播放量突破300万,互动量超50万。
2/11/2025 5:57:00 PM
AI在线

4o-mini 只有 8B、o1 也才 300B,微软论文意外曝光 GPT 核心机密

英伟达 2024 年初发布 B200 时,就摊牌了 GPT-4 是 1.8T MoE 也就是 1800B,这里微软的数字更精确,为 1.76T。
1/2/2025 11:14:46 AM
汪淼

本科学历但创造出GPT,奥特曼盛赞为「爱因斯坦级」天才,OpenAI总裁:他想要的,我们都给

奥特曼称他是爱因斯坦级别的天才;OpenAI总裁更是直言:只要他想要的,我们都给。 Alec Radford大神离职OpenAI,现在牵出更多细节:改变世界的GPT,竟然是在Jupyter notebook上诞生的。 而他只负责提供背后的灵感,剩下的由工程师来解决。
1/2/2025 7:30:00 AM

剖析BadGPT-40背后的真相:一个从GPT模型中移除护栏的模型

译者 | 晶颜审校 | 重楼出品 | 51CTO技术栈(微信号:blog51cto)大型语言模型(LLM)风靡全球。 从通用的智能助手到代码伙伴,这些模型似乎什么都能做——除了可靠地执行其内置的安全准则。 OpenAI等公司安装的广为人知的“护栏”旨在确保负责任的行为,保护用户免受恶意输出、虚假信息和网络利用企图的影响。
12/23/2024 12:52:29 PM
晶颜

公开版 OpenAI Sora 震撼登场!独立产品,开服就被挤爆!视频可控性拉满!奥特曼:视频的GPT时代开启

编辑 | 伊风第三天终于来了! 从年初盼到年末,可用的公开版Sora终于华丽登场! !
12/10/2024 8:59:05 AM
伊风

OpenAI 活动首日:完整版 o1 推理 AI 模型登场、月费 200 美元的 ChatGPT Pro 订阅亮相

OpenAI 启动了为期 12 天的“shipmas”新品发布周期,将推出一系列新功能、新产品以及相关演示。在本次活动首日,OpenAI 推出了完整版 o1 模型,并新增了月费为 200 美元的 ChatGPT Pro 订阅。
12/6/2024 2:41:05 AM
故渊

提示词:怎样与大模型沟通

同前面讲大模型特点类似,关于如何使用 GPT,我们也会分成两个视角:用户视角和技术视角。 这一讲,我们先从用户视角来看看如何用好 GPT。 用好 GPT若要充分发挥 GPT 的效用,需遵循以下步骤:首先是定义任务目标。
11/26/2024 11:44:04 AM
greencoatman

研究人员绕过 GPT-4o 模型安全护栏,利用“十六进制字符串”成功令其编写漏洞攻击程序

网络安全公司 0Din 的研究员 Marco Figueroa 发现了一种新型 GPT 越狱攻击手法,成功突破了 GPT-4o 内置的“安全护栏”措施,能够使其编写出恶意攻击程序。 参考 OpenAI 介绍,ChatGPT-4o 内置了一系列“安全护栏”措施,以防止该 AI 遭到用户不当使用,相关防护措施会分析输入的提示文本,判断用户是否要求模型生成恶意内容。 ▲ 图源 Marco Figueroa 博客(下同)不过 Marco Figueroa 尝试设计了一种将恶意指令转化为十六进制的越狱方法,号称能够绕过 GPT-4o 的防护,让 GPT-4o 解码运行用户的恶意指令。
11/4/2024 10:07:29 AM
漾仔

Python 成 GitHub 最受欢迎编程语言,AI 成主要推动力

GitHub 年度报告《Octoverse》显示,Python 首次超越 JavaScript 成为 GitHub 上最受欢迎的编程语言。 这主要是受到人工智能(AI)开发需求激增的推动,Python 还被广泛应用于数据科学和开源项目的开发。 报告指出,与生成式 AI 相关的项目贡献量在过去一年中增长了 59%,AI 相关的公共项目的贡献量几乎比 2023 年翻了一番,印度、德国、日本和新加坡是这些贡献的主要来源。
10/31/2024 2:00:24 PM
远洋

谷歌 CEO 桑达尔・皮查伊:努力在明年推出具有可视化功能的 AI 助理

北京时间今天凌晨,谷歌 CEO 桑达尔・皮查伊在公司第三季度财报电话会议上透露了“Project Astra”计划的最新进展。 他表示,谷歌正在构建能够识别和推理用户周围环境的 AI 体验,“‘Project Astra’代表了这种未来的初步探索。 我们正力争在 2025 年尽早推出类似体验。
10/30/2024 7:24:46 AM
清源

阿尔特曼回应 OpenAI 计划推出下一代模型 Orion:假消息失控了

今天午间,OpenAI 首席执行官山姆・阿尔特曼在 X 平台回应了近期有关“下一代模型 Orion”的报道:fake news out of control(假消息失控了)。 AI在线附前情提要:今天早些时候有外媒报道称,OpenAI 计划今年 12 月推出代号为“Orion”的新款前沿模型。 “Orion”采用有别于 GPT-4o 和 o1 的发布模式,不会通过 ChatGPT 广泛发布,而是先授权与其密切合作的公司,帮其构建自己的产品和功能。
10/25/2024 5:58:22 PM
清源

全球最强模型:OpenAI 被曝 12 月推出 Orion,AI 性能百倍级跃升

科技媒体 The Verge 今天(10 月 25 日)发布博文,报道称 OpenAI 计划今年 12 月推出代号为“Orion”的新款前沿模型。 AI在线援引该媒体报道,“Orion”采用有别于 GPT-4o 和 o1 的发布模式,不会通过 ChatGPT 广泛发布,而是先授权与其密切合作的公司,帮其构建自己的产品和功能。 此外消息源还表示微软内部工程师正在准备最早于 11 月在 Azure 上托管“Orion”。
10/25/2024 9:53:14 AM
故渊

科大讯飞星火 4.0 Turbo 大模型发布:七大能力全面超越 GPT-4 Turbo

在今日上午的 2024 科大讯飞全球 1024 开发者节上,科大讯飞正式发布“讯飞星火 4.0 Turbo”。 讯飞星火 4.0 Turbo 号称迎来全新升级,七大能力全面超越 GPT-4 Turbo,数学能力、代码能力超过 GPT-4o。 在数学能力方面,讯飞星火 4.0 Turbo 已完成超长思维链、树搜索和自我反思评价等算法验证,预计今年底可实现类 o1 的高难度数学能力。
10/24/2024 10:17:56 AM
汪淼

把 AI 放进《我的世界》服务器:GPT-4o 杀牛宰羊,Claude3.5 把家拆了

把《我的世界》交给大模型,会怎么样?GPT-4o 鲨牛宰羊,Claude3.5 不停在人类身旁放炸药包和敌人,还把家拆了。GPT-4o mini 玩《我的世界》belike: 来到游戏里面,GPT-4o mini(玩家 karolina)一开始还蛮礼貌的:你好世界!
10/21/2024 1:11:17 PM
清源

零一万物新旗舰模型 Yi-Lightning 发布:LMSYS 测试国产首次超越 GPT-4o,中国第一、世界第六

感谢李开复创办的 AI 公司零一万物于 10 月 16 日对外发布新旗舰模型 Yi-Lightning。在盲测榜单 LMSYS 上,Yi-Lightning 超越 OpenAI、Anthropic 所发布的 GPT-4o-2024-05-13、 Claude 3.5 Sonnet,排名世界第六,中国第一。零一万物表示,这是在 LMSYS 这一全球大模型必争的公开擂台上,中国大模型首度实现“超越 OpenAI GPT-4o ”的最佳成绩(AI在线注:此处 GPT-4o 为 OpenAI 于 5 月发布的 GPT-4o-2024-05-13)。
10/17/2024 9:17:06 AM
汪淼

OpenAI GPT-4 解锁新成就:100% 识别性别、74.25% 识别年龄范围,未专门训练可媲美专业算法

科技媒体 The Decoder 昨日(10 月 9 日)发布博文,报道称最新研究表明 OpenAI 的 GPT-4 AI 模型在未经专门微调和训练情况下,能够识别面孔、判断性别,并在照片中估计年龄,其准确度媲美专业算法。来自挪威科技大学、Mizani 及 Idiap 研究所的研究人员推进这项研究,测试了 GPT-4 的生物识别能力,发现其性能和 MobileFaceNet 等专门的面部识别算法不相上下。在性别识别测试中,GPT-4 在 5400 张平衡(balanced)图像的数据集上取得了 100% 的准确率,
10/10/2024 11:56:04 AM
故渊