2025年2月27日—— OpenAI 于今日正式推出其最新语言模型 GPT-4.5,作为研究预览版率先提供给 ChatGPT Pro 用户(每月订阅费200美元)。这款被誉为“迄今为止最大、最知识渊博”的模型基于 GPT-4o 构建,在推理能力、情感智能以及写作、编程等实用功能上实现显著提升。OpenAI 表示,未来几周内,GPT-4.5将逐步开放给 Plus、Team、Enterprise 和 Edu 用户,标志着人工智能技术的又一里程碑。
功能亮点:更聪明、更自然
GPT-4.5在多个领域展现了令人瞩目的进步。根据 OpenAI 发布的系统卡片,该模型通过监督微调(SFT)和强化学习(RLHF)训练,显著减少了“幻觉”现象(错误或虚构信息),并提升了情感智能和用户交互的自然度。例如,在 PersonQA 测试中,GPT-4.5的幻觉率仅为19%,远低于 GPT-4o 的52%。 用户体验方面,GPT-4.5在写作和编程任务中表现出色,能够生成更具创造性和审美直觉的内容,同时更准确地理解用户意图。X 用户 Simon Willison 在试用后表示:“它在知识深度和生成内容(如绘制鹈鹕)方面表现更好,交互体验更自然。”此外,模型支持文件和图像上传,并集成了 ChatGPT 的画布工具,但目前暂不支持语音、视频或屏幕共享等多模态功能。
数据与安全:透明与责任并重
OpenAI 透露,GPT-4.5的训练数据来源于多样化渠道,包括公开数据、专有合作伙伴数据以及内部定制数据集,经过严格过滤以确保质量并保护隐私。安全方面,模型配备 Moderation API 和分类器,有效防止生成有害内容。 在第三方评估中,Apollo Research 和 METR 对 GPT-4.5的欺骗风险和自主性进行了测试,结果显示其总体风险为“中等”。尤其在化学、生物、放射性核材料(CBRN)和说服力领域风险中等,而网络安全和模型自主性风险较低。OpenAI 已采取措施,如预训练过滤 CBRN 数据并监控潜在滥用,以确保安全性。
用户反馈:能力提升但速度待优化
首批用户的反馈显示,GPT-4.5在知识广度和创造性方面广受好评。X 用户 @pckraftwerk 称赞其“写作和编码能力显著增强,幻觉现象减少”。然而,速度问题也引发关注。Simon Willison 指出,通过 API 使用时,GPT-4.5的响应速度较慢,可能影响实时应用场景。他还透露,该模型使用了比 GPT-4多10倍的训练计算资源,性能提升背后是巨大的投入。
此外,OpenAI 明确表示,GPT-4.5并非专为深度推理设计,建议用户在需要复杂推理时选择 o1或 o3-mini 模型,这一定位也引发了部分讨论。
市场影响与未来展望
作为 OpenAI 的最新力作,GPT-4.5被认为将在写作、编程和问题解决等领域推动生产力革新。其多语言表现同样亮眼,在 MMLU 基准测试中,英语准确率达0.896,西班牙语0.8840,阿拉伯语0.8598,全面超越 GPT-4o。 业内人士预测,随着 GPT-4.5逐步推广,其强大的功能和较高的安全性将进一步巩固 OpenAI 在 AI 领域的领先地位。未来,OpenAI 计划根据用户反馈优化模型,并可能扩展语音和视频等功能,进一步丰富其应用场景。
结语
GPT-4.5的发布不仅展示了 OpenAI 在技术上的雄心,也凸显了其对安全和用户体验的重视。尽管速度问题尚待解决,但这款模型无疑为 AI 的发展开启了新的篇章。正如 OpenAI 在声明中所说:“我们希望 GPT-4.5能为用户带来更智能、更可靠的助手体验。”