微调 GPT-4o AI 模型新维度，OpenAI 开放图片视觉微调功能

OpenAI 公司昨日（10 月 1 日）发布博文，宣布为 GPT-4o 模型引入视觉微调（vision fine-tuning）功能，除了文本之外还支持微调图像。OpenAI 表示自开放微调 GPT-4o 以来，数十万开发者使用数据集（仅文本）微调了该模型，从而提高了驾驭某些特定任务的能力。OpenAI 在博文中展示了一些合作伙伴的微调案例：Garb ：通过视觉微调，提升了交通标志定位准确性 20% 和限速标志定位 13%。Automat：成功率从 16.60% 提升至 61.67%，并在信息提取任务中 F1 分

OpenAI 公司昨日（10 月 1 日）发布博文，宣布为 GPT-4o 模型引入视觉微调（vision fine-tuning）功能，除了文本之外还支持微调图像。

OpenAI 表示自开放微调 GPT-4o 以来，数十万开发者使用数据集（仅文本）微调了该模型，从而提高了驾驭某些特定任务的能力。

OpenAI 在博文中展示了一些合作伙伴的微调案例：

Garb ：通过视觉微调，提升了交通标志定位准确性 20% 和限速标志定位 13%。

Automat：成功率从 16.60% 提升至 61.67%，并在信息提取任务中 F1 分数提升 7%。

Coframe：通过微调提升了网站生成的一致性和布局正确性 26%。

定价

OpenAI 宣布项所有付费用户开放视觉微调功能。

在 2024 年 10 月 31 日之前，每天免费提供 100 万训练 token，用于针对 GPT-4o 模型进行图片微调。

2024 年 10 月 31 日之后，GPT-4o 微调训练收费，每 100 万训练 token 收费 25 美元（AI在线备注：当前约 176 元人民币）

推理每 100 万 token 输入收费 3.75 美元（当前约 26.3 元人民币）

推理每 100 万 token 输出收费 15 美元（当前约 105 元人民币）。

{{userData.name}}已认证

微调 GPT-4o AI 模型新维度，OpenAI 开放图片视觉微调功能

定价

紧跟微软步伐，谷歌开始为 Chromebook 机型添加专用 AI 按键

10 倍速度提升，新版 Dream Machineds 可在 20 秒内极速生成高质量 AI 视频

细节表现超Sora，网友：真正的国产之光！MiniMax视频模型再上新

快手预告“可灵 AI”导演共创计划作品 12 月 6 日上线：联合李少红、贾樟柯、叶锦添、薛晓路等

关于LLM-as-a-judge范式，终于有综述讲明白了

平安人寿ChatBI：大模型智能化报表的深度实践

李飞飞「世界实验室」重磅推出 AI“造物主”：一张图片生成 3D 世界“任意门”

ChatGPT遇到这些人名开始自闭，OpenAI回应了

字节跳动豆包 AI 文生图“喜提新技能”：App 可生成带有指定文字的图片

李飞飞空间智能首秀：AI靠单图生成3D世界，可探索，遵循基本物理几何规则