OpenAI 公司昨日(10 月 1 日)发布博文,宣布为 GPT-4o 模型引入视觉微调(vision fine-tuning)功能,除了文本之外还支持微调图像。
OpenAI 表示自开放微调 GPT-4o 以来,数十万开发者使用数据集(仅文本)微调了该模型,从而提高了驾驭某些特定任务的能力。
OpenAI 在博文中展示了一些合作伙伴的微调案例:
Garb :通过视觉微调,提升了交通标志定位准确性 20% 和限速标志定位 13%。
Automat:成功率从 16.60% 提升至 61.67%,并在信息提取任务中 F1 分数提升 7%。
Coframe:通过微调提升了网站生成的一致性和布局正确性 26%。
定价
OpenAI 宣布项所有付费用户开放视觉微调功能。
在 2024 年 10 月 31 日之前,每天免费提供 100 万训练 token,用于针对 GPT-4o 模型进行图片微调。
2024 年 10 月 31 日之后,GPT-4o 微调训练收费,每 100 万训练 token 收费 25 美元(AI在线备注:当前约 176 元人民币)
推理每 100 万 token 输入收费 3.75 美元(当前约 26.3 元人民币)
推理每 100 万 token 输出收费 15 美元(当前约 105 元人民币)。