融合视觉能力,OpenAI 向开发人员供应 GPT-4 Turbo with Vision

感谢OpenAI 宣布,具有视觉能力的最新 GPT-4 Turbo 模型 GPT-4 Turbo with Vision 现已通过 OpenAI API 向开发人员普遍供应。据IT之家了解,该模型延续了 GPT-4 Turbo 系列 128,000 个 token 的窗口大小以及截止至 2023 年 12 月的知识库,最大的革新之处在于其新增的视觉理解能力。在过去,开发者需要调用不同的模型来处理文本和图像信息,而 GPT-4 Turbo with Vision 则将两者合二为一,极大简化了开发流程,并带来了广泛的应

感谢OpenAI 宣布,具有视觉能力的最新 GPT-4 Turbo 模型 GPT-4 Turbo with Vision 现已通过 OpenAI API 向开发人员普遍供应。

融合视觉能力,OpenAI 向开发人员供应 GPT-4 Turbo with Vision

据IT之家了解,该模型延续了 GPT-4 Turbo 系列 128,000 个 token 的窗口大小以及截止至 2023 年 12 月的知识库,最大的革新之处在于其新增的视觉理解能力。在过去,开发者需要调用不同的模型来处理文本和图像信息,而 GPT-4 Turbo with Vision 则将两者合二为一,极大简化了开发流程,并带来了广泛的运用前景。

OpenAI 也分享了一些开发者正在运用该模型的有趣案例。例如,AI 软件工程助手 Devin 行使 GPT-4 Turbo with Vision 辅助编程;健康健身运用程序 Healthify 运用该模型扫描用户饮食照片,通过图像识别供应营养分析;创意平台 Make Real 则行使该模型将用户的草图转化为可运行的网站。

目前,GPT-4 Turbo with Vision 尚未运用于 ChatGPT 或开放给大众运用,不过 OpenAI 暗示该功能即将登陆 ChatGPT。

给TA打赏
共{{data.count}}人
人已打赏
AI

Instagram 短视频板块 Reels 测试 AI 同传性能,用户可用自己声音“说外语”

2024-4-9 21:01:39

AI

苹果介绍 Ferret-UI 多模态大谈话模型:更充分懂得手机屏幕实质

2024-4-10 7:50:52

0 条回复 A文章作者 M管理员
    暂无讨论,说说你的看法吧
个人中心
今日签到
搜索