ICLR 2024|把图象视为外语,快手、北大多模态大模型媲美DALLE-3
动静视觉分词同一图文默示,快手与北大合作提出基座模型 LaVIT 刷榜多模态明白与生成任务。当前的大型说话模型如 GPT、LLaMA 等在自然说话处理领域取得了显著进展,不妨明白和生成复杂的文本实质。但你是否想过,如果不妨将大说话模型这强大的明白和生成才能迁移到多模态数据上,就可以轻松明白海量的图象与视频,并辅助创作图文并茂的实质。近期,来自快手和北大合作的最新多模态大模型 LaVIT, 正在让这…- 7
- 0
LaVIT
❯
个人中心
今日签到
搜索
扫码打开当前页
返回顶部
幸运之星正在降临...
点击领取今天的签到奖励!
恭喜!您今天获得了{{mission.data.mission.credit}}积分
我的优惠劵
- ¥优惠劵使用时效:无法使用使用时效:
之前
使用时效:永久有效优惠劵ID:×
没有优惠劵可用!