LaVIT

ICLR 2024｜把图象视为外语，快手、北大多模态大模型媲美DALLE-3
动静视觉分词同一图文默示，快手与北大合作提出基座模型 LaVIT 刷榜多模态明白与生成任务。当前的大型说话模型如 GPT、LLaMA 等在自然说话处理领域取得了显著进展，不妨明白和生成复杂的文本实质。但你是否想过，如果不妨将大说话模型这强大的明白和生成才能迁移到多模态数据上，就可以轻松明白海量的图象与视频，并辅助创作图文并茂的实质。近期，来自快手和北大合作的最新多模态大模型 LaVIT, 正在让这…
应用
- 7
- 0
机器之心1月30日

❯

个人中心

今日签到

搜索

幸运之星正在降临...

点击领取今天的签到奖励！

恭喜！您今天获得了{{mission.data.mission.credit}}积分

今日签到

连续签到

{{item.credit}}

连续{{item.count}}天

我的优惠劵

_￥_优惠劵
使用时效：无法使用
使用时效：
之前
使用时效：永久有效

优惠劵ID：
×
限制以下商品使用：限制以下商品分类使用：不限制使用：

[{{ct.name}}]
所有商品和商品类型均可使用

没有优惠劵可用!

购物车

×
删除

购物车空空如也!

清空购物车前往结算

您有新的私信

没有新私信

写新私信查看全部