AI在线 AI在线

OpenING

CVPR 2025 Oral | 多模态交互新基准OpenING,新版GPT-4o杀疯了?

不必纠结了! 人类大脑天然具备同时理解和创造视觉与语言信息的能力。 一个通用的多模态大语言模型(MLLM)理应复刻人类的理解和生成能力,即能够自如地同时处理与生成各种模态内容,实现多模态交互,这也是向通用人工智能(AGI)迈进的关键挑战之一。
4/5/2025 5:24:00 PM
机器之心
  • 1