文本分析

达摩院开源 VideoLLaMA3:仅 7B 大小,视频理解拿下 SOTA

它就是由达摩院出品的 Video LLaMA 3,以图像为中心构建的新一代多模态视频-语言模型。
  • 1