AI在线 AI在线

词表

视觉Token无缝对齐LLMs词表!V²Flow:基于LLMs实现高保真自回归图像生成

视觉Token可以与LLMs词表无缝对齐了! V²Flow,基于LLMs可以实现高保真自回归图像生成。 随着ChatGPT掀起自回归建模革命后,近年来研究者们开始探索自回归建模在视觉生成任务的应用,将视觉和文本数据统一在“next-token prediction”框架下。
4/3/2025 10:17:23 AM
  • 1