MoE-Tuning

将多模态大模型稀疏化，3B模型MoE-LLaVA媲美LLaVA-1.5-7B

对于大型视觉语言模型（LVLM）而言，扩展模型可以有效提高模型性能。然而，扩大参数规模会显著增加训练和推理成本，因为计算中每个 token 都会激活所有模型参数。基于此，来自北京大学、中山大学等机构的研究者联合提出了一种新颖的 LVLM 训练策略 ——MoE-Tuning。MoE-Tuning 可以构建参数数量惊人但计算成本恒定的稀疏模型，并有效解决通常与多模态学习和模型稀疏性相关的性能下降问题。该研究还提出了一种基于 MoE 的新型稀疏 LVLM 架构 ——MoE-LLaVA 框架。该框架独特地在部署过程中通过路

1/31/2024 3:01:00 PM

机器之心

资讯热榜

GGUF 是什么？一文看懂大模型里最火的模型格式 AI应用新纪元：2025中国AI应用排行榜榜单揭晓丨2025年1月免注册免费用！17种AI绘图模型一站式体验平台LMArena 可灵、即梦、海螺、Vidu哪家强？4大AI视频神器深度测评 Sora、可灵、即梦哪家强？AI视频软件深度测评！免费！让图片放大不失真的位图转矢量图神器 Tmttool 深度拆解！这可能是全网最详细的AI视频创作教程一张合影就能泄露全家信息？央视紧急预警：“读心AI”正让社交晒图变成隐私炸弹

标签云

AI 人工智能 OpenAI AIGC 模型 ChatGPT DeepSeek 谷歌 AI绘画大模型机器人数据 Midjourney AI新词开源 Meta 微软智能用户 GPT 学习技术智能体马斯克 Gemini Anthropic 英伟达图像 AI创作训练 LLM 论文代码算法 AI for Science Agent Claude 苹果芯片腾讯 Stable Diffusion 蛋白质开发者 xAI 生成式神经网络机器学习具身智能 3D RAG 人形机器人 AI视频研究大语言模型百度生成 Sora GPU 工具华为计算字节跳动 AI设计大型语言模型 AGI 搜索视频生成生成式AI 场景深度学习 DeepMind 架构 AI模型特斯拉 MCP 亚马逊 Transformer 编程视觉预测