视觉强化微调
视觉强化微调!DeepSeek R1技术成功迁移到多模态领域,全面开源
今天给大家重磅推荐一个突破性的视觉强化微调开源项目 —— Visual-RFT (Visual Reinforcement Fine-Tuning)。 论文地址: : Visual-RFT 将 DeepSeek-R1 背后的基于规则奖励的强化学习方法和 OpenAI 的强化微调(Reinforcement Fine-Tuning,RFT)范式成功从纯文本大语言模型拓展到了视觉语言大模型(LVLM)。 通过针对视觉的细分类、目标检测等任务设计对应的规则奖励,Visual-RFT 打破了 DeepSeek-R1 方法局限于文本、数学推理、代码等少数领域的认知,为视觉语言模型的训练开辟了全新路径!
3/4/2025 5:27:05 PM
机器之心
- 1
资讯热榜
阿里新开源推理大模型QwQ-32B,性能媲美DeepSeek-R1、显存需求更小
Manus 内测启动:Monica 团队推出“通用 AI 代理”引发热议
DeepSeek+Drawio一键生成20多种图表,90%都不知道的技巧(附保姆级教程)
三分钟部署自己的 DeepSeek R1 满血版,彻底告别服务器繁忙!
Sesame 发布 CSM 语音模型:跨越“恐怖谷”,逼真程度惊艳全球
阿里深夜开源万相2.1,这是AI视频领域的DeepSeek!
OpenAI计划将视频生成神器Sora整合至ChatGPT,扩展AI创作版图
视觉强化微调!DeepSeek R1技术成功迁移到多模态领域,全面开源
标签云
人工智能
OpenAI
AIGC
ChatGPT
AI绘画
AI
DeepSeek
机器人
数据
谷歌
大模型
智能
Midjourney
学习
用户
GPT
模型
开源
微软
AI创作
图像
Meta
技术
论文
Stable Diffusion
马斯克
算法
生成式
蛋白质
芯片
Gemini
代码
神经网络
计算
腾讯
研究
Sora
AI设计
3D
GPU
开发者
英伟达
机器学习
场景
AI for Science
伟达
预测
华为
Transformer
模态
百度
驾驶
深度学习
文本
AI视频
苹果
搜索
Anthropic
神器推荐
算力
LLaMA
科技
视频生成
干货合集
安全
应用
xAI
2024
Copilot
特斯拉
字节跳动
具身智能
视觉
AI应用场景
语音
写作
人形机器人
亚马逊
机器
大语言模型