GRAPE
把RLHF带给VLA模型!通过偏好对齐来优化机器人策略,代码已开源
论文一作为北卡罗来纳大学教堂山分校张子健,指导老师为北卡罗来纳大学教堂山分校助理教授 Huaxiu Yao。 共同第一作者为华盛顿大学 Kaiyuan Zheng,其余作者包括来自北卡教堂山的 Mingyu Ding、来自华盛顿大学的 Joel Jang、Yi Li 和Dieter Fox,以及来自芝加哥大学的 Zhaorun Chen、Chaoqi Wang。 论文标题:GRAPE: Generalizing Robot Policy via Preference Alignment论文链接:::,视觉-语言-动作模型(Vision-Language-Action, VLA)在诸多机器人任务上取得了显著的进展,但它们仍面临一些关键问题,例如由于仅依赖从成功的执行轨迹中进行行为克隆,导致对新任务的泛化能力较差。
12/27/2024 11:52:25 AM
- 1
资讯热榜
罗永浩 Jarvis 初创项目“J1 Assistant AI 助理”上线,利用语音与大模型互动
SK 海力士宣布参展 CES 2025,将展示 122TB 企业级固态硬盘等产品
突破非视距条件依赖!大规模区域、低成本的UWB-LiDAR标定与单次定位框架
阿里云与黑芝麻智能完成大模型车载芯片级适配
类 Mac Mini 大小的个人 AI 超算:英伟达 Project Digits 发布,起价 3000 美元
清华大学推 AutoDroid-V2:AI 离线在线协同,优化移动端自动化 GUI 控制
斯坦福AI科研神器开源,一键成文GPT-4o mini加持!科研写作彻底解放双手
AI模拟细胞,走向全新虚拟生命,斯坦福团队呼吁是时候走出全新的一步了
标签云
AI
模型
人工智能
AIGC
OpenAI
AI绘画
ChatGPT
机器人
数据
生成
谷歌
训练
视频
智能
学习
Midjourney
GPT
大模型
用户
AI创作
图像
LLM
微软
开源
技术
Meta
论文
Stable Diffusion
生成式
算法
蛋白质
芯片
马斯克
计算
神经网络
AI设计
Gemini
Sora
研究
腾讯
课程
代码
开发者
场景
伟达
GPU
3D
模态
预测
Transformer
华为
文本
驾驶
英伟达
神器推荐
机器学习
AI视频
语言
干货合集
LLaMA
深度学习
2024
算力
搜索
苹果
科技
视频生成
AI应用场景
应用
百度
写作
特斯拉
机器
安全
具身智能
Copilot
AI for Science
语音
prompt
AGI