只需几个示范就能对齐大模型,杨笛一团队提出的DITTO竟如此高效
人类的教育方式,对大模型而言也很适用。养育孩子时,古往今来人们都会谈到一种重要方式:以身作则。也就是让自己成为孩子师法进修的范例,而不是单纯地告诉他们应该怎么做。在训练大语言模型(LLM)时,我们或许也能采用这样的方式 —— 向模型进行示范。近日,斯坦福大学杨笛一团队提出了一种新框架 DITTO,可通过少量示范(用户提供的期望行为示例)来将 LLM 与特定设置对齐。这些示例可以从用户现有的交互日志…- 21
- 0
DITTO
❯
个人中心
今日签到
搜索
扫码打开当前页
返回顶部
幸运之星正在降临...
点击领取今天的签到奖励!
恭喜!您今天获得了{{mission.data.mission.credit}}积分
我的优惠劵
- ¥优惠劵使用时效:无法使用使用时效:
之前
使用时效:永久有效优惠劵ID:×
没有优惠劵可用!