微软:两个 AI 相互纠错,数学再涨 5 分
来自加州大学和微软研究院的最新研究成果:Flow-DPO。通过使用在线学习流(Flow)和直接偏好优化(DPO, Direct Preference Optimization),可以让 LLM 生成更加详细和精确的推理轨迹。- 975
- 0
陶哲轩宣布“等式理论计划”成功:人类 AI 协作,57 天完成 2200 万 + 数学关系证明
“等式理论计划”,由陶哲轩本人在 2024 年 9 月 25 日发起,目的是探索按蕴含关系排序的原群(magma)等式理论空间。- 977
- 0
AI数学
❯
个人中心
今日签到
搜索
扫码打开当前页
返回顶部
幸运之星正在降临...
点击领取今天的签到奖励!
恭喜!您今天获得了{{mission.data.mission.credit}}积分
我的优惠劵
- ¥优惠劵使用时效:无法使用使用时效:
之前
使用时效:永久有效优惠劵ID:×
没有优惠劵可用!