-
与OpenAI o1技术理念相似,TDPO-R算法有效缓解奖励过优化问题
AIxiv专栏是AI在线发布学术、技术内容的栏目。 过去数年,AI在线AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。 如果您有优秀的工作想要分享,欢迎投稿或者联系报道。- 3
- 0
-
大模型边推理边纠错,有可能做到吗?这是ICML爆火的演讲
AIxiv专栏是AI在线发布学术、技术内容的栏目。过去数年,AI在线AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。投稿邮箱:[email protected];[email protected]即便是最强大的语言模型(LLM),仍会偶尔出现推理错误。除了通过提示…- 11
- 0
-
ICML 2024|复杂组合3D场景生成,LLMs对话式3D可控生成编辑框架来了
AIxiv专栏是AI在线发布学术、技术内容的栏目。过去数年,AI在线AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。投稿邮箱:[email protected];[email protected]该论文的第一作者和通讯作者均来自北京大学王选计算机研究所的 VDIG…- 8
- 0
-
ICML 2024 Oral | DPO是否比PPO更适合LLM,清华吴翼团队最新揭秘
AIxiv专栏是AI在线发布学术、技术内容的栏目。过去数年,AI在线AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。投稿邮箱:[email protected];[email protected]吴翼,清华大学交叉信息院助理教授,曾任 OpenAI 全职研究员,研…- 10
- 0
-
ICML 2024 | 梯度检查点太慢?不降速、省显存,LowMemoryBP大幅提升反向传播显存效率
AIxiv专栏是AI在线发布学术、技术内容的栏目。过去数年,AI在线AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。投稿邮箱:[email protected];[email protected]本文论文一作是南开大学统计与数据科学学院研二硕士生杨雨辰,指导老师为…- 6
- 0
-
首个视频思维链推理框架Video-of-Thought来了:像人一样从感知到认知全面推理视频
AIxiv专栏是AI在线发布学术、技术内容的栏目。过去数年,AI在线AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。投稿邮箱:[email protected];[email protected]本文作者来自于新加坡国立大学、南洋理工大学以及哈工深。其中,费豪的研…- 5
- 0
-
没想到!AlphaZero式树搜索也能用来增强大语言模型推理与训练
AIxiv专栏是AI在线发布学术、技术内容的栏目。过去数年,AI在线AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。投稿邮箱:[email protected];[email protected]万梓煜是上海交通大学的三年级在读博士生,导师为温颖教授和张伟楠教授,…- 16
- 0
-
ICML 2024高分论文 | 零阶优化器微调大模型,大幅降低内存
AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级尝试室,有效促进了学术交流与传递。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。投稿邮箱:[email protected];[email protected]本文共同第一作者简介:张逸骅:密歇根州立大学计算机系博士三年级学生,…- 7
- 0
-
ICML 2024 | 揭示非线形Transformer在上下文进修中进修和泛化的机制
AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。投稿邮箱:[email protected];[email protected]本文作者李宏康,美国伦斯勒理工大学电气、计算机与系统工程系在读博士生…- 4
- 0
-
ICML 2024 | 旗号表征指数级强、内存节省超35%,量子隐式表征搜集来了
AIxiv专栏是机械之心发布学术、技术内容的栏目。过去数年,机械之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。投稿邮箱:[email protected];[email protected]本文作者是天津大学智能与计算学部张鹏教授及其硕士生赵佳铭,博士生乔文…- 6
- 0
-
填补AlphaFold3空白,字节跳动提出物理导致的法子让蛋白质动起来
世界是变化的,份子是运动的,从展望固态单一布局走向动态构象分散是揭示蛋白质等生物份子功能的重要一步。探索蛋白质的构象分散,能帮助理解蛋白质与其他份子相互作用的生物过程;识别蛋白质表面下的潜在药物位点,描绘各个亚稳态之间的过渡路径,有助于研究人员计划出具有更强特异性和效力的目标抑制剂和治疗药物。但传统的份子动力学模拟法子昂贵且耗时,难以跨越长的时间尺度,从而观察到重要的生物过程。近年来的深度学习蛋白…- 3
- 0
-
ICML 2024 | 脱离LoRA架构,训练参数大幅减少,新型傅立叶微调来了
AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。投稿邮箱:[email protected];[email protected]本文介绍了香港科技大学(广州)的一篇关于大模型高效微调(LLM PE…- 5
- 0
-
具身智能体三维感知新链条,TeleAI &上海AI Lab提出多视角混合具身模型「SAM-E」
AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。投稿邮箱:[email protected];[email protected]当我们拿起一个板滞手表时,从正面会看到表盘和指针,从侧面会看到表冠和…- 19
- 0
-
仅靠开源数据复刻出LLaMA3指令进修效果,在线迭代RLHF全过程解决方案来了
AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。投稿邮箱:[email protected];[email protected]本文作者熊伟是伊利诺伊香槟分校的在读博士生,其导师为 Tong Zh…- 13
- 0
-
ICML 2024 | 大言语模型预训练新前沿:「最好适配打包」重塑文档处理标准
AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级试验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。投稿邮箱:[email protected];[email protected]在大型言语模型的训练过程中,数据的处理方式至关重要。传统的方式通常通…- 6
- 0
-
ICML 2024 AI for Math Workshop 征稿和挑战赛启动!
ICML 2024, AI for Math Workshop面向形式化和自然语言AI数学推理的研讨会时光:2024年7月26/27日地点:奥地利,维也纳。现场、线上同步举行。研讨会主页:。人类在数学推理的发展进程中总结出了各种形式化语言,得以严格地描述数学问题和证明过程。而近年来的机器学习算法和大规模语言模型正在逐步接近甚至超越人类在一些数学推理的表现。那么,下一步我们该如何发展AI数学推理,使…- 4
- 0
❯
个人中心
今日签到
搜索
扫码打开当前页
返回顶部
幸运之星正在降临...
点击领取今天的签到奖励!
恭喜!您今天获得了{{mission.data.mission.credit}}积分
我的优惠劵
-
¥优惠劵使用时效:无法使用使用时效:
之前
使用时效:永久有效优惠劵ID:×
没有优惠劵可用!