工程

TPAMI 2024 | ProCo: 无限contrastive pairs的长尾对比学习
AIxiv专栏是AI在线发布学术、技术内容的栏目。过去数年，AI在线AIxiv专栏接收报道了2000多篇内容，覆盖全球各大高校与企业的顶级实验室，有效促进了学术交流与传播。如果您有优秀的工作想要分享，欢迎投稿或者联系报道。投稿邮箱：[email protected]；[email protected]本论文第一作者杜超群是清华大学自动化系 2020 级直博生。导师为黄…
工程
- 17
- 0
机器之心7月25日
数学大统一理论里程碑进展：几何朗兰兹猜想获证明，论文超800页
历经三十年的努力，数学家已经成功证明了一个名为「朗兰兹纲领（Langlands program）」的宏大数学愿景的主要部分。一个由 9 位数学家组成的团队成功证明了几何朗兰兹猜想（Geometric Langlands Conjecture），这是现代数学领域涉及范围最广的范式之一。马克斯・普朗克数学研究所的著名数学家 Peter Scholze（他并未参与此证明）说：这项证明是三十年辛苦研究所到…
工程
- 12
- 0
机器之心7月24日
清华领衔发布多模态评估MultiTrust：GPT-4可信度有几何？
AIxiv专栏是AI在线发布学术、技术内容的栏目。过去数年，AI在线AIxiv专栏接收报道了2000多篇内容，覆盖全球各大高校与企业的顶级实验室，有效促进了学术交流与传播。如果您有优秀的工作想要分享，欢迎投稿或者联系报道。投稿邮箱：[email protected]；[email protected]本工作由清华大学朱军教授领衔的基础理论创新团队发起。长期以来，团队着…
工程
- 15
- 0
机器之心7月24日
真相了！大模型解数学题和人类真不一样：死记硬背、知识欠缺明显，GPT-4o表现最佳
AIxiv专栏是AI在线发布学术、技术内容的栏目。过去数年，AI在线AIxiv专栏接收报道了2000多篇内容，覆盖全球各大高校与企业的顶级实验室，有效促进了学术交流与传播。如果您有优秀的工作想要分享，欢迎投稿或者联系报道。投稿邮箱：[email protected]；[email protected]本文作者来自北京邮电大学、腾讯微信、华中科技大学、北京理工大学。作者…
工程
- 9
- 0
机器之心7月23日
无限生成视频，还能规划决策，扩散强制整合下一token预测与全序列扩散
当前，采用下一 token 预测范式的自回归大型语言模型已经风靡全球，同时互联网上的大量合成图像和视频也早已让我们见识到了扩散模型的强大之处。近日，MIT CSAIL 的一个研究团队（一作为 MIT 在读博士陈博远）成功地将全序列扩散模型与下一 token 模型的强大能力统合到了一起，提出了一种训练和采样范式：Diffusion Forcing（DF）。论文标题：Diffusion Forcing…
工程
- 8
- 0
机器之心7月23日
ECCV 2024｜盲视频去闪烁通用方法BlazeBVD来了，美图&国科大联合提出
AIxiv专栏是AI在线发布学术、技术内容的栏目。过去数年，AI在线AIxiv专栏接收报道了2000多篇内容，覆盖全球各大高校与企业的顶级实验室，有效促进了学术交流与传播。如果您有优秀的工作想要分享，欢迎投稿或者联系报道。投稿邮箱：[email protected]；[email protected]近年，短视频生态的赛道迅猛崛起，围绕短视频而生的创作编辑工具在不断涌…
工程
- 5
- 0
机器之心7月23日
中科大联合华为诺亚提出Entropy Law，揭秘大模型性能、数据压缩率以及训练损失关系
AIxiv专栏是AI在线发布学术、技术内容的栏目。过去数年，AI在线AIxiv专栏接收报道了2000多篇内容，覆盖全球各大高校与企业的顶级实验室，有效促进了学术交流与传播。如果您有优秀的工作想要分享，欢迎投稿或者联系报道。投稿邮箱：[email protected]；[email protected]本工作由中科大认知智能全国重点实验室 IEEE Fellow 陈恩红…
工程
- 21
- 0
机器之心7月22日
ECCV 2024 | 提升GPT-4V、Gemini检测任务性能，你需要这种提示范式
AIxiv专栏是AI在线发布学术、技术内容的栏目。过去数年，AI在线AIxiv专栏接收报道了2000多篇内容，覆盖全球各大高校与企业的顶级实验室，有效促进了学术交流与传播。如果您有优秀的工作想要分享，欢迎投稿或者联系报道。投稿邮箱：[email protected]；[email protected]本文作者来自浙江大学、上海人工智能实验室、香港中文大学、悉尼大学和牛…
工程
- 12
- 0
机器之心7月22日
ICML 2024 Oral | DPO是否比PPO更适合LLM，清华吴翼团队最新揭秘
AIxiv专栏是AI在线发布学术、技术内容的栏目。过去数年，AI在线AIxiv专栏接收报道了2000多篇内容，覆盖全球各大高校与企业的顶级实验室，有效促进了学术交流与传播。如果您有优秀的工作想要分享，欢迎投稿或者联系报道。投稿邮箱：[email protected]；[email protected]吴翼，清华大学交叉信息院助理教授，曾任 OpenAI 全职研究员，研…
工程
- 10
- 0
机器之心7月22日
ECCV 2024 | 让GPT-4图像理解更易出错，全新策略增强VLP模型对抗迁移性
AIxiv专栏是AI在线发布学术、技术内容的栏目。过去数年，AI在线AIxiv专栏接收报道了2000多篇内容，覆盖全球各大高校与企业的顶级实验室，有效促进了学术交流与传播。如果您有优秀的工作想要分享，欢迎投稿或者联系报道。投稿邮箱：[email protected]；[email protected]本文作者分别来自南开大学、南洋理工大学和新加坡科技局。第一作者高森森…
工程
- 7
- 0
机器之心7月22日
可「自主进化」的Agent？首个端到端智能体符号化训练框架开源了
AIxiv专栏是AI在线发布学术、技术内容的栏目。过去数年，AI在线AIxiv专栏接收报道了2000多篇内容，覆盖全球各大高校与企业的顶级实验室，有效促进了学术交流与传播。如果您有优秀的工作想要分享，欢迎投稿或者联系报道。投稿邮箱：[email protected]；[email protected]本文主要作者来自波形智能、浙江大学、和北京航空航天大学。共同一作中，…
工程
- 6
- 0
机器之心7月22日
NeurIPS 2024 Workshop 科学基础模型: 进展, 机遇, 挑战
Workshop背景人工智能 (AI) 和机器学习 (ML) 在科学领域的应用代表了传统科学发现方法的重大转变。几个世纪以来，探索自然世界的过程遵循着系统和逻辑的方法。然而，人工智能和机器学习技术的出现，正在深刻改变现代基础科学的发现方式。这种变化对于促进跨学科交流、激发创新的解决方案，并最终提高科学界应对现代科学中最紧迫和复杂问题的能力至关重要。与此同时，经过大量多样化数据集训练的基础模型，在计…
工程
- 19
- 0
新闻助手7月20日
华为GTS LocMoE+：高可扩展性亲和度 MoE 架构，低开销实现主动路由
AIxiv专栏是AI在线发布学术、技术内容的栏目。过去数年，AI在线AIxiv专栏接收报道了2000多篇内容，覆盖全球各大高校与企业的顶级实验室，有效促进了学术交流与传播。如果您有优秀的工作想要分享，欢迎投稿或者联系报道。投稿邮箱：[email protected]；[email protected]本论文共同一作为李婧博士，孙志杰和林大超博士，主要成员来自GTS A…
工程
- 7
- 0
机器之心7月19日
贾佳亚团队联手剑桥清华等共推评测新范式一秒侦破大模型“高分低能”
颠覆过往大模型评测标准，最新、最全、最权威的测评数据集MR-Ben来了！这是继今年4月发布堪称GPT-4 DALL- E-3的王炸产品超强视觉语言模型Mini-Gemini后，港中文贾佳亚团队再次提出的极具代表性的作品。在MR-Ben的“监督”下，大模型不仅要像学生那样会答题，还要像老师那样会阅卷，真实的推理能力无所遁形。MR-Ben细致地评测了不少国内外一线的开源和闭源模型，如GPT4-Turb…
工程
- 5
- 0
新闻助手7月18日
OpenAI超级对齐团队遗作：两个大模型博弈一番，输出更好懂了
如果 AI 模型给的答案一点也看不懂，你敢用吗？随着机器学习系统在更重要的领域得到应用，证明为什么我们可以信任它们的输出，并明确何时不应信任它们，变得越来越重要。获得对复杂系统输出结果信任的一个可行方法是，要求系统对其输出产生一种解释，这种解释对人类或另一个受信任的系统来说是可读的，即可以完全理解以至于任何可能的错误都可以被发现。例如，为了建立对司法系统的信任，我们要求法院提供清晰易读的书面意见，…
工程
- 10
- 0
机器之心7月18日
ACL 2024 | 对25个开闭源模型数学评测，GPT-3.5-Turbo才勉强及格
AIxiv专栏是AI在线发布学术、技术内容的栏目。过去数年，AI在线AIxiv专栏接收报道了2000多篇内容，覆盖全球各大高校与企业的顶级实验室，有效促进了学术交流与传播。如果您有优秀的工作想要分享，欢迎投稿或者联系报道。投稿邮箱：[email protected]；[email protected]本文作者来自香港大学和腾讯。作者列表：李沁桐，Leyang Cui，…
工程
- 4
- 0
机器之心7月18日
无损加速最高5x，EAGLE-2让RTX 3060的生成速度超过A100
AIxiv专栏是AI在线发布学术、技术内容的栏目。过去数年，AI在线AIxiv专栏接收报道了2000多篇内容，覆盖全球各大高校与企业的顶级实验室，有效促进了学术交流与传播。如果您有优秀的工作想要分享，欢迎投稿或者联系报道。投稿邮箱：[email protected]；[email protected]李堉晖：北京大学智能学院硕士，受张弘扬老师和张超老师指导，研究方向为…
工程
- 18
- 0
机器之心7月17日
太酷了！iPhone、iPad、MacBook老旧设备组成异构集群，能跑Llama 3
假如你有闲置的设备，或许可以试一试。这次，你手里的硬件设备也能在 AI 领域大展拳脚了。将 iPhone、iPad、Macbook 进行组合，就能组装成「异构集群推理方案」，然后顺畅的运行 Llama3 模型。值得一提的是，这个异构集群可以是 Windows 系统，也可以是Linux、iOS 系统，并且对 Android 的支持很快到来。 …
工程
- 4
- 0
机器之心7月16日
公理训练让LLM学会因果推理：6700万参数模型比肩万亿参数级GPT-4
把因果链展示给 LLM，它就能学会公理。AI 已经在帮助数学家和科学家做研究了，比如著名数学家陶哲轩就曾多次分享自己借助 GPT 等 AI 工具研究探索的经历。AI 要在这些领域大战拳脚，强大可靠的因果推理能力是必不可少的。本文要介绍的这项研究发现：在小图谱的因果传递性公理演示上训练的 Transformer 模型可以泛化用于大图谱的传递性公理。也就是说，如果让 Transformer 学会执行简…
工程
- 5
- 0
机器之心7月16日
登顶开源AI软件工程师榜首，UIUC无Agent方案轻松解决SWE-bench真实编程问题
AIxiv专栏是AI在线发布学术、技术内容的栏目。过去数年，AI在线AIxiv专栏接收报道了2000多篇内容，覆盖全球各大高校与企业的顶级实验室，有效促进了学术交流与传播。如果您有优秀的工作想要分享，欢迎投稿或者联系报道。投稿邮箱：[email protected]；[email protected]这篇论文的作者均来自伊利诺伊大学香槟分校（UIUC）张令明老师团队，…
工程
- 7
- 0
机器之心7月15日
Meta开发System 2蒸馏技术，Llama 2对话模型任务准确率接近100%
研究者表示，如果 Sytem 2 蒸馏可以成为未来持续学习 AI 系统的重要特征，则可以进一步提升 System 2 表现不那么好的推理任务的性能。谈到大语言模型（LLM）的策略，一般来说有两种，一种是即时的 System 1（快速反应），另一种是 System 2（慢速思考）。其中 System 2 推理倾向于深思熟虑的思维，生成中间思维允许模型（或人类）进行推理和规划，以便成功完成任务或响应指…
工程
- 19
- 0
机器之心7月15日
端侧设备AI代理优化框架问世，领域内准确率可达97%
AIxiv专栏是AI在线发布学术、技术内容的栏目。过去数年，AI在线AIxiv专栏接收报道了2000多篇内容，覆盖全球各大高校与企业的顶级实验室，有效促进了学术交流与传播。如果您有优秀的工作想要分享，欢迎投稿或者联系报道。投稿邮箱：[email protected]；[email protected]文章由NEXA AI团队联合MIT-IBM Watson AI La…
工程
- 7
- 0
机器之心7月15日
ICML 2024 | 梯度检查点太慢？不降速、省显存，LowMemoryBP大幅提升反向传播显存效率
AIxiv专栏是AI在线发布学术、技术内容的栏目。过去数年，AI在线AIxiv专栏接收报道了2000多篇内容，覆盖全球各大高校与企业的顶级实验室，有效促进了学术交流与传播。如果您有优秀的工作想要分享，欢迎投稿或者联系报道。投稿邮箱：[email protected]；[email protected]本文论文一作是南开大学统计与数据科学学院研二硕士生杨雨辰，指导老师为…
工程
- 6
- 0
机器之心7月12日
首个视频思维链推理框架Video-of-Thought来了：像人一样从感知到认知全面推理视频
AIxiv专栏是AI在线发布学术、技术内容的栏目。过去数年，AI在线AIxiv专栏接收报道了2000多篇内容，覆盖全球各大高校与企业的顶级实验室，有效促进了学术交流与传播。如果您有优秀的工作想要分享，欢迎投稿或者联系报道。投稿邮箱：[email protected]；[email protected]本文作者来自于新加坡国立大学、南洋理工大学以及哈工深。其中，费豪的研…
工程
- 5
- 0
机器之心7月12日