工程

北大林宙辰团队全新混合序列建模架构MixCon：性能远超Mamba
AIxiv专栏是AI在线发布学术、技术内容的栏目。过去数年，AI在线AIxiv专栏接收报道了2000多篇内容，覆盖全球各大高校与企业的顶级实验室，有效促进了学术交流与传播。如果您有优秀的工作想要分享，欢迎投稿或者联系报道。
工程
- 1
- 0
机器之心10月15日
小滑块上个斜面，难倒多少高中生？现在，AI让它动起来了
原来物理还能这么学。学习物理，不同的人自然有不同的经历。一些人觉得物理课简单直观，但另一些人却认为它抽象又反直觉，根本就无法理解。
工程
- 8
- 0
机器之心10月15日
六年、六届学生接力，共铸上交大图像合成工具箱libcom
arXiv:2106.14490v5如果你对 arXiv 的版本号有所了解，你就知道这篇论文已经更新了 4 次，现在已经来到了第 5 个版本。实际上，这个 arXiv 编号属于上海交通大学牛力团队一篇持续更新了四年的综述报告。该综述介绍了图像合成（image composition）领域需要解决的问题和应运而生的子任务，总结了各个子任务的数据集、传统方法、深度学习方法和实验现象，从鸿蒙初辟写到尘…
工程
- 6
- 0
机器之心10月12日
李飞飞：不要数字孪生，要数字表兄弟，一张照片生成机器人训练场景
不百分百还原出虚拟场景，效果反而更好。我们很多人都听说过数字孪生（digital twin），在英伟达等公司的大力推动下，这种高效运营工作流程的方法已经在很多工业场景中得到应用。但你听说过数字表亲（digital cousin）吗？
工程
- 14
- 0
机器之心10月12日
NeurIPS 2024 | Transformer长度外推，全新位置编码DAPE大幅提升模型性能
AIxiv专栏是AI在线发布学术、技术内容的栏目。过去数年，AI在线AIxiv专栏接收报道了2000多篇内容，覆盖全球各大高校与企业的顶级实验室，有效促进了学术交流与传播。如果您有优秀的工作想要分享，欢迎投稿或者联系报道。
工程
- 5
- 0
机器之心10月12日
NeurIPS 2024｜SparseLLM：突破性全局剪枝技术，大语言模型稀疏化革命
AIxiv专栏是AI在线发布学术、技术内容的栏目。过去数年，AI在线AIxiv专栏接收报道了2000多篇内容，覆盖全球各大高校与企业的顶级实验室，有效促进了学术交流与传播。如果您有优秀的工作想要分享，欢迎投稿或者联系报道。投稿邮箱：[email protected]；[email protected]本篇工作已被NeurIPS（2024 Conference on N…
工程
- 8
- 0
机器之心10月10日
综合RLHF、DPO、KTO优势，统一对齐框架UNA来了
AIxiv专栏是AI在线发布学术、技术内容的栏目。过去数年，AI在线AIxiv专栏接收报道了2000多篇内容，覆盖全球各大高校与企业的顶级实验室，有效促进了学术交流与传播。如果您有优秀的工作想要分享，欢迎投稿或者联系报道。投稿邮箱：[email protected]；[email protected]论文主要作者：1. 王智超：本科就读于厦门大学土木工程系，研究生博士…
工程
- 6
- 0
机器之心10月9日
Yann LeCun说自回归要完，但DeepMind这篇论文却证明自回归能实现通用计算
毫无疑问，现在可说是自回归大型语言模型（LLM）的时代，我们看到技术迭代，我们也看到应用频出，但即便如此，也依然有人表示不看好。唱衰自回归范式的最著名人物应当是 Yann LeCun 无疑了。他甚至还曾给出过一个相当大胆的判断：「从现在起 5 年内，没有哪个头脑正常的人会使用自回归模型。」详见AI在线报道《GPT-4 的研究路径没有前途？Yann LeCun 给自回归判了死刑》。 …
工程
- 5
- 0
机器之心10月8日
揭秘提示词压缩技术
提示工程是一种在机器学习模型，尤其是预训练语言模型中，通过精心设计输入提示（prompt）来引导模型输出期望结果的技术。在大语言模型的使用中，提示词通常是一段文本，用来引导模型生成特定的输出或完成特定的任务。在多文档搜索、问答系统、文档自动摘要生成以及阅读理解等多样化且复杂的应用场景中，往往会面临输入提示（prompt）长度显著增加的挑战。这种超长prompt不仅加大了大型语言模型（LLM）的推理…
工程
- 7
- 0
机器之心10月8日
机械手「成精」了，能从手臂上溜走，拿完够不到的东西，还能爬回来自动合体
机器之心报道，编辑：佳琪。
工程
- 5
- 0
机器之心10月7日
Cursor创始团队最新访谈：如果Github整合o1，Cursor可能要倒闭了
机器之心报道，编辑：佳琪、蛋酱。
工程
- 4
- 0
机器之心10月7日
Python程序到计算图一键转化，详解清华开源深度学习编译器MagPy
AIxiv专栏是AI在线发布学术、技术内容的栏目。过去数年，AI在线AIxiv专栏接收报道了2000多篇内容，覆盖全球各大高校与企业的顶级实验室，有效促进了学术交流与传播。如果您有优秀的工作想要分享，欢迎投稿或者联系报道。投稿邮箱：[email protected]；[email protected]张晨，清华大学计算机系高性能所博士生，导师为翟季冬老师，主要研究方向…
工程
- 6
- 0
机器之心10月6日
ECCV 2024 | 像ChatGPT一样，聊聊天就能实现三维场景编辑
AIxiv专栏是AI在线发布学术、技术内容的栏目。过去数年，AI在线AIxiv专栏接收报道了2000多篇内容，覆盖全球各大高校与企业的顶级实验室，有效促进了学术交流与传播。如果您有优秀的工作想要分享，欢迎投稿或者联系报道。投稿邮箱：[email protected]；[email protected]论文《Chat Edit 3D: Interactive 3D Sc…
工程
- 6
- 0
机器之心10月5日
单目三维检测实时泛化，纯视觉自动驾驶鲁棒感知方法入选ECCV 2024
AIxiv专栏是AI在线发布学术、技术内容的栏目。过去数年，AI在线AIxiv专栏接收报道了2000多篇内容，覆盖全球各大高校与企业的顶级实验室，有效促进了学术交流与传播。如果您有优秀的工作想要分享，欢迎投稿或者联系报道。投稿邮箱：[email protected]；[email protected]论文第一作者林宏彬来自香港中文大学 (深圳) Deep Bit 实验…
工程
- 9
- 0
机器之心10月3日
ECCV2024 Oral | 第一视角下的动作图像生成，Meta等提出LEGO模型
AIxiv专栏是AI在线发布学术、技术内容的栏目。过去数年，AI在线AIxiv专栏接收报道了2000多篇内容，覆盖全球各大高校与企业的顶级实验室，有效促进了学术交流与传播。如果您有优秀的工作想要分享，欢迎投稿或者联系报道。投稿邮箱：[email protected]；[email protected]本文的作者主要来自于 Meta 和佐治亚理工大学。第一作者是佐治亚理…
工程
- 6
- 0
机器之心10月2日
280页PDF，全方位评估OpenAI o1，Leetcode刷题准确率竟这么高
OpenAI 的 o1-preview 模型已经发布两周了，网上也有了很多零星的测评。不过，大部分测评都侧重于某一个方面，对于 o1-preview 的系统评估目前还比较匮乏。在一篇长达 280 页的论文中，来自加拿大阿尔伯塔大学等机构的研究者报告了他们对 o1-preview 的系统评估结果，非常具有参考价值。论文标题：Evaluation of OpenAI o1: Opportunities…
工程
- 19
- 0
机器之心10月1日
从数据增强的隐藏作用出发，揭示视觉强化学习可塑性损失的独特机制
AIxiv专栏是AI在线发布学术、技术内容的栏目。过去数年，AI在线AIxiv专栏接收报道了2000多篇内容，覆盖全球各大高校与企业的顶级实验室，有效促进了学术交流与传播。如果您有优秀的工作想要分享，欢迎投稿或者联系报道。投稿邮箱：[email protected]；[email protected] 等研究人员近期在《Nature》上发表的研究《Loss…
工程
- 7
- 0
机器之心9月28日
形式化定理证明新突破：SubgoalXL框架让大模型在Isabelle中性能暴涨
AIxiv专栏是AI在线发布学术、技术内容的栏目。过去数年，AI在线AIxiv专栏接收报道了2000多篇内容，覆盖全球各大高校与企业的顶级实验室，有效促进了学术交流与传播。如果您有优秀的工作想要分享，欢迎投稿或者联系报道。投稿邮箱：[email protected]；[email protected]本文第一作者为香港大学博士研究生赵学亮，主要研究方向为形式化数学定理…
工程
- 5
- 0
机器之心9月27日
用大模型优化大模型预训练数据，节省20倍计算量，实现显著性能提升！
AIxiv专栏是AI在线发布学术、技术内容的栏目。过去数年，AI在线AIxiv专栏接收报道了2000多篇内容，覆盖全球各大高校与企业的顶级实验室，有效促进了学术交流与传播。如果您有优秀的工作想要分享，欢迎投稿或者联系报道。投稿邮箱：[email protected]；[email protected]生成式人工智能研究实验室（GAIR，主页：）是国内首个聚焦于生成式人…
工程
- 8
- 0
机器之心9月27日
自动化机器学习研究MLR-Copilot：利用大型语言模型进行研究加速
AIxiv专栏是AI在线发布学术、技术内容的栏目。过去数年，AI在线AIxiv专栏接收报道了2000多篇内容，覆盖全球各大高校与企业的顶级实验室，有效促进了学术交流与传播。如果您有优秀的工作想要分享，欢迎投稿或者联系报道。投稿邮箱：[email protected]；[email protected]该论文的第一作者及指导作者均来自德克萨斯大学达拉斯分校，第一作者为博…
工程
- 6
- 0
机器之心9月25日
AI会「说谎」，RLHF竟是帮凶
虽然 RLHF 的初衷是用来控制人工智能（AI），但实际上它可能会帮助 AI 欺骗人类。语言模型 (LM) 可能会产生人类难以察觉的错误，尤其是在任务复杂的情况下。作为最近流行的后训练方法 RLHF ，可能会加剧这个问题：为了获得更高的奖励，LM 可能会更好地说服人类认为它们是正确的，即使它们是错误的。这对人类评估者来说是一个巨大的挑战，因为人类想要发现 LM 输出中那些似乎正确的细微错误非常困难…
工程
- 2
- 0
机器之心9月23日
OpenAI前研究者发布提示词工程框架ell，升级版LangChain，支持版本控制和多模态
LLM 喜欢赞美，如果你在提示词中夸奖它是个「才华横溢的专家（genius expert）」，它就更可能为你生成更好的答案。当然，OpenAI 的这位前研究科学家 William H. Guss 分享的这个技巧并不是新闻，之前就有不少研究者发现 AI 喜欢鼓励和赞美。刚不久前，Huss 宣布发布了一款自称是「提示词工程的未来」工具 ell。具体来说，ell 是一款轻量级的函数式语言模型编程软件库，…
工程
- 17
- 0
机器之心9月21日
从架构、工艺到能效表现，全面了解LLM硬件加速，这篇综述就够了
大语言模型（LLM）的发展同时往往伴随着硬件加速技术的进化，本文对使用 FPGA、ASIC 等芯片的模型性能、能效表现来了一次全面概览。对人类语言进行大规模建模是一个复杂的过程，研究人员花了几十年的时间才开发出来。这项技术最早可追溯于 1950 年，当时克劳德・香农将信息理论应用于人类语言。从那时起，翻译和语音识别等任务取得了长足的进步。在这个过程中，人工智能 (AI) 和机器学习 (ML) 是技…
工程
- 5
- 0
机器之心9月20日
KAN结合Transformer，真有团队搞出了解决扩展缺陷的KAT
Transformer 是现代深度学习的基石。传统上，Transformer 依赖多层感知器 (MLP) 层来混合通道之间的信息。前段时间，来自 MIT 等机构的研究者提出了一种非常有潜力的替代方法 ——KAN。该方法在准确性和可解释性方面表现优于 MLP。而且，它能以非常少的参数量胜过以更大参数量运行的 MLP。KAN的发布，引起了AI社区大量的关注与讨论，同时也伴随很大的争议。而此类研究，又…
工程
- 4
- 0
机器之心9月19日