北大林宙辰团队全新混合序列建模架构MixCon:性能远超Mamba
AIxiv专栏是AI在线发布学术、技术内容的栏目。过去数年,AI在线AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。- 1
- 0
六年、六届学生接力,共铸上交大图像合成工具箱libcom
arXiv:2106.14490v5如果你对 arXiv 的版本号有所了解,你就知道这篇论文已经更新了 4 次,现在已经来到了第 5 个版本。实际上,这个 arXiv 编号属于上海交通大学牛力团队一篇持续更新了四年的综述报告。 该综述介绍了图像合成(image composition)领域需要解决的问题和应运而生的子任务,总结了各个子任务的数据集、传统方法、深度学习方法和实验现象,从鸿蒙初辟写到尘…- 6
- 0
李飞飞:不要数字孪生,要数字表兄弟,一张照片生成机器人训练场景
不百分百还原出虚拟场景,效果反而更好。我们很多人都听说过数字孪生(digital twin),在英伟达等公司的大力推动下,这种高效运营工作流程的方法已经在很多工业场景中得到应用。但你听说过数字表亲(digital cousin)吗?- 14
- 0
NeurIPS 2024 | Transformer长度外推,全新位置编码DAPE大幅提升模型性能
AIxiv专栏是AI在线发布学术、技术内容的栏目。过去数年,AI在线AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。- 5
- 0
NeurIPS 2024|SparseLLM:突破性全局剪枝技术,大语言模型稀疏化革命
AIxiv专栏是AI在线发布学术、技术内容的栏目。过去数年,AI在线AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。投稿邮箱:[email protected];[email protected]本篇工作已被NeurIPS(2024 Conference on N…- 8
- 0
综合RLHF、DPO、KTO优势,统一对齐框架UNA来了
AIxiv专栏是AI在线发布学术、技术内容的栏目。过去数年,AI在线AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。投稿邮箱:[email protected];[email protected]论文主要作者:1. 王智超:本科就读于厦门大学土木工程系,研究生博士…- 6
- 0
Yann LeCun说自回归要完,但DeepMind这篇论文却证明自回归能实现通用计算
毫无疑问,现在可说是自回归大型语言模型(LLM)的时代,我们看到技术迭代,我们也看到应用频出,但即便如此,也依然有人表示不看好。唱衰自回归范式的最著名人物应当是 Yann LeCun 无疑了。他甚至还曾给出过一个相当大胆的判断:「从现在起 5 年内,没有哪个头脑正常的人会使用自回归模型。」详见AI在线报道《GPT-4 的研究路径没有前途?Yann LeCun 给自回归判了死刑》。 …- 5
- 0
Python程序到计算图一键转化,详解清华开源深度学习编译器MagPy
AIxiv专栏是AI在线发布学术、技术内容的栏目。过去数年,AI在线AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。投稿邮箱:[email protected];[email protected]张晨,清华大学计算机系高性能所博士生,导师为翟季冬老师,主要研究方向…- 6
- 0
ECCV 2024 | 像ChatGPT一样,聊聊天就能实现三维场景编辑
AIxiv专栏是AI在线发布学术、技术内容的栏目。过去数年,AI在线AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。投稿邮箱:[email protected];[email protected]论文《Chat Edit 3D: Interactive 3D Sc…- 6
- 0
单目三维检测实时泛化,纯视觉自动驾驶鲁棒感知方法入选ECCV 2024
AIxiv专栏是AI在线发布学术、技术内容的栏目。过去数年,AI在线AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。投稿邮箱:[email protected];[email protected]论文第一作者林宏彬来自香港中文大学 (深圳) Deep Bit 实验…- 9
- 0
ECCV2024 Oral | 第一视角下的动作图像生成,Meta等提出LEGO模型
AIxiv专栏是AI在线发布学术、技术内容的栏目。过去数年,AI在线AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。投稿邮箱:[email protected];[email protected]本文的作者主要来自于 Meta 和佐治亚理工大学。第一作者是佐治亚理…- 6
- 0
280页PDF,全方位评估OpenAI o1,Leetcode刷题准确率竟这么高
OpenAI 的 o1-preview 模型已经发布两周了,网上也有了很多零星的测评。不过,大部分测评都侧重于某一个方面,对于 o1-preview 的系统评估目前还比较匮乏。在一篇长达 280 页的论文中,来自加拿大阿尔伯塔大学等机构的研究者报告了他们对 o1-preview 的系统评估结果,非常具有参考价值。论文标题:Evaluation of OpenAI o1: Opportunities…- 19
- 0
从数据增强的隐藏作用出发,揭示视觉强化学习可塑性损失的独特机制
AIxiv专栏是AI在线发布学术、技术内容的栏目。过去数年,AI在线AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。投稿邮箱:[email protected];[email protected] 等研究人员近期在《Nature》上发表的研究《Loss…- 7
- 0
形式化定理证明新突破:SubgoalXL框架让大模型在Isabelle中性能暴涨
AIxiv专栏是AI在线发布学术、技术内容的栏目。过去数年,AI在线AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。投稿邮箱:[email protected];[email protected]本文第一作者为香港大学博士研究生赵学亮,主要研究方向为形式化数学定理…- 5
- 0
用大模型优化大模型预训练数据,节省20倍计算量,实现显著性能提升!
AIxiv专栏是AI在线发布学术、技术内容的栏目。过去数年,AI在线AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。投稿邮箱:[email protected];[email protected]生成式人工智能研究实验室(GAIR,主页:)是国内首个聚焦于生成式人…- 8
- 0
自动化机器学习研究MLR-Copilot:利用大型语言模型进行研究加速
AIxiv专栏是AI在线发布学术、技术内容的栏目。过去数年,AI在线AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。投稿邮箱:[email protected];[email protected]该论文的第一作者及指导作者均来自德克萨斯大学达拉斯分校,第一作者为博…- 6
- 0
AI会「说谎」,RLHF竟是帮凶
虽然 RLHF 的初衷是用来控制人工智能(AI),但实际上它可能会帮助 AI 欺骗人类。语言模型 (LM) 可能会产生人类难以察觉的错误,尤其是在任务复杂的情况下。作为最近流行的后训练方法 RLHF ,可能会加剧这个问题:为了获得更高的奖励,LM 可能会更好地说服人类认为它们是正确的,即使它们是错误的。这对人类评估者来说是一个巨大的挑战,因为人类想要发现 LM 输出中那些似乎正确的细微错误非常困难…- 2
- 0
OpenAI前研究者发布提示词工程框架ell,升级版LangChain,支持版本控制和多模态
LLM 喜欢赞美,如果你在提示词中夸奖它是个「才华横溢的专家(genius expert)」,它就更可能为你生成更好的答案。当然,OpenAI 的这位前研究科学家 William H. Guss 分享的这个技巧并不是新闻,之前就有不少研究者发现 AI 喜欢鼓励和赞美。刚不久前,Huss 宣布发布了一款自称是「提示词工程的未来」工具 ell。具体来说,ell 是一款轻量级的函数式语言模型编程软件库,…- 17
- 0
从架构、工艺到能效表现,全面了解LLM硬件加速,这篇综述就够了
大语言模型(LLM)的发展同时往往伴随着硬件加速技术的进化,本文对使用 FPGA、ASIC 等芯片的模型性能、能效表现来了一次全面概览。对人类语言进行大规模建模是一个复杂的过程,研究人员花了几十年的时间才开发出来。这项技术最早可追溯于 1950 年,当时克劳德・香农将信息理论应用于人类语言。从那时起,翻译和语音识别等任务取得了长足的进步。在这个过程中,人工智能 (AI) 和机器学习 (ML) 是技…- 5
- 0
KAN结合Transformer,真有团队搞出了解决扩展缺陷的KAT
Transformer 是现代深度学习的基石。传统上,Transformer 依赖多层感知器 (MLP) 层来混合通道之间的信息。 前段时间,来自 MIT 等机构的研究者提出了一种非常有潜力的替代方法 ——KAN。该方法在准确性和可解释性方面表现优于 MLP。而且,它能以非常少的参数量胜过以更大参数量运行的 MLP。KAN的发布,引起了AI社区大量的关注与讨论,同时也伴随很大的争议。而此类研究,又…- 4
- 0
工程
❯
个人中心
今日签到
搜索
扫码打开当前页
返回顶部
幸运之星正在降临...
点击领取今天的签到奖励!
恭喜!您今天获得了{{mission.data.mission.credit}}积分
我的优惠劵
- ¥优惠劵使用时效:无法使用使用时效:
之前
使用时效:永久有效优惠劵ID:×
没有优惠劵可用!