工程

将图象自动文本化，图象形貌质量更高、更准确了
AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年，机器之心AIxiv专栏接收报道了2000多篇内容，覆盖全球各大高校与企业的顶级实验室，有效促进了学术交流与传播。如果您有优秀的工作想要分享，欢迎投稿或者联系报道。投稿邮箱：[email protected]；[email protected]皮仁杰：香港科技大学博士三年级学生，师从张潼教授和周晓方教授。于 2…
工程
- 37
- 0
机器之心6月28日
字节跳动公布“豆包MarsCode”智能开发工具，面向国内开发者免费
6 月 26 日，字节跳动在北京公布了基于豆包大模型打造的智能开发工具 - 豆包MarsCode ，面向国内开发者免费开放。
工程
- 12
- 0
机器之心6月26日
ICML 2024 | 旗号表征指数级强、内存节省超35%，量子隐式表征搜集来了
AIxiv专栏是机械之心发布学术、技术内容的栏目。过去数年，机械之心AIxiv专栏接收报道了2000多篇内容，覆盖全球各大高校与企业的顶级实验室，有效促进了学术交流与传播。如果您有优秀的工作想要分享，欢迎投稿或者联系报道。投稿邮箱：[email protected]；[email protected]本文作者是天津大学智能与计算学部张鹏教授及其硕士生赵佳铭，博士生乔文…
工程
- 6
- 0
机器之心6月26日
昆仑万维携手南洋理工大学抢发Q*算法：百倍晋升7B模型推理才能
AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年，机器之心AIxiv专栏接收报道了2000多篇内容，覆盖全球各大高校与企业的顶级实验室，有效促进了学术交流与传播。如果您有优秀的工作想要分享，欢迎投稿或者联系报道。投稿邮箱：[email protected]；[email protected]自 OpenAI 的 Q* 项目曝光后，引发业内众多讨论。据现有信息…
工程
- 6
- 0
机器之心6月25日
太全了！苹果上新视觉模型4M-21，搞定21种模态
当前的多模态和多恣意基础模型，如 4M 或 UnifiedIO，显示出有希望的结果。然而，它们接受分歧输入和施行分歧恣意的开箱即用能力，受到它们接受训练的模态和恣意的数量（通常很少）的限制。基于此，来自洛桑联邦理工学院（EPFL）和苹果的研讨者联合开发了一个恣意到恣意模态单一模型，该模型在数十种高度多样化的模态上进行训练，并对大规模多模态数据集和文本语料库进行协同训练。训练过程中一个关键步骤是对各…
工程
- 22
- 0
机器之心6月25日
奥林匹克竞赛里选最聪明的AI：Claude-3.5-Sonnet vs. GPT-4o？
AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年，机器之心AIxiv专栏接收报道了2000多篇内容，覆盖全球各大高校与企业的顶级实验室，有效促进了学术交流与传播。如果您有优秀的工作想要分享，欢迎投稿或者联系报道。投稿邮箱：[email protected]；[email protected]上海交通大学生成式人工智能实验室 (GAIR Lab) 的研讨团队，…
工程
- 18
- 0
机器之心6月24日
从RLHF到DPO再到TDPO，大模型对齐算法已经是「token-level」
AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年，机器之心AIxiv专栏接收报道了2000多篇内容，覆盖全球各大高校与企业的顶级尝试室，有效促进了学术交流与传播。如果您有优秀的工作想要分享，欢迎投稿或者联系报道。投稿邮箱：[email protected]；[email protected]在人工智能领域的发展进程中，对大语言模型（LLM）的管制与指导始终是…
工程
- 26
- 0
机器之心6月24日
CVPR 24｜ETH Zurich等团队：重新定义小样本3D分割工作，新基准开启广阔提升潜力！
AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年，机器之心AIxiv专栏接收报道了2000多篇内容，覆盖全球各大高校与企业的顶级实验室，有效促进了学术交流与传播。如果您有优秀的工作想要分享，欢迎投稿或者联系报道。投稿邮箱：[email protected]；[email protected]该文章的第一作者安照崇，目前在哥本哈根大学攻读博士学位，导师为Ser…
工程
- 9
- 0
机器之心6月24日
导师爆料：这篇CVPR最好学生论文，从设法主意到成稿只用一个月，源自业余灵感
按部就班 vs. 好奇心驱动，哪个更容易出钻研成果？ CVPR 2024 的最好学生论文，竟然是用一个月的时间写出来的。北京时间 6 月 20 日凌晨，CVPR 2024 正式公布了最好论文、最好学生论文等奖项。其中，获得最好论文的有两篇文章 ——BioCLIP 和 Mip-Splatting。据 Mip-Splatting 论文一作 Zehao Yu 的导师、图宾根大学教授 Andreas G…
工程
- 7
- 0
机器之心6月24日
字节豆包全新图象Tokenizer：生成图象最低只需32个token，最高提速410倍
AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年，机器之心AIxiv专栏接收报道了2000多篇内容，覆盖全球各大高校与企业的顶级实验室，有效促进了学术交流与传播。如果您有优秀的工作想要分享，欢迎投稿或者联系报道。投稿邮箱：[email protected]；[email protected] 在生成式模型的迅速发展中，Image Tokenization 扮…
工程
- 7
- 0
机器之心6月24日
不做数值运算、纯靠嘴炮也能机械进修？鉴于自然语言的全新ML范式来了
AIxiv专栏是机械之心发布学术、技术内容的栏目。过去数年，机械之心AIxiv专栏接收报道了2000多篇内容，覆盖全球各大高校与企业的顶级实验室，有效促进了学术交流与传播。如果您有优秀的工作想要分享，欢迎投稿或者联系报道。投稿邮箱：[email protected]；[email protected]本文作者肖镇中是德国马克思普朗克-智能系统研究所和图宾根大学的博士生…
工程
- 5
- 0
机器之心6月21日
从高考到奥林匹克竞技场：大模型与人类智能的终极较量
AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年，机器之心AIxiv专栏接收报道了2000多篇内容，覆盖全球各大高校与企业的顶级实验室，有效促进了学术交流与传播。如果您有优秀的工作想要分享，欢迎投稿或者联系报道。投稿邮箱：[email protected]；[email protected]上海交通大学生成式人工智能实验室 (GAIR Lab) 的研讨团队，…
工程
- 5
- 0
机器之心6月20日
ShareGPT4V作者团队又一力作！百万高质量视频-字幕数据助力社区提升多模态大模型视频懂得及生成能力
AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年，机器之心AIxiv专栏接收报道了2000多篇内容，覆盖全球各大高校与企业的顶级实验室，有效促进了学术交流与传播。如果您有优秀的工作想要分享，欢迎投稿或者联系报道。投稿邮箱：[email protected]；[email protected]继Sora官宣之后，多模态大模型在视频生成方面的应用简直就像井喷一样…
工程
- 7
- 0
机器之心6月20日
ICLR 2024 Oral | 应对随时候变化的分散偏移，西安大略大学等提出学习时序轨迹要领
AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年，机器之心AIxiv专栏接收报道了2000多篇内容，覆盖全球各大高校与企业的顶级实验室，有效促进了学术交流与传播。如果您有优秀的工作想要分享，欢迎投稿或者联系报道。投稿邮箱：[email protected]；[email protected]本文作者曾秋皓，加拿大西安大略大学计算机系博士研究生，本科毕业于哈尔…
工程
- 9
- 0
机器之心6月19日
大模型压缩量化方案怎么选？无问芯穹Qllm-Eval量化方案全面评价：多模型、多参数、多维度
基于 Transformer架构的大型语言模型在各种基准尝试中展现出优异功能，但数百亿、千亿乃至万亿量级的参数规模会带来高昂的服务成本。例如GPT-3有1750亿参数，采用FP16保存，模型大小约为350GB，而即使是英伟达最新的B200 GPU 内存也只有192GB ，更不用说其他GPU和边缘设备。大模型压缩，即将大模型“瘦身”后塞进资源受限的场景，以减少模型保存、访存和计算支出。在尽量不损失模…
工程
- 5
- 0
机器之心6月18日
清华等高校推出首个开源大模型水印工具包MarkLLM，支持近10种最新水印算法
AIxiv专栏是机器之心发布学术、技能内容的栏目。过去数年，机器之心AIxiv专栏接收报道了2000多篇内容，覆盖全球各大高校与企业的顶级实验室，有效促进了学术交流与传播。如果您有优秀的工作想要分享，接待投稿或者联系报道。投稿邮箱：[email protected]；[email protected]本文由清华大学、上海交通大学、悉尼大学、UCSB、香港中文大学、香港…
工程
- 5
- 0
机器之心6月18日
大模型+蒙特卡洛树搜寻，一招让LLaMa-3 8B奥数水平直逼GPT-4
通过算法层面的创新，未来大语言模型做数学题的水平会不断地提高。这几天，17 岁中专生姜萍在 2024 阿里巴巴全球数学竞赛预选赛中取得全球第 12 名的新闻刷了屏。而同时，AI 挑战赛的成绩显示，在一起 563 支 AI 参赛队伍中，最高分 34 分，平均分 18 分，赶上了人类选手平均水平。AI 参与数学竞赛的主要短板是逻辑推理能力弱，证明题很难拿到完整得分点。这也是 GPT-4、LLaMA 等…
工程
- 8
- 0
机器之心6月17日
字节豆包、武大提出 CAL：通过视觉相干的 token 增强多模态对齐效果
AIxiv专栏是机器之心发布学术、技术实质的栏目。过去数年，机器之心AIxiv专栏接收报道了2000多篇实质，覆盖全球各大高校与企业的顶级实验室，有效促进了学术交流与传播。如果您有优秀的工作想要分享，欢迎投稿或者联系报道。投稿邮箱：[email protected]；[email protected]当前主流的视觉说话模型（VLM）主要鉴于大说话模型（LLM）进一步微…
工程
- 9
- 0
机器之心6月17日
谜底抽取正确率达96.88%，xFinder断了大模型「作弊」的小心思
AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年，机器之心AIxiv专栏接收报道了2000多篇内容，覆盖全球各大高校与企业的顶级实行室，有效促进了学术交流与传播。如果您有优秀的工作想要分享，欢迎投稿或者联系报道。投稿邮箱：[email protected]；[email protected]本文第一作者和通讯作者均来自上海算法创新研究院。其中，通讯作者李志宇…
工程
- 8
- 0
机器之心6月17日
ACL 2024论文盖棺定论：大语言模型≠全国模仿器，Yann LeCun：太对了
如果 GPT-4 在模仿基于常识义务的状况变化时准确率都只有约 60%，那么我们还要考虑将大语言模型作为全国模仿器来使用吗？最近两天，一篇入选 ACL 2024 的论文《Can Language Models Serve as Text-Based World Simulators?》在社交媒体 X 上引发了热议，就连图灵奖得主 Yann LeCun 也参与了进来。这篇论文探讨的问题是：当前语言模…
工程
- 18
- 0
机器之心6月16日
改变保守，吴恩达开源了一个机器翻译智能体项目
吴恩达：拜托了大家，一起让翻译智能体变得更好。前段时间，随着 GPT-4o、Sora 的陆续问世，多模态模型在生成式方面取得的成绩无可否认，而人工智能的下一个革命性突破将从何处涌现，引起了大量学者和相关人士的关注。人工智能著名学者、斯坦福大学教授吴恩达一直非常推崇智能体。此前他曾在个人博客着重指出「AI 智能体职业流将会在今年推动人工智能取得长足进步」，AI 智能体的未来潜力愈加被看好，吸睛无数。…
工程
- 91
- 0
机器之心6月13日
用神经架构搜寻给LLM瘦身，模型变小，准确度有时反而更高
用神经架构搜寻给 LLM 瘦身，同等准确度可让 LLaMA2-7B 模型巨细降 2 倍。大型语言模型（LLM）的一个主要特点是「大」，也因此其训练和部署成本都相当高，如何在保证 LLM 准确度的同时让其变小就成了非常重要且有价值的研究课题。对此，研究社区已经提出了多种多样的方式，比如剪枝、稀疏化、量化等，它们的效果也各不一样。近日，Intel Labs 发布了一项研究成果，宣称可应用神经架构搜寻（…
工程
- 5
- 0
机器之心6月11日
i人小助手：Meta推出多模态对话图，帮你轻松鉴别交际状态
AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年，机器之心AIxiv专栏接收报道了2000多篇内容，覆盖全球各大高校与企业的顶级实行室，有效促进了学术交流与传播。如果您有优秀的工作想要分享，欢迎投稿或者联系报道。投稿邮箱：[email protected]；[email protected]本文通讯作者为佐治亚理工学院计算机系博士生 Wenqi Jia（秋季…
工程
- 5
- 0
机器之心6月11日
从LLM中完全消除矩阵乘法，效果出奇得好，10亿参数跑在FPGA上接近大脑功耗
让谈话模型「轻装上阵」。一直以来，矩阵乘法（MatMul）稳居神经网络操纵的主导地位，其中很大原因归结为 GPU 专门针对 MatMul 操纵进行了优化。这种优化使得 AlexNet 在 ILSVRC2012 挑战赛中一举胜出，成为深度进修崛起的历史性标志。在这当中，有个值得注意的点是，AlexNet 利用 GPU 来提高训练速度，超越了 CPU 的能力，至此，GPU 的加入使得深度进修仿佛赢得了…
工程
- 25
- 0
机器之心6月11日