将图象自动文本化,图象形貌质量更高、更准确了
AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。投稿邮箱:[email protected];[email protected]皮仁杰:香港科技大学博士三年级学生,师从张潼教授和周晓方教授。于 2…- 37
- 0
字节跳动公布“豆包MarsCode”智能开发工具,面向国内开发者免费
6 月 26 日,字节跳动在北京公布了基于豆包大模型打造的智能开发工具 - 豆包MarsCode ,面向国内开发者免费开放。- 12
- 0
ICML 2024 | 旗号表征指数级强、内存节省超35%,量子隐式表征搜集来了
AIxiv专栏是机械之心发布学术、技术内容的栏目。过去数年,机械之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。投稿邮箱:[email protected];[email protected]本文作者是天津大学智能与计算学部张鹏教授及其硕士生赵佳铭,博士生乔文…- 6
- 0
昆仑万维携手南洋理工大学抢发Q*算法:百倍晋升7B模型推理才能
AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。投稿邮箱:[email protected];[email protected]自 OpenAI 的 Q* 项目曝光后,引发业内众多讨论。据现有信息…- 6
- 0
太全了!苹果上新视觉模型4M-21,搞定21种模态
当前的多模态和多恣意基础模型,如 4M 或 UnifiedIO,显示出有希望的结果。然而,它们接受分歧输入和施行分歧恣意的开箱即用能力,受到它们接受训练的模态和恣意的数量(通常很少)的限制。基于此,来自洛桑联邦理工学院(EPFL)和苹果的研讨者联合开发了一个恣意到恣意模态单一模型,该模型在数十种高度多样化的模态上进行训练,并对大规模多模态数据集和文本语料库进行协同训练。训练过程中一个关键步骤是对各…- 22
- 0
奥林匹克竞赛里选最聪明的AI:Claude-3.5-Sonnet vs. GPT-4o?
AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。投稿邮箱:[email protected];[email protected]上海交通大学生成式人工智能实验室 (GAIR Lab) 的研讨团队,…- 18
- 0
从RLHF到DPO再到TDPO,大模型对齐算法已经是「token-level」
AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级尝试室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。投稿邮箱:[email protected];[email protected]在人工智能领域的发展进程中,对大语言模型(LLM)的管制与指导始终是…- 26
- 0
CVPR 24|ETH Zurich等团队:重新定义小样本3D分割工作,新基准开启广阔提升潜力!
AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。投稿邮箱:[email protected];[email protected]该文章的第一作者安照崇,目前在哥本哈根大学攻读博士学位,导师为Ser…- 9
- 0
导师爆料:这篇CVPR最好学生论文,从设法主意到成稿只用一个月,源自业余灵感
按部就班 vs. 好奇心驱动,哪个更容易出钻研成果? CVPR 2024 的最好学生论文,竟然是用一个月的时间写出来的。北京时间 6 月 20 日凌晨,CVPR 2024 正式公布了最好论文、最好学生论文等奖项。其中,获得最好论文的有两篇文章 ——BioCLIP 和 Mip-Splatting。据 Mip-Splatting 论文一作 Zehao Yu 的导师、图宾根大学教授 Andreas G…- 7
- 0
字节豆包全新图象Tokenizer:生成图象最低只需32个token,最高提速410倍
AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。投稿邮箱:[email protected];[email protected] 在生成式模型的迅速发展中,Image Tokenization 扮…- 7
- 0
不做数值运算、纯靠嘴炮也能机械进修?鉴于自然语言的全新ML范式来了
AIxiv专栏是机械之心发布学术、技术内容的栏目。过去数年,机械之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。投稿邮箱:[email protected];[email protected]本文作者肖镇中是德国马克思普朗克-智能系统研究所和图宾根大学的博士生…- 5
- 0
从高考到奥林匹克竞技场:大模型与人类智能的终极较量
AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。投稿邮箱:[email protected];[email protected]上海交通大学生成式人工智能实验室 (GAIR Lab) 的研讨团队,…- 5
- 0
ShareGPT4V作者团队又一力作!百万高质量视频-字幕数据助力社区提升多模态大模型视频懂得及生成能力
AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。投稿邮箱:[email protected];[email protected]继Sora官宣之后,多模态大模型在视频生成方面的应用简直就像井喷一样…- 7
- 0
ICLR 2024 Oral | 应对随时候变化的分散偏移,西安大略大学等提出学习时序轨迹要领
AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。投稿邮箱:[email protected];[email protected]本文作者曾秋皓,加拿大西安大略大学计算机系博士研究生,本科毕业于哈尔…- 9
- 0
大模型压缩量化方案怎么选?无问芯穹Qllm-Eval量化方案全面评价:多模型、多参数、多维度
基于 Transformer架构的大型语言模型在各种基准尝试中展现出优异功能,但数百亿、千亿乃至万亿量级的参数规模会带来高昂的服务成本。例如GPT-3有1750亿参数,采用FP16保存,模型大小约为350GB,而即使是英伟达最新的B200 GPU 内存也只有192GB ,更不用说其他GPU和边缘设备。大模型压缩,即将大模型“瘦身”后塞进资源受限的场景,以减少模型保存、访存和计算支出。在尽量不损失模…- 5
- 0
清华等高校推出首个开源大模型水印工具包MarkLLM,支持近10种最新水印算法
AIxiv专栏是机器之心发布学术、技能内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,接待投稿或者联系报道。投稿邮箱:[email protected];[email protected]本文由清华大学、上海交通大学、悉尼大学、UCSB、香港中文大学、香港…- 5
- 0
大模型+蒙特卡洛树搜寻,一招让LLaMa-3 8B奥数水平直逼GPT-4
通过算法层面的创新,未来大语言模型做数学题的水平会不断地提高。这几天,17 岁中专生姜萍在 2024 阿里巴巴全球数学竞赛预选赛中取得全球第 12 名的新闻刷了屏。而同时,AI 挑战赛的成绩显示,在一起 563 支 AI 参赛队伍中,最高分 34 分,平均分 18 分,赶上了人类选手平均水平。AI 参与数学竞赛的主要短板是逻辑推理能力弱,证明题很难拿到完整得分点。这也是 GPT-4、LLaMA 等…- 8
- 0
字节豆包、武大提出 CAL:通过视觉相干的 token 增强多模态对齐效果
AIxiv专栏是机器之心发布学术、技术实质的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇实质,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。投稿邮箱:[email protected];[email protected]当前主流的视觉说话模型(VLM)主要鉴于大说话模型(LLM)进一步微…- 9
- 0
谜底抽取正确率达96.88%,xFinder断了大模型「作弊」的小心思
AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实行室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。投稿邮箱:[email protected];[email protected]本文第一作者和通讯作者均来自上海算法创新研究院。其中,通讯作者李志宇…- 8
- 0
ACL 2024论文盖棺定论:大语言模型≠全国模仿器,Yann LeCun:太对了
如果 GPT-4 在模仿基于常识义务的状况变化时准确率都只有约 60%,那么我们还要考虑将大语言模型作为全国模仿器来使用吗?最近两天,一篇入选 ACL 2024 的论文《Can Language Models Serve as Text-Based World Simulators?》在社交媒体 X 上引发了热议,就连图灵奖得主 Yann LeCun 也参与了进来。这篇论文探讨的问题是:当前语言模…- 18
- 0
改变保守,吴恩达开源了一个机器翻译智能体项目
吴恩达:拜托了大家,一起让翻译智能体变得更好。前段时间,随着 GPT-4o、Sora 的陆续问世,多模态模型在生成式方面取得的成绩无可否认,而人工智能的下一个革命性突破将从何处涌现,引起了大量学者和相关人士的关注。人工智能著名学者、斯坦福大学教授吴恩达一直非常推崇智能体。此前他曾在个人博客着重指出「AI 智能体职业流将会在今年推动人工智能取得长足进步」,AI 智能体的未来潜力愈加被看好,吸睛无数。…- 91
- 0
用神经架构搜寻给LLM瘦身,模型变小,准确度有时反而更高
用神经架构搜寻给 LLM 瘦身,同等准确度可让 LLaMA2-7B 模型巨细降 2 倍。大型语言模型(LLM)的一个主要特点是「大」,也因此其训练和部署成本都相当高,如何在保证 LLM 准确度的同时让其变小就成了非常重要且有价值的研究课题。对此,研究社区已经提出了多种多样的方式,比如剪枝、稀疏化、量化等,它们的效果也各不一样。近日,Intel Labs 发布了一项研究成果,宣称可应用神经架构搜寻(…- 5
- 0
i人小助手:Meta推出多模态对话图,帮你轻松鉴别交际状态
AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实行室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。投稿邮箱:[email protected];[email protected]本文通讯作者为佐治亚理工学院计算机系博士生 Wenqi Jia(秋季…- 5
- 0
从LLM中完全消除矩阵乘法,效果出奇得好,10亿参数跑在FPGA上接近大脑功耗
让谈话模型「轻装上阵」。一直以来,矩阵乘法(MatMul)稳居神经网络操纵的主导地位,其中很大原因归结为 GPU 专门针对 MatMul 操纵进行了优化。这种优化使得 AlexNet 在 ILSVRC2012 挑战赛中一举胜出,成为深度进修崛起的历史性标志。在这当中,有个值得注意的点是,AlexNet 利用 GPU 来提高训练速度,超越了 CPU 的能力,至此,GPU 的加入使得深度进修仿佛赢得了…- 25
- 0
工程
❯
个人中心
今日签到
搜索
扫码打开当前页
返回顶部
幸运之星正在降临...
点击领取今天的签到奖励!
恭喜!您今天获得了{{mission.data.mission.credit}}积分
我的优惠劵
- ¥优惠劵使用时效:无法使用使用时效:
之前
使用时效:永久有效优惠劵ID:×
没有优惠劵可用!