Meta 联合纽约大学和华盛顿大学提出MetaCLIP,带你揭开CLIP的高品质数据之谜。
AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实行室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。投稿邮箱:[email protected];[email protected]。自2021年诞生,CLIP已在计算机视觉识别系统和生成模型上得到了…- 12
- 0
在12个视频了解工作中,Mamba先打败了Transformer
AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。投稿邮箱:[email protected];[email protected]。探究视频了解的新境界,Mamba 模型引领计算机视觉研讨新潮流!传…- 7
- 0
旅行者1号「复活」:世界最慢的电脑,被成功建设了
一台 46 年前的计算机,在 240 亿公里之外,修好了。这是一件浪漫的事。经历了五个月令人紧张的「失联」之后,240 亿公里之外的旅行者 1 号宇宙飞船(Voyager 1)被成功建设,顺利发还了数据。本周一,美国宇航局 NASA 宣布:在经过一些创造性的措施之后,旅行者 1 号任意团队五个月以来第一次收到了有效数据,我们现在已经不妨检查现存最遥远的人造物体的健康状况与情态了。自去年 11 月以…- 4
- 0
ICLR 2024 | 跨范围准确进行零样本非常十分检测,浙大等提出AnomalyCLIP
AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。投稿邮箱:[email protected];[email protected]。零样本非常十分检测(ZSAD)允许检测模型仅利用辅助数据进行训练,…- 10
- 0
CVPR 2024 | 擅长处理复杂场景和说话表达,清华&博世提出全新实例朋分网络架构MagNet
AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。投稿邮箱:[email protected];[email protected]。指代朋分 (Referring Image Segmentatio…- 12
- 0
8B文字多模态大模型指标逼近GPT4V,字节、华师、华科联合提出TextSquare
AIxiv专栏是机器之心发布学术、技术实质的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇实质,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。投稿邮箱:[email protected];[email protected]。近期,多模态大模型 (MLLM) 在文本焦点的 VQA 领域取得了…- 15
- 0
AI信任危机之后,揭秘预训练如何塑造机器的「可托灵魂」
AIxiv专栏是机器之心发布学术、手艺内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级试验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。投稿邮箱:[email protected];[email protected]。 图表 1: 大模…- 6
- 0
首批华文版Llama3模型来了,解释成语、答弱智吧成绩
华文成绩,华文回答。最近,Meta 推出了 Llama 3,为开源大模型树立了新的标杆。和以往的原始 Llama 模型一样,Llama 3 对华文的支持效果欠佳,经常会出现你用华文提问,它用英文或华文 英文回复的现象。因此,要想让国内用户用上该模型,开发者还需对其进行微调。最近,在 Github 以及 HuggingFace 平台上,我们已经陆陆续续地看到了一些这样的项目,比如 llama3-Ch…- 8
- 0
这就是OpenAI神秘的Q*?斯坦福:谈话模型就是Q函数
还记得去年 11 月底爆出来的 Q* 项目吗?这是传说中 OpenAI 正在秘密开展、或将带来颠覆性变革的 AI 项目。如果你想回忆一下,可参看机器之心当时的报道《全网大讨论:引爆 OpenAI 全员乱斗的 Q * 到底是什么?》简而言之,Q* 很可能是 Q 加强进修和 A* 搜寻这两种 AI 方式的结合。近日,斯坦福大学一个团队的一项新研讨似乎为这一研讨方向的潜力提供了佐证,其声称现在已经取得非…- 4
- 0
CVPR 2024 | 基于MoE的通用图象融会模型,添加2.8%参数完成多项任意
AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级试验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。投稿邮箱:[email protected];[email protected]。论文链接:::Task-Customized Mixture of…- 8
- 0
首个基于Mamba的MLLM来了!模型权重、训练代码等已全部开源
AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级试验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。投稿邮箱:[email protected];[email protected]。引言近年来,多模态大型言语模型(MLLM)在各个领域的应用取得了显…- 19
- 0
CVPR 2024 | 跳舞时飞扬的裙摆,AI也能高度还原了,南洋理工提出静态人体衬着新范式
AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。投稿邮箱:[email protected];[email protected]。在日常活动中,人的静止经常引起衣服的从属静止 (secondary…- 7
- 0
大模型一定就比小模型好?谷歌的这项研究说不一定
在这个大模型不断创造新成就的时代,我们通常对机器学习模型有一个直观认知:越大越好。但事实果真如此吗?近日,Google Research 一个团队基于隐聚集模型(LDM)进行了大量尝试研究,得出了一个结论:更大并不总是更好(Bigger is not Always Better),尤其是在预算有限时。论文标题:Bigger is not Always Better: Scaling Propert…- 4
- 0
CVPR 2024 | 字节提出新一代数据集COCONut,比COCO粒度宰割更密集
AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。投稿邮箱:[email protected];[email protected]。随着人为智能的发展,语言模型和生成模型获得了大量的成功并且在设计模…- 27
- 0
CVPR 2024高分论文:全新生成式编写框架GenN2N,统一NeRF变换任意
AIxiv专栏是机器之心发布学术、技术实质的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇实质,覆盖全球各大高校与企业的顶级尝试室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。投稿邮箱:[email protected];[email protected]。来自香港科技大学,清华大学的研究者提出了「GenN2N」,一个统一…- 7
- 0
MLLM真能看懂数学吗?MathVerse来了次摸底测评,放出当天登热榜
AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。投稿邮箱:[email protected];[email protected]。1、背景在大算力的数字化时代下,大语言模型(LLM)以其令人瞩目的…- 5
- 0
蚂蚁团体、浙江大学结合发布开源大模型学问抽取框架OneKE
近日,由蚂蚁团体和浙江大学结合研发的大模型学问抽取框架OneKE宣布开源,并且捐赠给OpenKG开放学问图谱社区。学问图谱是实行大模型可托可控的关键技术之一,学问抽取可助力建立畛域学问图谱。OneKE致力于帮助研究人员和开发者更好地处理信息抽取、文本数据结构化、学问图谱建立等问题。比如,通过OneKE抽取风险变乱、人物实体、机构实体等可以清晰呈现变乱脉络、变乱发展趋势和实体之间关联,建立好的图谱可…- 7
- 0
生成式AI如何告别色情、版权困扰?基于权重显著性的呆板忘记算法有奇效
AIxiv专栏是呆板之心发布学术、技术内容的栏目。过去数年,呆板之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。投稿邮箱:[email protected];[email protected]。近期,硅谷 AI 公司 OpenAI 可谓是话题度拉满,先是一出「…- 9
- 0
开源大模型Llama 3王者归来!最大底牌4000亿参数,功能直逼GPT-4
ChatGPT 拉开了大模型竞赛的序幕,Meta 似乎要后来居上了。本周四,AI 领域迎来重大消息,Meta 正式宣布了人们等待已久的开源大模型 Llama 3。 扎克伯格在 Facebook 上发帖:Big AI news today.与此同时,扎克伯格宣布:基于…- 9
- 0
Meta无限长文本大模型来了:参数仅7B,已开源
谷歌之后,Meta 也来卷无限长上下文。Transformers 的二次复杂度和弱长度外推限制了它们扩大到长序列的能力,虽然存在线性注意力和状态空间模型等次二次解决方案,但从以往的经验来看,它们在预训练作用和下游工作准确性方面表现不佳。长文本是大语言模型一直在努力的方向。近日,谷歌提出的 Infini-Transformer 引入有效方法,可以将基于 Transformer 的大型语言模型 (LL…- 23
- 0
无向图最小割成绩取得新突破,google研讨获SODA 2024最佳论文奖
google博客放出新研讨,求解无向图的最小割成绩。1996 年, 美国计算机科学家 David R Karger 连同其他研讨者在论文《 A new approach to the minimum cut problem》中提出了一个令人惊讶的随机算法 Karger 算法,其在理论计算机科学中非常重要,尤其适用于大规模图的近似最小割成绩。Karger 算法可以在时光为 O (m log^3n) …- 5
- 0
模型被投毒袭击,如今有了新的安全手段,还被AI顶刊接收
在深度进修时代,联邦进修(FL)提供了一种分布式的协作进修的方法,允许多机构数据所有者或客户在不泄漏数据隐私的情况下协作训练机器进修模型。然而,大多数现有的 FL 方法依赖于集中式服务器进行全部模型聚拢,从而导致单点故障。这使得零碎在与不诚笃的客户打交道时容易受到歹意袭击。本文中,FLock 零碎采用了点对点投票体制和嘉奖与削减体制,这些体制由链上智能合约提供支持,以检测和阻止歹意举动。FLock…- 3
- 0
DeepMind升级Transformer,前向通过FLOPs最多可降一半
引入混合深度,DeepMind 新设计可大幅提升 Transformer 效率。Transformer 的重要性无需多言,目前也有很多研究团队致力于改进这种变革性技术,其中一个重要的改进方向是提升 Transformer 的效率,比如让其具备自适应盘算能力,从而可以节省下不必要的盘算。正如不久前 Transformer 架构的提出之一、NEAR Protocol 联合创始人 Illiya Polo…- 4
- 0
极长序列、极快速度:面向新一代高效大语言模型的LASP序列并行
AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。投稿邮箱:[email protected];[email protected]。从国际顶流 GPT-4 128K、Claude 200K 到国内「…- 7
- 0
工程
❯
个人中心
今日签到
搜索
扫码打开当前页
返回顶部
幸运之星正在降临...
点击领取今天的签到奖励!
恭喜!您今天获得了{{mission.data.mission.credit}}积分
我的优惠劵
- ¥优惠劵使用时效:无法使用使用时效:
之前
使用时效:永久有效优惠劵ID:×
没有优惠劵可用!