万字综述大模型高效推理:无问芯穹与清华、上交最新联合研讨全面解析大模型推理优化
近年来,大言语模型(Large Language Models, LLMs)受到学术界和工业界的广泛关注,得益于其在各种言语生成任务上的出色表现,大言语模型推动了各种人工智能应用(例如ChatGPT、Copilot等)的发展。然而,大言语模型的落地应用受到其较大的推理开消的限制,对部署资源、用户体验、经济成本都带来了巨大挑战。例如,将包含700亿参数量的LLaMA-2-70B模型进行部署推理,至少…- 12
- 0
「AI+物理先验常识」,浙大、中国科学院通用蛋白质-配体相互作用评分格式登Nature子刊
编辑 | X蛋白质就像是身体中的精密锁具,而药物份子则是钥匙,只有完美契合的钥匙才能解锁治疗之门。科学家们一直在寻找高效的格式来预测这些「钥匙」和「锁」之间的匹配度,即蛋白质-配体相互作用。然而,传统的数据驱动格式往往容易陷入「死记硬背」,记住配体和蛋白质训练数据,而不是真正进修它们之间的相互作用。近日,浙江大学和中国科学院研讨团队,提出了一种名为 EquiScore 的新型评分格式,利用异构图神…- 10
- 0
探索大脑中说话明白体制,香港理工大学钻研登Science子刊
编辑 | 萝卜皮当前的大型说话模型 (LLMs) 依赖单词猜测作为其骨干预训练任意。尽管单词猜测是说话处置惩罚的重要体制,但人类说话明白发生在多个层面,涉及单词和句子的调整以实现对话语的充分明白。香港理工大学的钻研人员通过使用下一句猜测(Next Sentence Prediction,NSP)任意对说话明白进行建模,从而钻研话语级明白的体制。该团队表明,NSP 预训练增强了模型与大脑数据的一致性…- 4
- 0
22个恣意超越SOTA,43个恣意媲美SOTA,Google推出医学医治通用大模型
编辑 | 萝卜皮医生和科学家如果想开发一种新的疗法,这将是一个漫长且昂贵的恣意,需要满足许多不同的标准,而能够加快这一过程的人工智能模型将是无价之宝。然而,目前大多数人工智能方法只能解决一组定义狭窄的恣意,通常局限于特定领域。为了弥补这一差距,Google 团队提出了 Tx-LLM,这是一种通用大型言语模型(LLM),由 PaLM-2 微调而成,可编码有关各种医治方式的学问。仅使用一组权重,Tx-…- 7
- 0
取代高贵量子方式,南科大AI方式实现蛋白质-药物系统多尺度量子「精炼」
编辑 | 萝卜皮生物大份子构造对于药物开发和生物催化至关重要。量子「精炼」(Quantum refinement,QR)方式采用牢靠的量子力学(QM)方式进行晶体细化,在提高构造质量甚至纠正生物大份子的构造方面显示出前景。然而,巨大的估计成本和复杂的量子力学/份子力学(QM/MM)设置限制了 QR 的运用。在这里,南方科技大学的研讨团队将稳健的呆板学习势(Machine Learning Pote…- 6
- 0
预计准确率达95.7%,ChatMOF利用LLM预计和生成金属有机框架
编辑 | X金属有机框架(MOF)因其孔隙率大、表面积大和出色的可调性而用于许多化学应用。然而,在利用 AI 深入探索 MOF 设想与机能优化的研究征途中,科学家们正面临着前所未有的挑战。去年 3 月,韩国科学技术院(Korea Advanced Institute of Science and Technology,KAIST)的研究人员提出的 MOFTransformer 模型经过一百万个假设…- 25
- 0
改变未来对撞机实行游戏规则,中国迷信院、北大开发AI驱动喷注根源判别技巧
环形正负电子对撞机(CEPC)中模仿的双喷注事例示意图。(来源:中国迷信院高能物理钻研所)编辑 | 紫罗夸克和胶子是粒子物理标准模型中的基本粒子,与电子或光子不同,夸克和胶子不能在时空中自由运动,只能被束缚在如质子或中子这样的复合粒子中。对撞机实行中产生的高能夸克或胶子会通过复杂的相互作用转化为大量的末态粒子,后者将沿着原夸克或胶子的运动方向在较小的角度内喷射而出,这一现象被称为喷注。近日,中国迷…- 7
- 0
揭秘100年环球陆地脱氧,上交大通过人工智能重修「窒息的陆地」,ICML已收录
作者 | 卢彬,韩璐羽陆地溶解氧是维持陆地生态系统功能的关键因子。然而,随着环球变暖和人类活动影响加剧,近年来陆地呈现脱氧趋势,日渐窒息的陆地对渔业发展、气候调节等多方面造成严重后果。近期,上海交通大学电子信息与电气工程学院王新兵、甘小莺教授团队联合上海交通大学陆地学院张经院士、周磊教授、周韫韬副教授,共同提出了一种稀薄陆地察看数据驱动的深度图学习模型 OxyGenerator,首次对 1920 …- 19
- 0
准确率92~98%,人工智能揭示大脑布局中与性别相关的分别
编辑 | 白菜叶在神经科学研讨领域,生物性别作为关键变量,对认知功能和神经精神疾病中的性别分别研讨至关重要。尽管先前已在大脑宏观布局如皮层厚度或地区大小上观察到显著的统计学分别,但关于可能揭示脑健康与疾病机制的细胞层面宏观布局的性别分别仍知之甚少。探究男性与女性之间的这些宏观布局分别,对于理解在不同性别中表现各异的大脑疾病具有重要意义。一项新研讨显示,处理 MRI 结果的人工智能(AI)计算机程序…- 8
- 0
自动化所研发脉冲动静计较的毫瓦级超低功耗异步感算一体类脑芯片
人脑不妨运行非常复杂且庞大的神经网络,总功耗却仅为20瓦,远小于现有的人工智能体系。因此,在算力比拼加速,能耗日益攀升的今日,借鉴人脑的低功耗特性发展新型智能计较体系成为极具后劲的方向。 近日,中国科学院自动化研究所李国齐、徐波课题组与时识科技公司等单位合作计划了一套不妨实现动静计较的算法-软件-硬件协同计划的类脑神经状态SOC(System on Chip,体系级芯片)Speck,展示了类脑神经…- 4
- 0
1.8B参数,阿里云首个联合DNA、RNA、蛋白质的生物大模型,涵盖16.9W物种
编辑 | 萝卜皮不久之前,Google DeepMind 发布了 AlphaFold3,再次引发了人们对「AI 生命科学」的讨论。在学界,科学家的目标往往是先认识世界,然后在认识的前提上改造世界。但是在生命科学领域,人类对整个生命的理解与认识还如九牛一毛、冰山一角;建立对生命体系的多维度深刻认识是当前人类研讨的重要一步,AI 是达成这一步的重要工具。近期,阿里云飞天实验室发布并开源了业界首个联合 …- 5
- 0
微软发布首个大气AI底子模型Aurora
编辑 | ScienceAI2023 年 11 月,风波「夏兰」(Ciarán)袭击欧洲西北部,造成严重破坏。与风波 Ciarán 相关的低压系统为英格兰创下了新纪录,这是一次极为罕见的气象事件。那场风波的强度让许多人措手不及,暴露了当前气象预告模型的局限性,并突显出面对气候变化需要更正确的猜测。当大家努力应对后果时,一个紧迫的问题出现了:我们如何才能更好地猜测和准备应对这种极端气象事件?最近的一…- 8
- 0
开源模型进展盘点:最新Mixtral、Llama 3、Phi-3、OpenELM到底有多好?
深度学习领域知名研究者、Lightning AI 的首席人工智能教育者 Sebastian Raschka 对 AI 大模型有着深刻的洞察,也会经常把一些观察的结果写成博客。在一篇 5 月中宣布的博客中,他盘点分析了 4 月份宣布的四个主要新模型:Mixtral、Meta AI 的 Llama 3、微软的 Phi-3 和苹果的 OpenELM。他还通过一篇论文探讨了 DPO 和 PPO 的优劣之处…- 3
- 0
CVPR 2024 | 主动驾驭世界模型四维时空预训练
北京大学与EVLO创新团队共同提出面向主动驾驭的四维时空预训练算法DriveWorld。该方法采用世界模型进行预训练,设计记忆情态空间模型进行四维时空建模,通过展望场景的盘踞栅格,降低主动驾驭面临的随机不确定性和知识不确定性。该论文已被CVPR 2024接收。论文题目:DriveWorld: 4D Pre-trained Scene Understanding via World Models f…- 3
- 0
ASQuery:基于Query的时序举动联系新架构
1. 前言北京邮电大学与EVOL创新团队和ACG工业算法组针对时序举动联系任务共同提出了基于query新架构的模型ASQuery。ASQuery包罗了举动及边境两种query,利用举动query将原先的帧维度分类过程转化为query与视频帧的相似度计算过程,提高了分类精度;利用边境query展望举动的边境,进一步光滑了原先的展望结果,大大缓解了过联系现象。论文ASQuery: A Query-ba…- 5
- 0
SOTA性能,多标准进修,中山大学提出蛋白质-药物互相作用AI框架
编辑 | 紫罗蛋白质、药物和其他生物份子之间的互相作用,在各种生物过程中发挥着至关重要的作用。了解这些互相作用对于破译生物学过程背后的份子机制和开发新的治疗策略至关重要。当前的多标准计算格式,常常过于依赖于单一标准,而对其他标准的拟合不足,这可能与多标准进修的不平多标准衡性和固有的贪婪性有关。为了缓解优化不平稳,中山大学和上海交通大学的钻研职员提出了一种基于变量盼望最大化的多标准示意进修框架 MU…- 4
- 0
超衍射极限1.5倍,成像条件低10倍,清华、中国科学院用AI法子提高显微镜分辨率
图示:通过 ZS-DeconvNet 对快速光敏生物历程进行长期 SR 成像。(来源:论文)编辑 | 萝卜皮计算超分辨率法子,包括传统的分析算法和深度进修模型,极大地改进了光学显微镜。其中,有监视深度神经收集表现出了出色的性能,但由于活细胞的高动态性,需要大量的高质量训练数据,而获得这些数据非常费力甚至不切实际。在最新的研讨中,清华大学和中国科学院的研讨人员开发了零样本反卷积收集(Zero-sho…- 10
- 0
为百亿参数LLM化学应用提供新范式,香港理工大学提出上下文份子微调
作者 | 香港理工大学李佳潼编辑 | ScienceAI去年,香港理工大学研究团队开发了一个基于检索的提示范式MolReGPT,利用大型谈话模型探索份子发现,在份子和份子文本形容之间进行翻译。近日,香港理工大学、上海交通大学和上海人工智能实行室联合发表了题为《Large Language Models are In-Context Molecule Learners》的文章,也是MolReGPT[…- 18
- 0
登Nature子刊,中科院计算所团队开发CarbonDesign,进行准确且稳健的蛋白质序列安排
编辑 | 萝卜皮蛋白质是生物体内执行生物功效的基础元件,在催化、免疫和信号传递等生物过程中起着重要作用。一般认为,蛋白质序列安排是蛋白质布局猜测的逆问题。具体地,是指从给定的蛋白质三维布局出发,安排出能够折叠成为目标蛋白布局、具有目标蛋白功效的序列。它是重新蛋白质安排的关键一步,一旦主链布局被生成,为其安排最佳序列就变得至关重要。蛋白质序列安排在药物安排、酶工程等领域具有重要应用。由于可能的蛋白质…- 6
- 0
AI的未来是一个巨大的模型,还是多个specialized小模型
简介言语模型在广泛的应用中已被证明是有效的,但最复杂的模型通常是专有的。例如,OpenAI的GPT-4和Anothropic的各种模型不仅昂贵,而且消耗大量能源。与此相比,开源社区已经生产了能够竞争的模型,如Llama3。此外,为特定范畴如法律、医疗或金融义务定制的较小的言语模型,已在性能上超越了它们的专有对手。本文介绍了一种新的办法,采用functional token调整了多个开源模型,每个模…- 2
- 0
AI 回答物理学问题,MIT 开发主动绘制材料相图机械进修框架
编辑 | X当水结冰时,它会从液相转化为固相,密度和体积等特性会发生巨大变化。水中的相变很常见,但新型材料或复杂物理体系中的相变是一个重要的钻研领域。绘制相图通常需要大量的人类直觉和理解。如何量化未知体系中的相变通常是不清楚的,尤其是在数据稀缺的情况下。麻省理工学院和瑞士巴塞尔大学的钻研职员,将生成式人工智能模型应用于这个问题,开发了一种新的机械进修框架,可以主动绘制新的物理体系的相图,几乎不需要…- 5
- 0
博世团队提出参照神经算子,进修偏微分方程解对若干变形的滑润圆滑依赖
编辑 | 枯叶蝶在解决具有任意外形域的偏微分方程问题时,现有的神经算子法子致力于进修从若干外形到解的映照,但这通常需要庞大的(若干,解)二元组数据集来训练神经算子以确保准确性。然而,对于如工程设计优化等工业应用,因单次仿真可能耗时数小时乃至数天,满足此数据需求极为困难。针对这一挑战,博世人工智能中心(BCAI)的研究人员提出了参照神经算子(RNO)的概念,作为一种新颖的神经算子实行方式,旨在进修解…- 5
- 0
CoT提出者Jason Wei:大模型评价基准的「七宗罪」
Jason Wei 是思惟链提出者,并和 Yi Tay、Jeff Dean 等人合著了关于大模型涌现能力的论文。目前他正在 OpenAI 进行工作。在 CV 规模,研究者一直把李飞飞等人创造的 ImageNet 奉为模型在下游视觉任务中能力的试金石。在大模型时代,我们该如何评价 LLM 性能?现阶段,研究者已经提出了诸如 MMLU、GSM8K 等一些评价基准,不断有 LLM 在其上刷新得分。但这些…- 6
- 0
只需单卡RTX 3090,低比特量化训练就能实行LLaMA-3 8B全参微调
AIxiv专栏是机器之心发布学术、手艺内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。 投稿邮箱:[email protected];[email protected]- 4
- 0
理论
❯
个人中心
今日签到
搜索
扫码打开当前页
返回顶部
幸运之星正在降临...
点击领取今天的签到奖励!
恭喜!您今天获得了{{mission.data.mission.credit}}积分
我的优惠劵
- ¥优惠劵使用时效:无法使用使用时效:
之前
使用时效:永久有效优惠劵ID:×
没有优惠劵可用!