资讯列表
助力AI技术共享,蚂蚁开源又一核心技术“因果学习系统 OpenASCE”
当地时间 12 月 10 日,为期 6 天的 AI 国际顶会 NeurIPS (Neural Information Processing Systems) 在美国路易斯安那州新奥尔良市开幕。NeurIPS 是全球人工智能和机器学习领域的顶级会议,与 ICML 并称为人工智能领域难度最大,水平最高,影响力最强的会议。会议首日,中国互联网企业蚂蚁集团受邀举办主题为“知识增强 AI 在垂直行业的应用探索”(Knowledge-enhanced AI for Industry Verticals)的研讨会,并在会上开源了
夸张!EMNLP投稿近5000篇,奖项出炉:北大、腾讯摘最佳长论文
本届 EMNLP 大会在投稿人数上创了新高,整体接收率也较上届略有提升。EMNLP 是自然语言处理领域的顶级会议之一,EMNLP 2023 于 12 月 6 日 - 10 日在新加坡举行。因为今年 ChatGPT 的爆火带动大模型、NLP 概念,EMNLP 2023 的投稿论文数量也达到近 5000 篇,甚至略高于 ACL 2023。在接收率方面,长论文接收率为 23.3%,短论文接收率为 14%,整体接收率为 21.3%。这一数据相较 EMNLP 2022 的 20% 略有提升。我们从这次 EMNLP 的 loc
生成式 AI 如何赋能千行百业?产学大咖剖析金融、工业、医疗和教育等关键领域前沿实践
在近日对上海市的考察调研中,习近平总书记参观了上海科技创新成果展,指出推进中国式现代化离不开科技、教育、人才的战略支撑,上海在这方面要当好龙头,加快向具有全球影响力的科技创新中心迈进。创新力就是竞争力,上海正勇担使命、奋力攻坚。为了更好地提升上海科技创新策源能力,进一步推进上海国际科技创新中心建设,将于12 月 16 日举办数智上海 2023 峰会·上海城市数字化转型体验周开幕式。作为引领新一轮科技浪潮的关键技术,生成式AI 正在各行业、各领域催生创新应用,带来全新的机遇与挑战。为了更好地推动「上海市 AI 大模型
零一万物Yi-34B-Chat微调模型上线,登陆多个权威榜单
在盲测对比中也取得了好成绩。最近,业内众多大模型基准又迎来了一轮 “实力值” 更新。继 11 月初零一万物发布 Yi-34B 基座模型后,Yi-34B-Chat 微调模型在 11 月 24 日开源上线 ,短时间登陆了全球多个英文、中文大模型权威榜单,再度获得了全球开发者的关注。其中,在斯坦福大学提出的大语言模型评测基准 AlpacaEval 上,Yi-34B-Chat 以 94.08% 的胜率,超越 LLaMA2 Chat 70B、Claude 2、ChatGPT,在 Alpaca 经认证的模型类别中,成为业内仅次
丢掉注意力的扩散模型:Mamba带火的SSM被苹果、康奈尔盯上了
替代注意力机制,SSM 真的大有可为?为了用更少的算力让扩散模型生成高分辨率图像,注意力机制可以不要,这是康奈尔大学和苹果的一项最新研究所给出的结论。众所周知,注意力机制是 Transformer 架构的核心组件,对于高质量的文本、图像生成都至关重要。但它的缺陷也很明显,即计算复杂度会随着序列长度的增加呈现二次方增长。这在长文本、高分辨率的图像处理中都是一个令人头疼的问题。为了解决这个问题,这项新研究用一个可扩展性更强的状态空间模型(SSM)主干替代了传统架构中的注意力机制,开发出了一个名为 Diffusion S
像调鸡尾酒一样调制多技能大模型,智源等机构发布LM-Cocktail模型治理策略
随着大模型技术的发展与落地,「模型治理」已经成为了目前受到重点关注的命题。只不过,在实践中,研究者往往感受到多重挑战。一方面,为了高其在目标任务的性能表现,研究者会收集和构建目标任务数据集并对大语言模型(LLM)进行微调,但这种方式通常会导致除目标任务以外的一般任务的性能明显下降,损害 LLM 原本具备的通用能力。另一方面,开源社区的模型逐渐增多,大模型开发者也可能在多次训练中累计了越来越多的模型,每个模型都具有各自的优势,如何选择合适的模型执行任务或进一步微调反而成为一个问题。近日,智源研究院信息检索与知识计算组
一条磁力链接席卷AI圈,87GB种子直接开源8x7B MoE模型
「高端」的开源,往往采用最朴素的发布方式。昨天,Mistral AI 在 X 平台甩出一条磁力链接,宣布了新的开源动作。没有长篇官方博客,没有刻意加速的 Demo,这家公司算是当下大模型领域的「一股清流」。打开一看,发现是接近 87 GB 的种子:参数配置什么样?很多人放弃了周末,第一时间下载运行起来。看上去,Mistral 8x7B 使用了与 GPT-4 非常相似的架构,但是「缩小版」: 8 个专家总数,而不是 16 名(减少一半) 每个专家为 7B 参数,而不是 166B(减少 24 倍)42B 总参数(估计)
陶哲轩用 AI 形式化的证明究竟是什么?一文看懂 PFR 猜想的前世今生
正是包括两位菲尔兹奖获得者在内四位数学家的坚持,才得以证明了一个堪称「加性组合学圣杯」的猜想,其中 AI 辅助证明起到了不可磨灭的作用。12 月 5 日,著名数学家、菲尔兹奖获得者陶哲轩在社交网络宣布:对多项式 Freiman-Ruzsa 猜想(PFR)的证明进行形式化的 Lean4 项目成功完成,并且耗时仅三周时间,其依赖图的全部节点都带上了「可爱的绿色阴影」。Lean 编译器也报告该猜想符合标准公理,可以说这是计算机和 AI 辅助证明的一项巨大成功。但多项式 Freiman-Ruzsa 猜想究竟是什么?为什么对
开源模型「幻觉」更严重,这是三元组粒度的幻觉检测套件
BSChecker:细粒度大模型幻觉检测工具与基准测试排行榜大模型长期以来一直存在一个致命的问题,即生成幻觉。由于数据集的复杂性,难免会包含过时和错误的信息,这使得输出质量面临着极大的挑战。过多的重复信息还可能导致大型模型产生偏见,这也算是一种形式的幻觉。如何检测和有效缓解大模型的生成幻觉问题一直是学术界的热门课题。近日,亚马逊上海人工智能研究院推出细粒度大模型幻觉检测工具 BSChecker,包含如下重要特性:细粒度幻觉检测框架,对大模型输出文本进行三元组粒度的幻觉检测。幻觉检测基准测试集,包含三种任务场景,满足
GPU上运行速度比现有模型快3-7倍,IU团队使用全卷积神经网络进行准确的从头肽测序
编辑 | 萝卜皮从头肽测序不依赖于全面的靶序列数据库,这为科学家提供了一种从串联质谱中识别新肽的方法。然而,当前的从头测序算法的准确性和覆盖率较低,这阻碍了它们在蛋白质组学中的应用。印第安纳大学(Indiana University,IU)的研究人员提出了 PepNet,一种用于高精度从头肽测序的全卷积神经网络。PepNet 将 MS/MS 谱(表示为高维向量)作为输入,并输出最佳肽序列及其置信度得分。PepNet 模型使用来自多个人类肽谱库的总共 300 万个高能碰撞解离 MS/MS 谱图进行训练。评估结果表明,
HumanGaussian开源:基于Gaussian Splatting,高质量 3D 人体生成新框架
在 3D 生成领域,根据文本提示创建高质量的 3D 人体外观和几何形状对虚拟试穿、沉浸式远程呈现等应用有深远的意义。传统方法需要经历一系列人工制作的过程,如 3D 人体模型回归、绑定、蒙皮、纹理贴图和驱动等。为了自动化 3D 内容生成,此前的一些典型工作(比如 DreamFusion [1] )提出了分数蒸馏采样 (Score Distillation Sampling),通过优化 3D 场景的神经表达参数,使其在各个视角下渲染的 2D 图片符合大规模预训练的文生图模型分布。然而,尽管这一类方法在单个物体上取得了不
人均6万美元:2024英伟达奖学金名单公布,五位华人入选
「他们是全球最有才华的博士生。」本周五,备受期待的英伟达奖学金公布了入选者名单。二十多年来,英伟达研究生奖学金计划(NVIDIA Graduate Fellowship Program)一直为研究生提供与英伟达技术相关的杰出工作支持。英伟达迄今为止已向近 200 名学生提供了 600 万美元的资助,推动了机器学习、计算机视觉、机器人和系统编程等领域的研究工作。今年的奖学金计划向参与计算创新所有领域研究的 10 名博士生提供每人高达 6 万美元的奖学金。英伟达奖学金面向全球学者,每年都会出现激烈的竞争,今年的候选人就
逼真到头发丝,光线可调,Meta推出实时3D头像合成方法
Meta 一直没放弃元宇宙。2021 年,Facebook 将「元宇宙(metaverse)」作为公司主营业务,并将公司名称更改为 Meta。然而,这一年,随着 ChatGPT 的横空出世,生成式 AI 成为一个新的研究趋势,很多科技公司都将生成式 AI 作为公司重要研发业务。但 Meta 一直没有停止 VR/AR 的研究步伐。最近,Meta 的 Codec Avatars Lab 提出了一种高保真、光线可调节的虚拟头像合成方法 ——Relightable Gaussian Codec Avatars。论文地址::
华为诺亚&清华:基于认知的万物超分大模型CoSeR
从低清图像中提取认知特征,这样的超分辨率才更真实。图像超分辨率技术旨在将低分辨率图像转换为高分辨率图像,从而提高图像的清晰度和细节真实性。随着超分技术的发展和手机硬件性能的提升,人们期望拍摄出更加清晰的照片。这项技术在手机影像等领域有着广泛的应用和需求。然而,现有的超分方法存在一些局限性,如下图所示,主要有以下两个方面:一是缺乏泛化能力。为了实现更好的超分效果,通常需要针对特定场景使用特定传感器采集到的数据来进行模型训练,这种学习方式拟合了某种低清图像和高清图像间的映射,但在其他场景下表现不佳。此外,逐场景训练的方
Soul正式上线自研大模型“SoulX”,持续丰富用户社交体验
近日,新型社交平台Soul正式上线自研语言大模型SoulX。作为生成式人工智能最基础、最核心的工具,SoulX将作为Soul “AIGC 社交”布局的重要基建,垂直应用于平台上多元社交互动场景,例如智能对话机器人“AI苟蛋”、AI辅助聊天、虚拟陪伴等诸多工具和创新功能,进一步丰富平台用户的社交体验。据了解,SoulX的优势在于平台深耕行业过程中,大量公域场景社交类型数据的积累。该模型基于海量数据训练,具备prompt驱动、条件可控生成、上下文理解、多模态理解等能力。在保证对话流畅、自然、具备情感温度的同时,Soul
AI揭示微生物暗蛋白:使用机器学习来发现微生物蛋白质宇宙中的功能性「暗物质」
编辑 | 白菜叶宏基因组学项目揭示了地球生物圈中超过 80 亿个非冗余微生物蛋白质序列。其中,11.7 亿种蛋白质在超过 100,000 个可用参考基因组中没有可识别的同源物。了解这些微生物蛋白质的功能是一项艰巨的任务。幸运的是,机器学习最近在复杂生物数据建模和预测方面取得了前所未有的准确性。这些进步的最前沿是基于机器学习的方法,可以自信地预测许多(但不是全部)氨基酸序列的原子级蛋白质结构。最近的一项研究使用 ESMFold 预测器,该预测器利用大型语言模型,从欧洲生物信息学研究所的 MGnify 宏基因组数据库快
百度智能云AI助力市政污水处理稳定达标 药剂投加节约三成
近年来,随着国家对水环境质量的重视程度日益提高,污水尾水高标准排放逐步成为各地污水处理厂的基础要求。在这一背景下,污水处理厂对精细化、智能化运营需求也日益凸显。污水尾水高排放标准不仅对污水厂处理工艺要求高,同时还对污水处理过程中能耗、消耗及运营成本提出了更为严格的要求。如何更高效节能地治理污水?针对污水处理的药剂投加环节,百度智能云与清华大学施汉昌团队合作,通过将数据挖掘、深度学习与传统机理模型进行深度耦合,推出百度智能云污水处理智能加药系统解决方案。该方案以AI模型算法为核心,通过对污水处理厂工艺进行仿真建模,实
从比尔盖茨的文章中,总结出这份AI时代的生存指南
盖茨预测未来五年,AI 代理将颠覆软件行业和人们的生产生活。人们将不再需要各种应用程序,AI 驱动的个人助理将改变现有的人机交互方式。包括设计师在内的老互联网从业者将何去何从?本文从中总结了三点启发,供你参考。
更多趋势预测:一、前言
在 OpenAI 刚刚宣布其“ Assistants API”迈出的“婴儿步”几天后。盖茨发表了一篇博客,主题思想是:AI 代理,即将彻底改变我们使用计算机的方式并颠覆软件行业。在未来五年内,人们将能够使用自然语言与设备进行交流,而不再需要不同的应用程序。这种由人工智能驱动的个人助理