AI资讯列表 - AI在线

谁能撼动Transformer统治地位？Mamba作者谈LLM未来架构

自 2017 年被提出以来，Transformer 已成为 AI 大模型的主流架构，未来这种情况是一直持续，还是会有新的研究出现，我们不妨先听听身处 AI 圈的研究者是怎么想的。在大模型领域，一直稳站 C 位的 Transformer 最近似乎有被超越的趋势。这个挑战者就是一项名为「Mamba」的研究，其在语言、音频和基因组学等多种模态中都达到了 SOTA 性能。在语言建模方面，无论是预训练还是下游评估，Mamba-3B 模型都优于同等规模的 Transformer 模型，并能与两倍于其规模的 Transforme

大模型玩星际争霸能秀到什么程度？有意识，有预判，中科院和汪军团队发布

全球最重要的电竞赛事之一 DreamHack 刚刚落幕，来自世界各地的星际争霸 II 顶尖选手们展开了激烈的较量。在这场紧张精彩的赛事中，人族选手 CLEM 凭借出色的战术和操作，击败了世界冠军 Dark，赢得了其生涯首个线下大赛冠军。在 AI 领域，DeepMind 的 AlphaStar 在 2019 年发表于《Nature》杂志，至今仍是 AI 研究的重要里程碑。AlphaStar 标志着 AI 技术在理解和处理复杂战略任务方面的巨大进步。然而，它在长期战略规划和决策的可解释性方面的局限性，也为研究者们提供了

清华大学提出三维重建的新方法：O²-Recon，用2D扩散模型补全残缺的3D物体

在计算机视觉中，物体级别的三维表面重建技术面临诸多挑战。与场景级别的重建技术不同，物体级别的三维重建需要为场景中的每个物体给出独立的三维表示，以支持细粒度的场景建模和理解。这对 AR/VR/MR 以及机器人相关的应用具有重要意义。许多现有方法利用三维生成模型的隐空间来完成物体级别的三维重建，这些方法用隐空间的编码向量来表示物体形状，并将重建任务建模成对物体位姿和形状编码的联合估计。得益于生成模型隐空间的优秀性质，这些方法可以重建出完整的物体形状，但仅限于特定类别物体的三维重建，如桌子或椅子。即使在这些类别中，这类方

Midjourney v6 终于更新了！一文详解新版本 3 大要点

大家好，这里是和你们一起探索 AI 绘画的花生~ Midjourney 的 v6 模型终于在 2023 年结束之前更新出来了，这是一个完全重新训练的模型，所以图像生成效果与之前的 v5.2 相比有很大的不同，那么此次更新主要有哪些特点？我们又应该如何正确地用 v6 模型出图呢？今天就带大家一起了解一下~ 上期回顾：首先是 V6 的图像生成质量相比之前的模型来说又提升了不少，在画面质感以及细节刻画上有了更精致的表现，图像的光影处理也比 v 5.2 更真实自然。下面是分别用 v5.2 和 v6 生成的特写图像，通过对比

超详细的 Stable Diffusion ComfyUI 基础教程（五）：局部重绘+智能扩图

前言：我们上一节讲了图生图，也提到了“遮罩”这个节点；我们想一下在使用 Web UI 进行局部重绘的时候都用到了那些功能？上期回顾：内容补充：在开始之前我先给大家补充个知识点，怎么在图生图的时候批量出图“右键-新建节点- Latent-批处理-复制 Latent 批次”，把“复制 Latent 批次”节点串联在“VAE 编码”和“K 采样器”之间，然后设置次数就可以了。一、创建流程 ①我们打开上节课“图生图”的流程图，我们可以看到“加载图像”节点是没有地方连接的，点住“遮罩”往外拉，松开然后选择“VAE 内补编

OpenLAM | 深度势能预训练大模型DPA-2发布

在迈向通用大原子模型（Large Atomic Model，LAM）的征途上，深度势能核心开发者团队面向社区，发起 OpenLAM 大原子模型计划。OpenLAM 的口号是“征服元素周期表！”，希望通过建立开源开放的围绕微尺度大模型的生态，为微观科学研究提供新的基础设施，并推动材料、能源、生物制药等领域微尺度工业设计的变革。经过北京科学智能研究院、深势科技、北京应用物理与计算数学研究所等 29 家单位的 42 位合作者的通力协作，深度势能团队近日面向社区发布了深度势能预训练大模型 DPA-2，将成为 OpenLAM

ScienceAI 2023「AI+材料&化学」专题年度回顾

编辑 | KX传统的科学探索方式是「爱迪生式」的试错法。材料研发周期非常长，而且耗费的人力物力也是巨大的，并且存在偶然性。新材料的设计与研发往往面临挑战：急需的新材料难以快速筛选设计，而设计出的新材料又难以找到高效且低成本的合成配方，拥有合成配方的新材料又会面临规模化的长周期探索。以我国为例，工信部对 30 余家大型骨干企业调查结果显示，130 种关键材料中，有 32% 国内完全空白、54% 虽能生产，但性能稳定性较差、只有 14% 左右可以完全自给。2023 年大模型千帆竞发。就在前不久，大型语言模型（LLM）C

覆盖97.6%泌尿就医人群，蚂蚁集团开源首个医疗专科推理数据集

12月28日，由信通院主办的“虹桥之源”大模型驱动数字经济新生态峰会在上海召开。会上，蚂蚁集团商业机器智能部总经理顾进杰介绍蚂蚁正式开源国内首个医疗专科推理数据集，这将提升大模型在医疗领域的专业性。图说：蚂蚁集团商业机器智能部总经理顾进杰介绍国内首个医疗专科推理数据集在医疗行业，通用型语言模型在应对医疗问诊时，会直接给出答案，而医生则会根据专业知识进行反复的症状探讨，才能给出答案。另外，大模型的幻觉问题和推理能力不足，当前高质量的中文医学专科数据集又较为稀缺，这对训练出色的医疗领域大模型提出了挑战。为克服这些难题，

华东政法数据法律研究中心、蚂蚁集团等发布《数据跨域管控白皮书》

12月27日，在“第六届中国数据法律高峰论坛”上，《数据跨域管控白皮书》（以下简称“白皮书”）正式发布。该白皮书由华东政法大学数据法律研究中心、蚂蚁集团牵头，华控清交、华为云、中电数创、广州数据交易所等单位联合参与。白皮书首次系统化给出了数据跨域管控的实操指引，是行业积极响应国家数据流通政策，共同应对数据滥用、数据泄露、责任不清等数据流通风险挑战，助力数据价值释放的重要成果。（《数据跨域管控白皮书》发布，参编单位代表及嘉宾共同见证）我国已将数据列为重要生产要素，并且鼓励数据要素流通。12月8日，国家数据局局长刘烈

纽约时报送OpenAI、微软上被告：GPT-4输出结果与其作品有大量重复

机器之能报道编辑：佳琪、大盘鸡在人工智能浪潮中，捍卫自己的权利。当人工智能不断兴起，随之而来的除了惊艳四座的强大技术，还有对技术的质疑以及各种规范的难题。用什么作为训练数据？是否得到许可？生成内容是否会造成侵权？这些问题都成为了人工智能发展路上必问的问题。涉及的相关案例，在未来也会指导司法实践。据彭博社报道，《纽约时报》已起诉微软和 OpenAI，指控其侵犯版权，违规使用了《纽约时报》的内容用于人工智能开发。这场官司让人们不得不正视媒体与颠覆性技术之间的关系。据《纽约时报》的起诉书称，这些技术公司使用了数百万篇未经

第三波！2023年12月精选实用设计工具合集

大家好，这是 2023 年 12 月的第 3 波干货合集！这次的干货合集里有一些非常有用的东西，比如电商类网站灵感合集，以及专业的品牌风格指南合集网站，对于视觉、品牌、平面、网页设计领域的同学而言，都是不可多得的好东西。另外，这次的合集当中，还有 2 个非常不错的 AI 工具，一个专精于生成人物图片，另一个则是专门生成 3D 模型的 AI 工具。当然，在此之前记得看看往期干货中有没有你感兴趣的素材：下面我们具体看看这一期的干货： 1、精心筛选的优质电商灵感网站，网站汇集了大量极具设计感的电商和产品相关的网站，你

OPPO前瞻Find X7系列前沿科技，将树立旗舰技术新标杆

OPPO今日公布AI、性能、通信、隐私安全四大领域的最新技术进展，包括智能手机的首个听筒/免提双模卫星通话，首个端侧应用70 亿参数大模型，首次亮相的潮汐架构等诸多前沿技术。此次宣布的全新技术组合将全面落地下一代旗舰产品 Find X7系列，为2024年旗舰手机树立全新的技术标杆，并为消费者带来刷新标准的创新旗舰体验。发布听筒/免提双模卫星通话，引领卫星对讲机进化至卫星手机OPPO发布卫星天线方向图调控技术，将为下一代旗舰实现听筒/免提双模卫星通话的创新体验。这一技术可以动态调控卫星天线的辐射方向图，使天线波束动态

基于ML的运动跟踪：揭示了致病细菌在组织细胞中运动的关系

编辑 | 萝卜皮细菌运动性通常是致病菌的关键毒力因素。研究细菌运动性的常用方法是荧光标记，它可以检测群体或宿主组织中的单个细菌细胞。然而，荧光标记的使用可能会受到蛋白质表达稳定性和/或细菌生理学干扰的阻碍。日本东北大学（Tohoku University）的研究人员将机器学习应用于显微图像分析，以对培养的动物细胞上的人畜共患细菌问号钩端螺旋体进行无标记运动跟踪。该团队使用从人类患者或动物身上分离出的各种钩端螺旋体菌株，以及突变菌株。与严重疾病相关的菌株和缺乏外膜蛋白（OMP）的突变菌株往往表现出快速的移动性和对培养

ScienceAI 2023 年度「AI+蛋白&核酸&分子互作」专题

编辑 | 白菜叶2023 年，「AI 生物大分子结构」领域仍然呈现出百花齐放的态势；蛋白质结构预测、蛋白-蛋白互作、蛋白-核酸互作、RNA 结构等各个领域均得到了进一步拓展，也促进了 AI 在酶工程、制药、医疗、诊断等众多应用领域的探索与落地。以下为 ScienceAI 2023 「AI 蛋白&核酸&分子互作」专题年度回顾。友情提示：点击小标题可直接访问文章华为团队开发组合贝叶斯优化框架，进行抗体计算机设计Quantum-Si与Biovista合作，将蛋白质测序技术与AI可视化结合起来，进一步解锁人类蛋白质组以发现

我们深入华为这场线下闭门会，全方位围观中国大模型这一年

如何认识大模型？如何应对大模型的影响？为了发展大模型，我们该问哪些问题？2023 年是大模型之年。大模型代表了人工智能领域的重大进步，有史以来第一次人类真正看见了通用人工智能（AGI）的曙光。然而，关于大模型，我们了解得并不多。以 OpenAI 首席科学家 Ilya Sutskever 为代表的一些 AI 研究者坚信，足够精确地预测下一个词表明模型对文本内容有了足够深刻的理解。反对者则说，这只不过是统计学。显然，我们正处于一场变革的起点。关于大模型，我们知道些什么？该关注哪些问题？在刚刚举办的 2023 华为云 A

GPT-4完全破解版：用最新官方API微调，想干啥就干啥，网友怕了

灰盒访问，十几步消除 GPT-4 核心保护措施。只要使用最新的微调 API，GPT-4 就可以帮你干任何事，输出有害信息，或是训练数据中的个人隐私。本周二，一篇来自 FAR AI、麦吉尔大学等机构的研究引发了 AI 研究社区的广泛担忧。研究人员试图对 GPT-4 最新上线的几种 API 进行攻击，想绕过安全机制，使其完成通常不被允许的各种任务，结果发现所有 API 都能被攻破，被破解后的 GPT-4 可以回应任何请求。这种「自由」的程度，远远超过了攻击者的预料。有人总结道：现在大模型可以生成针对公众人物的错误信息、

Llama2推理RTX3090胜过4090，延迟吞吐量占优，但被A800远远甩开

这是为数不多深入比较使用消费级 GPU（RTX 3090、4090）和服务器显卡（A800）进行大模型预训练、微调和推理的论文。大型语言模型 (LLM) 在学界和业界都取得了巨大的进展。但训练和部署 LLM 非常昂贵，需要大量的计算资源和内存，因此研究人员开发了许多用于加速 LLM 预训练、微调和推理的开源框架和方法。然而，不同硬件和软件堆栈的运行时性能可能存在很大差异，这使得选择最佳配置变得困难。最近，一篇题为《Dissecting the Runtime Performance of the Training,

快手Agents系统、模型、数据全部开源！

快手联合哈尔滨工业大学研发的「KwaiAgents」，使7B/13B模型也能达到超越GPT-3.5的效果，并且这些系统、模型、数据、评测都开源了！7B 大小的模型也能玩转 AI Agents 了？近期，快手开源了「KwaiAgents」，问它周末滑雪问题，它不但帮你找到场地，连当天的天气都帮你考虑周到了。大家都知道大语言模型（LLM）通过对语言的建模而掌握了大量知识，并具备一定认知和推理能力。但即使是当前最强的 GPT-4，单独使用的情况下，依然会一本正经地胡说八道，无法跟世界保持实时的交互。AI Agents 就