资讯列表
NLP 泛化研究的分类与综述
编辑 | 白菜叶良好的泛化能力是自然语言处理(NLP)模型的主要需求之一,但「良好的泛化」意味着什么以及如何评估它还没有得到很好的理解。FAIR、阿姆斯特丹大学(University of Amsterdam)、爱丁堡大学(University of Edinburgh)的研究人员提出了一种用于表征和理解 NLP 泛化研究的分类法。该分类法基于广泛的文献综述,包含五个轴,泛化研究可能沿这些轴有所不同:他们的主要动机、他们想要解决的泛化类型、他们考虑的数据转移类型、数据转移的来源以及 NLP 建模流程中转移的轨迹。该
用过GPT-4 Turbo以后,我们再也回不去了
GPT 变得好用了,但真的更聪明了吗?昨天,很多人彻夜未眠 —— 全球科技圈都把目光聚焦在了美国旧金山。短短 45 分钟时间里,OpenAI CEO 山姆・奥特曼向我们介绍了迄今为止最强的大模型,和基于它的一系列应用,一切似乎就像当初 ChatGPT 一样令人震撼。OpenAI 在本周一的首个开发者日上推出了 GPT-4 Turbo,新的大模型更聪明,文本处理上限更高,价格也更便宜,应用商店也开了起来。现在,用户还可以根据需求构建自己的 GPT。根据官方说法,这一波 GPT 的升级包括:更长的上下文长度:128k,
仅根据蛋白质序列便可预测相互作用界面,一种基于Transformer的蛋白预测模型
编辑 | 萝卜皮蛋白质-蛋白质相互作用(PPI)对于生物过程至关重要,预测这些相互作用的位点对于计算和实验应用都很重要。杜克大学(Duke University)和康奈尔大学(Cornell University)的研究人员提出了一种与结构无关的语言Transformer和肽优先级(Structure-agnostic Language Transformer and Peptide Prioritization,SaLT&PepPr)管线,用于仅根据蛋白质序列预测相互作用界面,以用于后续生成肽结合基序。该模型通过
解说梅西球赛、英雄联盟,OpenAI GPT-4视觉API被开发者玩出新花样
用过 OpenAI 视觉 API 的开发者都被惊艳到了。文章开始,我们先来看一段球赛解说视频:是不是感觉听起来不太对劲?你的感觉没错,因为这段解说是用 AI 生成的,这个大喊「梅西!梅西!」的声音居然来自 AI。这是 X 平台(原推特)博主 @Gonzalo Espinoza Graham 发布的一段视频。他表示,在制作过程中,他主要用到了 GPT-4V 和 TTS 两项技术。GPT-4V 是 OpenAI 前段时间发布的一个多模态大模型,既能像原版的 ChatGPT 一样通过文字聊天,也能读懂用户在聊天中给到的图
热乎的GPTs体验报告:创建专属GPT,不懂代码人的春天来了
离 AI 智能体越来越近。如果 OpenAI 的开发者大会是砸向水面的石头,当它结束后,阵阵涟漪正向四面散开。GPT 不仅在集成上更进一步,不必一步步调用,更将成为人人可开发的强大工具。即使你不懂编码、没有计算机相关的基础知识,也能轻松构建。官方博客:,我们似乎离 AI 的最终想象 ——「AI 智能体」已经不远了。这个词的定义还尚且模糊,大致指一个自主的 AI 程序,被赋予一个目标后,能够独立实现。在过去的几个月里,有很多关于智能体的热议,但实际上很少有真正有效的技术。一个真正的 AI 智能体大概是什么样的呢?比如
受8位合著者举报,引爆物理圈的室温超导论文被Nature撤稿,一作正接受调查
经历了大起大落,室温超导的喧嚣终于在 2023 年底告一段落。11 月 7 日,《Nature》杂志宣布,撤回今年 3 月 Ranga Dias 团队发表的室温超导论文。对于在过去一年数次引爆物理圈的室温超导领域来说,这是一次新的打击。人们或许还记得,一种名为「LK-99」的室温超导体成为了今年夏天热门的话题。「LK-99」的衰落和它的崛起一样迅速。无数次失败的复现实验表明,它只不过是一块普通的「冰箱贴」。而 Ranga Dias 团队在 3 月发表的一篇论文,似乎提前为 LK-99 的狂欢做好了铺垫。当时 Dia
北大具身智能团队提出需求驱动导航,对齐人类需求,让机器人更高效
想象一下,如果机器人能够听懂你的需求,并努力满足,是不是很美好呢?如果想让机器人帮助你,你通常需要下达一个较为精准的指令,但指令在实际中的实现效果不一定理想。如果考虑真实环境,当要求机器人找某个特定的物品时,这个物品不一定真的存在当前的环境内,机器人无论如何也找不到;但是环境当中是不是可能存在一个其他物品,它和用户要求的物品有类似的功能,也能满足用户的需求呢?这就是用 “需求” 作为任务指令的好处了。近日,北京大学董豪团队提出了一个新的导航任务 —— 需求驱动导航(Demand-driven Navigation,
最懂工业的大模型来了!思谋发布全球首个工业多模态大模型
大模型技术正在引领新一轮工业革命,但将其应用于工业制造,仍面临许多挑战,专业知识的缺乏是关键难点。11月5日,香港中文大学终身教授、思谋科技创始人兼董事长贾佳亚受邀参加第六届中国国际进口博览会暨虹桥国际经济论坛开幕式。虹桥论坛上,贾佳亚在主题演讲中表示,“目前,业界还没有一个能真正服务于高端智能制造的大模型。” 贾佳亚在虹桥国际经济论坛上发表主题演讲亟待人工智能技术提高、释放生产力的工业制造界盼大模型已久,至此终于迎来全球首个工业多模态大模型IndustryGPT V1.0。论坛上,贾佳亚和团队正式发布Indust
准确率达 80%,深度学习识别布朗运动中纳米粒子形状
编辑 | 绿萝随着纳米粒子在医疗、制药和工业领域的实际应用。从材料的角度出发,需要对每个纳米粒子的性质和团聚状态进行评价并进行质量控制。评估液体中纳米粒子的一种方法是分析布朗运动的轨迹。虽然纳米粒子跟踪分析技术(Nano-tracking analysis,NTA) 是一种用于测量从微观到纳米尺度的单个粒子的简单方法,但它不能评估纳米粒子的形状一直是一个长期存在的问题。NTA 在使用 Stokes-Einstein 方程量化粒子大小时总是假设球形,但无法验证所测量的粒子是否真的是球形的。东京大学的研究团队提出了一种
联发科翻身,同蓝厂联合研发「全大核」体系,vivo X100稳了
旗舰芯片真的变天了?智能手机芯片的性能,从来没有过如此大幅度的提升。昨天,联发科的旗舰芯片天玑 9300 正式亮相,一举完成了连续超车:性能超过高通和苹果,站上了本世代移动芯片的顶端。据介绍,天玑 9300 的 CPU、GPU 性能均超过了竞品,另外能耗还有所降低,又率先实现了 70 亿大语言模型在手机端侧的落地。与此同时,搭载顶级芯片的新手机也将开卖。在发布会上,vivo 第一时间宣布即将发布的年度旗舰机 vivo X100 系列将首发搭载天玑 9300,新机型与芯片进行了深度的定制化,发布会下周就开。「我们认为
OpenAI首个开发者日:自定义GPT、GPT商店太炸,还有模型更强更便宜了
真如 Sam Altman 此前所言,OpenAI 首届开发者大会为人们带来了一些非常棒的新东西。继今年春天发布 GPT-4 之后,OpenAI 又创造了一个不眠夜。过去一年,ChatGPT 绝对是整个科技领域最热的词汇。OpenAI 也依靠 ChatGPT 取得了惊人的成绩:总结来说,OpenAI 证实 ChatGPT 目前每周有超过 1 亿活跃用户,超过 200 万开者使用 API 等进行开发,与超过 92% 的财富 500 强公司合作。作为备受期待的首届开发者大会,Sam Altman 在昨晚带来了一系列全新
DeepMind指出「Transformer无法超出预训练数据实现泛化」,但有人投来质疑
难道 Transformer 注定无法解决「训练数据」之外的新问题?说起大语言模型所展示的令人印象深刻的能力,其中之一就是通过提供上下文中的样本,要求模型根据最终提供的输入生成一个响应,从而实现少样本学习的能力。这一点依靠的是底层机器学习技术「Transformer 模型」,并且它们也能在语言以外的领域执行上下文学习任务。以往的经验表明,对于在预训练混合体中得到充分体现的任务族或函数类,选择适当函数类进行上下文学习的成本几乎为零。因此有研究者认为,Transformer 能很好地泛化与训练数据相同分布的任务 / 函
马斯克第二款AI产品PromptIDE公布,Grok的开发离不开它
网友:xAI 团队的开发速度简直是疯了!距离马斯克的 xAI 公布 Grok 才过去一天,刚刚,xAI 又公布了另一款 AI 产品,一个可用于 prompt 工程和可解释性研究的集成开发环境:PromptIDE。接连不断的新品发布,也让网友纷纷感叹:「xAI 团队的开发速度简直是疯了!」xAI 在官方博客中这样介绍:PromptIDE 是一个用于 prompt 工程和可解释性研究的集成开发环境。它通过 SDK 加速 prompt 工程,并且该 SDK 可以完成复杂的 prompt 技术,还能进行结果分析,可视化网络
让大模型自主探索开放世界,北大&智源提出训练框架LLaMA-Rider
大语言模型因其强大而通用的语言生成、理解能力,展现出了成为通用智能体的潜力。与此同时,在开放式的环境中探索、学习则是通用智能体的重要能力之一。因此,大语言模型如何适配开放世界是一个重要的研究问题。北京大学和北京智源人工智能研究院的团队针对这个问题提出了 LLaMA-Rider,该方法赋予了大模型在开放世界中探索任务、收集数据、学习策略的能力,助力智能体在《我的世界》(Minecraft)中自主探索获取知识并学习解决各种任务,提升智能体自主能力和通用性。
中国信通院华东分院征集2023长三角制造业数字化转型试点示范
随着新一代信息技术不断突破,数字浪潮正在向各产业各领域广泛传播和渗透,正在深刻改变经济社会运行模式。数字技术创新和数字经济发展已经成为推进新型工业化的加速器,为经济高质量发展注入强劲动能、形成强力支撑。为充分总结分享推广先进经验和标杆,助力数字化转型过程中城市能级提升、产业转型发展、数字红利惠民,现启动2023长三角制造业数字化转型试点示范征集工作。长三角制造业数字化转型试点示范的征集对象为制造领域数字化转型的代表企业,评选设置了典型场景和技术创新两大组别。本次案例征集结果将会在2023年12月份数智上海2023峰
FDA 团队用基于DL的自然语言处理方法,识别定向药代动力学药物相互作用
编辑 | 萝卜皮在药物开发过程中,收集有关药物(对象)由于与另一种药物(沉淀剂)的药代动力学(PK)药物相互作用(DDI)而导致的临床暴露变化的信息至关重要。虽然已经发布了许多用于 DDI 的自然语言处理 (NLP) 方法,但大多数方法旨在评估文本中是否存在(以及何种)DDI 关系,而不识别 DDI 的方向(对象与沉淀药物)。在这里,美国食品药品监督管理局(Food and Drug Administration,FDA)的研究人员提出了一种从文献或药物标签中自动识别 PK DDI 方向性的方法。该团队重新注释了文
第一波!2023年11月精选实用设计工具合集
大家好,这是 2023 年 11 月的第 1 波干货合集!这次合集所推荐的工具几乎全都是 AI 工具,其中有专门创建游戏角色的 AI,也有专门针对电商和社交媒体运营的免费 AI 合集,有生成迪士尼风格海报的 AI 也有生成稳定视频的黑科技 AI,不过我最喜欢的还是不务正业的 GIF 梗图换脸 AI,相当好玩。
当然,在此之前记得看看往期干货中有没有你感兴趣的素材:下面我们具体看看这一期的干货:
1、在线游戏类角色素材生成 AI 工具
Asset Generator 是一个专门针对游戏、角色、视觉设计领域的 AI
GPT-4 Turbo更强更便宜,GPTs、GPT商店最大亮点,这是OpenAI首个开发者日
机器之心报道机器之心编辑部真如 Sam Altman 此前所言,OpenAI 首届开发者大会为人们带来了一些非常棒的新东西。继今年春天发布 GPT-4 之后,OpenAI 又创造了一个不眠夜。过去一年,ChatGPT 绝对是整个科技领域最热的词汇。OpenAI 也依靠 ChatGPT 取得了惊人的成绩:总结来说,OpenAI 证实 ChatGPT 目前每周有超过 1 亿活跃用户,超过 200 万开者使用 API 等进行开发,与超过 92% 的财富 500 强公司合作。作为备受期待的首届开发者大会,Altman 今天