资讯列表

Nature | 30多年前的断言被打破了?大模型具备了人类水平的系统泛化能力

我们知道,人类具有「举一反三」的能力,即学习一个新概念后立即就能用它来理解相关用法。例如,当小朋友知道如何「跳」,他们就会明白「在房间里跳两次」是什么意思。而对于机器来说,这种能力是极具挑战性的。20 世纪 80 年代末,哲学家和认知科学家 Jerry Fodor 和 Zenon Pylyshyn 认为人工神经网络缺乏系统组合的能力。几十年来,领域内的研究人员一直在努力让神经网络具备一些泛化能力,但能力很有限。因此,关于 Jerry Fodor 和 Zenon Pylyshyn 的观点的争论也一直存在。现在,来自纽

清华光电计算新突破:芯片性能提升万倍,研究登顶Nature

清华大学团队在超高性能计算芯片领域取得新突破,相关研究发表在Nature上。随着各类大模型和深度神经网络的涌现,如何制造出满足人工智能发展、兼具大算力和高能效的下一代 AI 芯片,已成为国际前沿热点。中国科协发布的 2023 重大科学问题中「如何实现低能耗人工智能」 被排在首位。近日,清华大学团队在超高性能计算芯片领域取得新突破。相关成果以《面向高速视觉任务的纯模拟光电计算芯片》(All-analog photo-electronic chip for high-speed vision tasks)为题发表在 N

高精度低成本游戏3D人脸重建方案,腾讯AI Lab ICCV 2023论文解读

3D 人脸重建是一项广泛应用于游戏影视制作、数字人、AR/VR、人脸识别和编辑等领域的关键技术,其目标是从单张或多张图像中获取高质量的 3D 人脸模型。借助摄影棚中的复杂拍摄系统,当前业界成熟方案已可得到媲美真人的毛孔级精度的重建效果 [2],但其制作成本高、周期长,一般仅用于 S 级影视或游戏项目。近年,基于低成本人脸重建技术的交互玩法(如游戏角色捏脸玩法、AR/VR 虚拟形象生成等)受到市场欢迎。用户只需输入日常可获取的图片,如手机拍摄的单张或多张图片,即可快速得到 3D 模型。但现有方法成像质量不可控,重建结

谷歌大爆料:神秘AI工具曝光,Gemini将取代PaLM 2

Stubbs 允许用户直接从 Makersuite 构建和启动由 AI 生成的应用。「大泄露:谷歌代号为 Stubbs 的神秘 AI 工具,刚刚被曝光。」一位 X(原推特)网友惊呼道。最初这一消息来自一位名叫 Bedros Pamboukian 的博主在 Medium 上泄露的,Bedros 表示谷歌将在 Google Makersuite(一款帮助开发者快速构建 AI 程序的工具)上发布一款名为 Stubbs 的新 AI 工具。Stubbs 可以生成、部署甚至发布无代码的 AI 应用程序。此外,他还分享了屏幕截图

可预测蛋白质-配体结合亲和力,之江实验室&百度&港科大团队开发基于曲率的自适应图神经网络

编辑 | 萝卜皮准确预测蛋白质和配体之间的结合亲和力对于药物发现至关重要。图神经网络(GNN)的最新进展在学习蛋白质-配体复合物的表示以估计结合亲和力方面取得了重大进展。为了提高 GNN 的性能,经常需要从几何角度研究蛋白质-配体复合物。虽然「现成的」GNN 可以包含分子的一些基本几何结构,例如距离和角度,通过将复合体建模为同亲图,这些解决方案很少考虑更高级别的几何属性,例如曲率和同源性,以及异亲相互作用。为了解决这些限制,之江实验室、百度大数据以及香港科技大学的研究人员引入了基于曲率的自适应图神经网络(CurvA

AI如何应用到产品视觉设计流程中?来看独角兽团队的实战案例!

前言 目前,人工智能技术的发展已经取得了令人瞩目的成就。不论是自然语言处理还是计算机视觉,人工智能都有了显著的进展。就视觉设计师而言,我们不得不承认 AI 通过不断的算法学习与技术更新,其生成的图像着实令人惊叹,但我们也不难发现,当下 AI 绘图还是有很多的局限性,比如生成质量不稳定、缺乏抽象能力等。 那么本文也将延续前文《AIGC 对设计行业的影响与启发》、《AI 在 UX 设计流程中的应用大全》,继续谈一谈 AI 在视觉设计工作中的应用。一、AI 绘图能代替视觉设计师吗? 在实际使用中我们发现,AI 往往对于具

研究上百个小时,高手总结了这份 DALL-E 3 人物连续性公式(上)

上篇 Dall-E 3 讲了常见的 20 个公式,今天单独来讲一下人物连续性公式,这个公式来自 @AshutoshShrivastava。 上篇回顾:研究了近百个小时,感谢这位伟大的作者,结尾附上该作者链接。一、人物连续性公式 1. 公式总结 Prompt: [Base Prompt] [additional details / variationinformation] identifer-1 提示: [基本提示] [额外细节/变量信息] identifer-1 注意: [基本提示] 可以描述人物的 年龄/

用 AI 做礼物插画,一天搞定一周的量!

嚯,最近的直播礼物项目快截止了,但还剩好多个礼物都没搞定呢。 还好我有 AI,靠着这个方法一天就完成了六七个礼物,今天就与大家分享一下如何快速用 Midjourney 辅助绘制出可落地的礼物。 往期回顾:以下就是我一天完成的礼物。是不是还不错,那怎样的礼物算合格可落地呢? 接下来我就用以下礼物为案例,给大家展示 AI 辅助礼物绘制的全流程。一、MJ 生成 由于礼物受众一般都是女性,所以此次礼物生成对象我们尽量选择偏圆润可爱的,此次我选择的是章鱼烧。 那就遇见了第一个难点,描述。 如果直接使用翻译器,章鱼烧的英文是

LeCun又双叒唱衰自回归LLM:GPT-4的推理能力非常有限,有两篇论文为证

「任何认为自动回归式 LLM 已经接近人类水平的 AI,或者仅仅需要扩大规模就能达到人类水平的人,都必须读一读这个。AR-LLM 的推理和规划能力非常有限,要解决这个问题,并不是把它们变大、用更多数据进行训练就能解决的。」一直以来,图灵奖得主 Yann LeCun 就是 LLM 的「质疑者」,而自回归模型是 GPT 系列 LLM 模型所依赖的学习范式。他不止一次公开表达过对自回归和 LLM 的批评,并产出了不少金句,比如:「从现在起 5 年内,没有哪个头脑正常的人会使用自回归模型。」「自回归生成模型弱爆了!(Aut

手机能跑百亿参数大模型,骁龙8Gen3来了,自研PC架构上线

高通骁龙 8 Gen3 的出现,让生成式 AI 在智能终端无处不在了。安卓旗舰手机的芯片,今天迎来了换新。一年一度的高通骁龙峰会在 10 月 24 日拉开序幕,今年举办地点来到了夏威夷毛伊岛。会上,高通宣布推出最新一代旗舰移动平台骁龙 8 Gen3,并表示其在终端侧 AI 能力、性能和能效等多个方面都有显著提升。简单总结一波,骁龙 8 Gen3 采用台积电 4nm 制程工艺打造(可能是 N4P)。CPU 采用全新 1 5 2 架构,包括 1 个 X4 超大核、3 个 A720 大核 3.15GHz、2 个 A720

低成本快速入局大模型,你需要学下向量数据库

在 ChatGPT 等大语言模型(LLM)盛行的当下,一直不温不火的向量数据库(Vector Data Base ,VectorDB)开始受到大家的关注。一般而言,大模型在回答具有普遍性的问题上游刃有余,但在回答垂直专业的问题上,就显得不那么出色,例如,大模型在医疗行业会存在回答不准确的情况。这时,为大模型配备一个「超级大脑」变得尤为重要,这个「超级大脑」可以存储一些专有知识,这样一来,大模型就能从海量的数据中快速检索出最合适的答案,提高它们的准确性和效率,而向量数据库就充当了「超级大脑」角色。其实,早在 2013

开源版「ChatGPT Plus」来了,能做数据分析、插件调用、自动上网,落地真实世界的智能体

OpenAI ChatGPT Plus 订阅付费功能强大,可以实现高阶「数据分析」(Advanced Data Analysis)、「插件调用」(Plugins)以及「自动网页浏览」(Browse with Bing),能够作为日常生活中的重要生产力工具。可是因为商业原因而选择了闭源,研究者和开发者也只能使用而没有办法在其上面做任何的研究或改进。基于此,来自香港大学、XLang实验室、Sea AI实验室和Salesforce的研究者联合打造了一款用于真实世界生产力工具的开源智能体框架——OpenAgents,并开源

Nature | 一场人工智能革命正在医学领域酝酿,它会是什么样子?

编辑 | 绿萝10 月 24 日,《Nature》发布了一篇题为《An AI revolution is brewing in medicine. What will it look like?》的新闻专稿。文章指出 AI 模型应用于医疗的当前局限性,新兴的通才模型可以克服第一代机器学习工具在临床使用中的一些局限性。为了解决医学人工智能工具的一些局限性,研究人员一直在探索具有更广泛功能的医学人工智能。并介绍了一些大型科技公司在医疗成像的基础模型。Jordan Perchik 在美国阿拉巴马大学伯明翰分校(The U

DISC-FinLLM:复旦大学团队发布中文智慧金融系统,采用多专家微调框架

金融领域为自然语言处理(NLP)模型带来了独特的挑战和机遇。当前,金融文本和数据的信息量和复杂性呈现爆炸式增长,一个强大、可靠的智慧金融系统可以满足多种不同用户群体的金融需要,例如辅助金融从业者完成行业分析、时事解读、金融计算、统计分析工作,为金融科技开发者完成情感分析、信息抽取任务,帮助学生解答金融问题等,从而有效地提高金融领域工作和学习的效率。金融领域本身具有高度的专业性,语言模型一方面要处理复杂的金融语言,另一方面要保证知识储备的实时性和对金融文本内数据计算的准确性,故而过往的模型通常无法在该领域提供令人满意

讯飞星火升级 3.0:整体超越 ChatGPT,2024 年将实现对标 GPT-4

距离上一个大版本仅两个月过去,科大讯飞在 1024 对外正式推出讯飞星火认知大模型 3.0 版本。今年 5 月,讯飞星火认知大模型刚刚面世时,科大讯飞董事长刘庆峰曾立下 Flag:10 月 24 日,星火认知大模型的能力要全面对标 ChatGPT。在今天的发布会上,刘庆峰对外正式宣告,星火 V3.0 已经实现全方位超越 ChatGPT,在中文上实现全面超越,在英文上实现对标。相较于上一个版本,讯飞星火 3.0 版本在文本生成、语言理解,知识问答、逻辑推理、数学能力、代码能力、多模态能力等七大核心能力上继续升级,并且

公开出售GitHub star、Kaggle点赞,「黑市」越来越明目张胆了吗?

Star 量可以真真假假,但别人用不用、用得好不好最终还是要看项目本身的含金量。在开发者的世界中,判断一个项目火不火、受不受欢迎,GitHub 的 star 量是一个非常重要的指标。比如 AI 大模型宇宙的基石模型 transformers 在 GitHub 上已经获得了 100k 以上的 star。可以说,开发者在 GitHub 上创建项目,提交代码,与其他人分享交流,构建了独属于开发者的社交网络。GitHub 更是成为了开发者神器,还被戏称为「全球最大同性交友网站」。不过,根据今天 Wired 的一篇报道,Gi

大咖云集,看点前瞻:蚂蚁集团主办CNCC2023五大论坛

2023 年 10 月 26-28 日,第二十届中国计算机大会(CNCC2023)将于沈阳举行。CNCC 由中国计算机学会(CCF)主办,是计算领域学术、技术、产业、教育各界宏观探讨发展趋势的年度盛会,为展示学术成果与技术创新搭建平台,促进各界交流合作,加快科研成果转换。本届 CNCC2023 大会以“发展数字基础设施,支撑数字中国建设”为主题,线下参会人数预计达万人。蚂蚁集团作为本次大会合作单位将主办五大论坛,重点关注数据安全与产学研深度融合,邀请多位学者专家到场分享,洞见计算领域新技术,共话数字发展新态势。论坛

RLHF模型普遍存在「阿谀奉承」,从Claude到GPT-4无一幸免

AI 助手经过训练,可以给出人类喜欢的回答,该研究表明,这些 AI 系统通常会产生奉承人类的响应,但这些响应并不完全准确。通过分析表明,人类的反馈有助于这种行为。不管你是身处 AI 圈还是其他领域,或多或少的都用过大语言模型(LLM),当大家都在赞叹 LLM 带来的各种变革时,大模型的一些短板逐渐暴露出来。例如,前段时间,Google DeepMind 发现 LLM 普遍存在「奉承( sycophantic )」人类的行为,即有时人类用户的观点客观上不正确,模型也会调整自己的响应来遵循用户的观点。就像下图所展示的,