资讯列表
RLHF与AlphaGo核心技术强强联合,UW/Meta让文本生成能力再上新台阶
RLHF 与 AlphaGo 的核心技术结合在一起,会碰撞出怎样的火花?
华藏生态体系横空出世,小i机器人给出大模型商业变现范本
今年以来,市场上各类人工智能大模型如雨后春笋,但如何将大模型进行科学的商业变现,成为摆在行业面前的一道难题。在刚刚召开的一场新闻发布会上,小i机器人给出了一份自己的答案。10月26日,小i机器人在上海正式发布了华藏通用大模型生态体系,迈出了通用大模型商业化变现的重要一步。华藏生态以“商业变现”为核心,在华藏通用大模型基础上构建开发者平台,目前已经在多个领域中实现了应用落地。小i集团董事局主席兼CEO袁辉在发布会上指出,“华藏生态将连接成千上万的客户、成千上万的开发者、成千上万的愿意引领人工智能时代的朋友们。我们一起
Midjourney 上线新版网站!搜索功能大提升,使用体验更流畅
Midjourney 上线新版网站!搜索功能大提升,使用体验更流畅大家好,我是花生~
前几天 Midjourney 上线了新版网站,对原有功能进行了优化升级,网页反应速度也比之前快了很多,在整体使用感受上有了明显提升,今天就带大家看看更新的具体内容和一些使用小技巧。
:一、新界面简介
新版网页直达: (需登录后使用)
新的 Midjourney 网站界面比之前更加简洁,在功能布局上有了一些明显的改动,左侧栏上方仅保留了 Explore、My Images 和 Rate Images 三项功能,方便图像的浏览和查找
AI视频生成这么强?带你快速了解发展概况和应用场景!
AI 生成视频发展到什么程度了,效果如何?有哪些可用的产品方案?网上炫酷的效果如何实现?AI 视频的应用场景和案例有哪些?
本着对以上问题的探索,我开启了 AI 视频系列的探索。上篇将着重介绍技术发展概况和应用场景思考。
更多AI视频生成神器介绍:一、技术发展概况
长期以来,人们对 AI 视频技术应用的认知停留在各种“换脸”和视频特效上。随着 AI 图像领域的技术发展,AI 视频技术也逐渐取得了突破。本节内容结合 Claude、Perplexity 查询、项目论文整理而成。
1. 生成方法
从交互方式来看,当前 A
腾讯混元大模型再进化,文生图能力重磅上线,这里是一手实测
2023 年,大模型的落地按下加速键,文生图便是最火热的应用方向之一。自从 Stable Diffusion 诞生以来,海内外的文生图大模型不断涌现,一时有「神仙打架」之感。每一次技术迭代,都带来了模型生成效果和速度的飞速提升。就在今天,腾讯混元大模型也宣布了最新进展:文生图能力正式上线。一上手试用,我们就看到了混元大模型对于博大精深的中餐文化的理解。这里选取了让很多大模型犯难的「蚂蚁上树」,但混元轻松生成:问题来了,现在的文生图大模型这么卷,混元大模型还有没有其他特别的优势?据官方介绍,如果从算法、模型方面来讲,
Nature | 30多年前的断言被打破了?大模型具备了人类水平的系统泛化能力
我们知道,人类具有「举一反三」的能力,即学习一个新概念后立即就能用它来理解相关用法。例如,当小朋友知道如何「跳」,他们就会明白「在房间里跳两次」是什么意思。而对于机器来说,这种能力是极具挑战性的。20 世纪 80 年代末,哲学家和认知科学家 Jerry Fodor 和 Zenon Pylyshyn 认为人工神经网络缺乏系统组合的能力。几十年来,领域内的研究人员一直在努力让神经网络具备一些泛化能力,但能力很有限。因此,关于 Jerry Fodor 和 Zenon Pylyshyn 的观点的争论也一直存在。现在,来自纽
清华光电计算新突破:芯片性能提升万倍,研究登顶Nature
清华大学团队在超高性能计算芯片领域取得新突破,相关研究发表在Nature上。随着各类大模型和深度神经网络的涌现,如何制造出满足人工智能发展、兼具大算力和高能效的下一代 AI 芯片,已成为国际前沿热点。中国科协发布的 2023 重大科学问题中「如何实现低能耗人工智能」 被排在首位。近日,清华大学团队在超高性能计算芯片领域取得新突破。相关成果以《面向高速视觉任务的纯模拟光电计算芯片》(All-analog photo-electronic chip for high-speed vision tasks)为题发表在 N
高精度低成本游戏3D人脸重建方案,腾讯AI Lab ICCV 2023论文解读
3D 人脸重建是一项广泛应用于游戏影视制作、数字人、AR/VR、人脸识别和编辑等领域的关键技术,其目标是从单张或多张图像中获取高质量的 3D 人脸模型。借助摄影棚中的复杂拍摄系统,当前业界成熟方案已可得到媲美真人的毛孔级精度的重建效果 [2],但其制作成本高、周期长,一般仅用于 S 级影视或游戏项目。近年,基于低成本人脸重建技术的交互玩法(如游戏角色捏脸玩法、AR/VR 虚拟形象生成等)受到市场欢迎。用户只需输入日常可获取的图片,如手机拍摄的单张或多张图片,即可快速得到 3D 模型。但现有方法成像质量不可控,重建结
谷歌大爆料:神秘AI工具曝光,Gemini将取代PaLM 2
Stubbs 允许用户直接从 Makersuite 构建和启动由 AI 生成的应用。「大泄露:谷歌代号为 Stubbs 的神秘 AI 工具,刚刚被曝光。」一位 X(原推特)网友惊呼道。最初这一消息来自一位名叫 Bedros Pamboukian 的博主在 Medium 上泄露的,Bedros 表示谷歌将在 Google Makersuite(一款帮助开发者快速构建 AI 程序的工具)上发布一款名为 Stubbs 的新 AI 工具。Stubbs 可以生成、部署甚至发布无代码的 AI 应用程序。此外,他还分享了屏幕截图
可预测蛋白质-配体结合亲和力,之江实验室&百度&港科大团队开发基于曲率的自适应图神经网络
编辑 | 萝卜皮准确预测蛋白质和配体之间的结合亲和力对于药物发现至关重要。图神经网络(GNN)的最新进展在学习蛋白质-配体复合物的表示以估计结合亲和力方面取得了重大进展。为了提高 GNN 的性能,经常需要从几何角度研究蛋白质-配体复合物。虽然「现成的」GNN 可以包含分子的一些基本几何结构,例如距离和角度,通过将复合体建模为同亲图,这些解决方案很少考虑更高级别的几何属性,例如曲率和同源性,以及异亲相互作用。为了解决这些限制,之江实验室、百度大数据以及香港科技大学的研究人员引入了基于曲率的自适应图神经网络(CurvA
AI如何应用到产品视觉设计流程中?来看独角兽团队的实战案例!
前言
目前,人工智能技术的发展已经取得了令人瞩目的成就。不论是自然语言处理还是计算机视觉,人工智能都有了显著的进展。就视觉设计师而言,我们不得不承认 AI 通过不断的算法学习与技术更新,其生成的图像着实令人惊叹,但我们也不难发现,当下 AI 绘图还是有很多的局限性,比如生成质量不稳定、缺乏抽象能力等。
那么本文也将延续前文《AIGC 对设计行业的影响与启发》、《AI 在 UX 设计流程中的应用大全》,继续谈一谈 AI 在视觉设计工作中的应用。一、AI 绘图能代替视觉设计师吗?
在实际使用中我们发现,AI 往往对于具
研究上百个小时,高手总结了这份 DALL-E 3 人物连续性公式(上)
上篇 Dall-E 3 讲了常见的 20 个公式,今天单独来讲一下人物连续性公式,这个公式来自 @AshutoshShrivastava。
上篇回顾:研究了近百个小时,感谢这位伟大的作者,结尾附上该作者链接。一、人物连续性公式
1. 公式总结
Prompt:
[Base Prompt] [additional details / variationinformation] identifer-1
提示:
[基本提示] [额外细节/变量信息] identifer-1
注意:
[基本提示] 可以描述人物的 年龄/
用 AI 做礼物插画,一天搞定一周的量!
嚯,最近的直播礼物项目快截止了,但还剩好多个礼物都没搞定呢。
还好我有 AI,靠着这个方法一天就完成了六七个礼物,今天就与大家分享一下如何快速用 Midjourney 辅助绘制出可落地的礼物。
往期回顾:以下就是我一天完成的礼物。是不是还不错,那怎样的礼物算合格可落地呢?
接下来我就用以下礼物为案例,给大家展示 AI 辅助礼物绘制的全流程。一、MJ 生成
由于礼物受众一般都是女性,所以此次礼物生成对象我们尽量选择偏圆润可爱的,此次我选择的是章鱼烧。
那就遇见了第一个难点,描述。
如果直接使用翻译器,章鱼烧的英文是
LeCun又双叒唱衰自回归LLM:GPT-4的推理能力非常有限,有两篇论文为证
「任何认为自动回归式 LLM 已经接近人类水平的 AI,或者仅仅需要扩大规模就能达到人类水平的人,都必须读一读这个。AR-LLM 的推理和规划能力非常有限,要解决这个问题,并不是把它们变大、用更多数据进行训练就能解决的。」一直以来,图灵奖得主 Yann LeCun 就是 LLM 的「质疑者」,而自回归模型是 GPT 系列 LLM 模型所依赖的学习范式。他不止一次公开表达过对自回归和 LLM 的批评,并产出了不少金句,比如:「从现在起 5 年内,没有哪个头脑正常的人会使用自回归模型。」「自回归生成模型弱爆了!(Aut
手机能跑百亿参数大模型,骁龙8Gen3来了,自研PC架构上线
高通骁龙 8 Gen3 的出现,让生成式 AI 在智能终端无处不在了。安卓旗舰手机的芯片,今天迎来了换新。一年一度的高通骁龙峰会在 10 月 24 日拉开序幕,今年举办地点来到了夏威夷毛伊岛。会上,高通宣布推出最新一代旗舰移动平台骁龙 8 Gen3,并表示其在终端侧 AI 能力、性能和能效等多个方面都有显著提升。简单总结一波,骁龙 8 Gen3 采用台积电 4nm 制程工艺打造(可能是 N4P)。CPU 采用全新 1 5 2 架构,包括 1 个 X4 超大核、3 个 A720 大核 3.15GHz、2 个 A720
低成本快速入局大模型,你需要学下向量数据库
在 ChatGPT 等大语言模型(LLM)盛行的当下,一直不温不火的向量数据库(Vector Data Base ,VectorDB)开始受到大家的关注。一般而言,大模型在回答具有普遍性的问题上游刃有余,但在回答垂直专业的问题上,就显得不那么出色,例如,大模型在医疗行业会存在回答不准确的情况。这时,为大模型配备一个「超级大脑」变得尤为重要,这个「超级大脑」可以存储一些专有知识,这样一来,大模型就能从海量的数据中快速检索出最合适的答案,提高它们的准确性和效率,而向量数据库就充当了「超级大脑」角色。其实,早在 2013
开源版「ChatGPT Plus」来了,能做数据分析、插件调用、自动上网,落地真实世界的智能体
OpenAI ChatGPT Plus 订阅付费功能强大,可以实现高阶「数据分析」(Advanced Data Analysis)、「插件调用」(Plugins)以及「自动网页浏览」(Browse with Bing),能够作为日常生活中的重要生产力工具。可是因为商业原因而选择了闭源,研究者和开发者也只能使用而没有办法在其上面做任何的研究或改进。基于此,来自香港大学、XLang实验室、Sea AI实验室和Salesforce的研究者联合打造了一款用于真实世界生产力工具的开源智能体框架——OpenAgents,并开源
Nature | 一场人工智能革命正在医学领域酝酿,它会是什么样子?
编辑 | 绿萝10 月 24 日,《Nature》发布了一篇题为《An AI revolution is brewing in medicine. What will it look like?》的新闻专稿。文章指出 AI 模型应用于医疗的当前局限性,新兴的通才模型可以克服第一代机器学习工具在临床使用中的一些局限性。为了解决医学人工智能工具的一些局限性,研究人员一直在探索具有更广泛功能的医学人工智能。并介绍了一些大型科技公司在医疗成像的基础模型。Jordan Perchik 在美国阿拉巴马大学伯明翰分校(The U