资讯列表
刚刚,披头士乐队发布「最后一首」新歌,背后是AI制作
《Now and Then》跨越了年龄与生死。熟悉音乐的朋友们,肯定不会对披头士乐队(The Beatles)感到陌生,他们被广泛认为是史上最伟大、最有影响力的摇滚乐队,也是现代摇滚乐的开端。披头士成立于 1960 年,四位成员分别是约翰・列侬、林戈・斯塔尔、保罗・麦卡特尼和乔治・哈里森。1963 年,乐队发行首张音乐专辑《Please Please Me》,1969 年的《Abbey Road》被认为是他们最好的作品。1970 年,乐队宣布解散。正如我们所知,乐队两位成员约翰・列侬、乔治・哈里森已经先后于 198
LeCun、吴恩达等370多人签联名信:严格控制AI是危险的,开放才是解药
这封联名信的名单还在持续更新中。近几日,关于如何监督 AI 的讨论越来越热烈,各位大佬们意见非常不统一。比如图灵奖三巨头 Geoffrey Hinton、Yoshua Bengio、Yann LeCun 就出现了两种观点。Hinton、Bengio 为一队,他们强烈呼吁加强对 AI 的监管,否则可能引发「AI 灭绝人类」的风险。LeCun 与他们的观点并不相同,他认为 AI 强监管必将带来巨头垄断,结果是只有少数公司控制 AI 的研发。为了表达自己的想法,很多人以签署联名信的方式来传达观点,就拿刚刚过去的几天来说,
GPT-4 做「世界模型」,让LLM从「错题」中学习,推理能力显著提升
从错误中学习,不只是人类可以做到。近日有研究发现,大模型其实也可以借鉴这种思路。这段时间,大语言模型在各种 NLP 任务中取得了重大进展,尤其是在需要复杂的思维链(CoT)推理的数学问题方面。比如在 GSM8K、MATH 这样的高难度数学任务的数据集中,包括 GPT-4 和 PaLM-2 在内的专有模型已取得显著成果。在这方面,开源大模型还有相当的提升空间。为了进一步提高开源大模型处理数学任务的 CoT 推理能力,一种常见的方法是使用注释 / 生成的问题 - 推理数据对( CoT 数据)对这些模型进行微调,这些数据
网易数帆品牌战略升级:“产品+工程+人才”助力企业构建数智竞争力
智能化浪潮正奔涌而来,数字化和智能化不仅改变着公众的工作和生活,也为产业带来无限想象。11月2日,在“数智聚力,共赴新程”为主题的2023网易数字 大会上,网易数帆宣布全新品牌战略,将定位于“数智软件生产引领者”,提出数智生态方法论,以“产品 工程 人才”为核心,为每一个组织构建独特的数智竞争力。围绕此,网易数帆发布产品、生态、人才培养等多领域、多维度的升级创新,与伙伴、客户共赢数智新时代!在大会开场,杭州市经信局副局长杨晓勇致辞,他肯定了网易多年来为杭州数字经济建设贡献了重要力量,并表示网易数字 大会是网易和杭州
研究上百个小时,高手总结了这份 DALL-E 3 人物连续性公式(下)
根据前两篇学习,如何创建人物连续性公式,或多或少都会联想到 Midjourney 里面的 Seed 值,是否能运用到 Dall e3 里面,那么今天这篇文章更新来了!!
继续感谢这位伟大的作者:@AshutoshShrivastava,地址链接请看前两篇内容。一、DALL-E-3 最重要的功能更新
1. 如何使用种子值
如果您已经使用 DALL-E-3 工作,您应该知道以前种子号码是无法更改的,固定在 5000。
然而今天发现我们实际上可以指定种子号码。这意味着,通过相同的提示和种子,您可以在不同的实例中一致地生成
超强性能,提前24h准确预测,谷歌团队发布新的天气预测模型MetNet-3
编辑 | ScienceAI预测降水、温度和风等天气变量对于社会生产生活至关重要。随着更多的极端天气出现,比如洪水、干旱和热浪等,准确的预报对于准备和减轻其影响尤为重要。未来的前 24 小时很关键,因为它们具有高度可预测性和可操作性,可以帮助人们及时做出明智的决策并保证安全。深度神经网络为天气条件建模提供了另一种范例。一旦数据可用,神经模型就能在不到一秒的时间内做出预测,并且具有非常高的时间和空间分辨率,以及直接从大气观测中学习的能力。使用大气观测、最高保真度和最低延迟数据训练的神经模型,与最先进的概率数值天气预报
性能全面超越LLaMA2,0门槛商用,这个国产大模型要改变开源竞争格局了
开源大模型领域的进化节奏,越来越快。今年 7 月,Meta 开源了 LLaMA2,以强大的性能和免费商用的特质,受到了开发者和众多企业的拥护。基于 LLaMA2 各个版本微调的落地成果不断涌现,大模型领域的竞争格局迅速发生变化。业界普遍认为,在开源大模型的攻势下,一部分闭源大模型厂商的「护城河」将慢慢瓦解。难以负担大模型 API 高昂调用成本的中小企业和开发者,有了另一条更具性价比的出路。与此同时,国产大模型开源力量也在技术上不断追赶加速。近日,一项重磅开源吸引了领域内的高度关注:昆仑万维大语言模型「天工」Skyw
用FP8训练大模型有多香?微软:比BF16快64%,省42%内存
低精度训练是大模型训练中扩展模型大小,节约训练成本的最关键技术之一。相比于当前的 16 位和 32 位浮点混合精度训练,使用 FP8 8 位浮点混合精度训练能带来 2 倍的速度提升,节省 50% - 75% 的显存和 50% - 75% 的通信成本,而且英伟达最新一代卡皇 H100 自带良好的 FP8 硬件支持。但目前业界大模型训练框架对 FP8 训练的支持还非常有限。最近,微软提出了一种用于训练 LLM 的 FP8 混合精度框架 FP8-LM,将 FP8 尽可能应用在大模型训练的计算、存储和通信中,使用 H100
微软免费课程、吴恩达开新课,顶级生成式AI必备课程来了
你准备好了吗?开启新一轮的学习之旅。在生成式 AI 盛行的当下,你是否被这种技术所折服,例如输入一段简简单单的文字,转眼之间,一幅精美的图片,又或者是文笔流畅的文字就展现在你的面前。相信很多人有这种想法,认为生成式 AI 深不可测,没有系统的课程讲解是 get 不到其中的精髓的。假如有科技公司或知名学者来帮助完成这项任务,可谓是利好广大研究者。那么,作为一个初学者,该如何入门呢?近日,微软推出了一门专为初学者打造的关于生成式 AI 的课程,该课程内容丰富,包括 LLM 简介、提示工程基础知识、构建文本生成 / 聊天
支持二次编辑、导入虚拟引擎5,Stable Diffusion进化出3D生成功能
从 2D 到 3D 图像生成,Stability AI 的文生图 Stable Diffusion 平台迎来了进化。说到文生图大模型,Stability AI 在 2022 年推出的 Stable Diffusion 可谓是其中的翘楚,不断地为富有创意的故事讲述者提供他们所需要的 AI 工具。不过,该模型主要用于 2D 图像生成。今天,Stability AI 向我们展示了更多图像增强功能,生成了更美观的图像、同时也更便宜、速度更快。更重要的是,现在有了可以搞定任何类型 3D 内容创建的新工具了。具体来讲,Stab
GPT-4能「伪装」成人类吗?图灵测试结果出炉
纯文本对话,安能辩我是 AI?在测试 AI 时,图灵测试是一个饱受争议但也久负盛名的评估方法,因此总会有研究者不畏繁琐,对新兴的语言模型进行图灵测试。近日,对 GPT-4 的图灵测试结果新鲜出炉了。 此图由AI生成「机器能够思考吗?」为了解答这个问题,图灵设计了一个能间接提供答案的模仿游戏。该游戏的最初设计涉及到两位见证者(witness)和一位审问者(interrogator)。两位见证者一个是人类,另一个是人工智能;他们的目标是通过一个纯文本的交互
vivo发布蓝心大模型,手机端运行且开源,自研系统亮相
大语言模型,vivo 也做到了几个「业内第一」。国内头部手机厂商,最近正在集中发布通用大模型和自研操作系统,而 vivo 正在把两者高度融合在一起。11 月 1 日,vivo 在 2023 开发者大会上正式发布了自研 AI 大模型「蓝心 BlueLM」和全平台自研操作系统「蓝河 BlueOS」。与此同时,最新一代手机系统 OriginOS 4 也进行了正式亮相。「经过多年的准备,今天 vivo 发布自研大模型矩阵,其中也包含手机行业内的首个开源大模型。」vivo 高级副总裁、首席技术官施玉坚说道。「我们的自研大模型
大模型重塑AI人才,人才领跑产业应用,百度AICA为产业AI人才加速
10月28日,由深度学习技术及应用国家工程研究中心与百度联合创办的 AICA 首席AI架构师培养计划,迎来第7期毕业典礼,88位学员获得AI架构师认证。截至目前,AICA已累计为业界培养了410位产业AI领军人才。同时,AICA第7期毕业学员约有三分之一聚焦大模型产业应用课题并取得先期成果。百度文心大模型已深入金融、制造、能源、交通等广泛行业场景,为产业智能化加速。图:百度AICA首席AI架构师培养计划第七期毕业典礼合影毕业典礼上,百度集团副总裁、深度学习技术及应用国家工程研究中心副主任吴甜在致辞时表示,AICA的
如何用 Midjourney 生成数字/字母?我总结了5个超实用的技巧
大家好,这里是和你们一起探索 AI 绘画的花生~
前几天交流群里有小伙伴在问关于用 Midjourney 生成数字的问题,说不好控制,总是得不到想要的效果。的确,目前想用 Midjourney 直接生成准确的数字或字母是比较难的,需要多次调整和尝试才能做到,今天就为大家分享我自己常用的几个技巧,可以有效提升数字或字母的生成准确率。
上期回顾:一、寻找优质提示词资源
用 Midjourney 出图时,大家应该都是将自己想要的效果写成提示词然后发送出去,再根据生成结果修改提示词。但一个更好用的方法是,我们可以先去搜索一
更高准确性,覆盖蛋白、核酸、复合物等更多分子,DeepMind发布AlphaFold新版本
编辑 | ScienceAI自 2020 年发布以来,AlphaFold 彻底改变了人们对蛋白质及其相互作用的理解方式。Google DeepMind 和 Isomorphic Labs 一直在共同努力,为更强大的 AI 模型奠定基础,将覆盖范围从蛋白质扩展到全方位的生物相关分子。2023 年 10 月 31 日,该研究团队分享了下一代 AlphaFold 的最新进展。其最新的模型现在可以对蛋白质数据库 (PDB) 中的几乎所有分子进行预测,通常达到原子精度。新版模型 AlphaFold-latest (暂称)极大
全球最强长文本大模型,一次可读35万汉字:Baichuan2-192K上线
大模型看书,从来没有这么快过。国内大模型创业公司,正在技术前沿创造新的记录。10 月 30 日,百川智能正式发布 Baichuan2-192K 长窗口大模型,将大语言模型(LLM)上下文窗口的长度一举提升到了 192K token。这相当于让大模型一次处理约 35 万个汉字,长度达到了 GPT-4(32K token,约 2.5 万字)的 14 倍,Claude 2.0(100K token,约 8 万字) 的 4.4 倍。换句话说,Baichuan2-192K 可以一次性读完一本《三体 2》,是全球处理上下文窗口
吴恩达加入图灵奖得主讨论:「AI灭绝论」弊大于利
现在双方 2:2 了。关于「AI灭绝论」引发的一系列争论,各路大佬们又吵起来了。这次加入争吵的是著名人工智能学者、斯坦福大学计算机科学系教授吴恩达。在此之前,深度学习三巨头 Geoffrey Hinton、Yoshua Bengio、Yann LeCun 的辩论已经开始。Hinton 和 Bengio 的观点基本一致,他们认为需要加强对 AI 技术的监管,例如,就在前几日, Hinton 和 Bengio 等再发联名信《在快速发展的时代管理人工智能风险》,呼吁在开发 AI 系统之前,研究者应该采取紧急治理措施,将安
GPT-4写代码,DALL·E 3+MJ搞定画面,AI版「愤怒的南瓜」来袭
这个「愤怒的南瓜」游戏玩起来简单,创建起来却需要一些诀窍。自 GPT 系列对话大模型以及 DALL・E、Midjourney 等文生图大模型兴起以来,基于它们的硬核、有趣二创应用花样频出,让普通人切身地体验到了大模型的魅力。今天又一个这样的游戏项目引起了我们的注意。推特用户 @javilopen 使用 GPT-4、DALL・E 3 和 Midjourney 编写了小游戏「愤怒的南瓜」(PS:如有雷同纯属巧合),其中 GPT-4 负责所有的编码工作,DALL・E 3 和 Midjourney 负责图形部分。游戏画面、