资讯列表
解决LLaMA、BERT等部署难题:首个4-bit浮点量化LLM来了
这篇文章给出了大模型 FP 量化的解决方案。大语言模型 (LLM) 压缩一直备受关注,后训练量化(Post-training Quantization) 是其中一种常用算法,但是现有 PTQ 方法大多数都是 integer 量化,且当比特数低于 8 时,量化后模型的准确率会下降非常多。想较于 Integer (INT) 量化,Floating Point (FP) 量化能更好的表示长尾分布,因而越来越多的硬件平台开始支持 FP 量化。而这篇文章给出了大模型 FP 量化的解决方案。文章发表在 EMNLP 2023 上
保姆级教程!Stable Diffusion LoRA模型训练教程(新手篇)
本篇文章仅整理归纳我的LoRA训练思路及步骤,以及自己遇到的问题和解决方案的复盘整理。希望对新手炼丹师们有所启发和帮助。
LoRA 相关干货:
哼两句就能变歌曲,还有国宝歌手帮你演绎,音乐 Dall·E 2 时刻来了
机器之能报道编辑:Sia一个模型 两个功能=仅从文本提示就能生成引人入胜的音乐和歌声。你是否有过这样的体验,脑海不时冒出各种旋律,却因对乐器一窍不通,无法将这些创意释放出来?今天 ,YouTube 和 Google DeepMind 强强联合推出的新服务能让你的创意和音乐实现无缝转化。在 Google DeepMind 提供的最复杂的 AI 音乐生成系统 Lyria 帮助下,YouTube 正在测试新的音乐生成功能:仅用文本提示或者简单哼唱几句,AI 就能立刻生成一段引人入胜的音乐或歌曲。最先推出的一个服务叫 Dr
通过深度学习预测离散时间分岔
编辑 | 白菜叶许多自然和人造系统都容易发生关键转变——动态方面的突然且可能具有破坏性的变化。深度学习分类器可以通过从大型模拟训练数据集中学习分叉的通用特征,为关键转变提供预警信号。到目前为止,分类器仅被训练来预测连续时间分岔,忽略了离散时间分岔所特有的丰富动态。在这里,麦吉尔大学(McGill University)Thomas M. Bury 的研究团队训练一个深度学习分类器,为余维一的五个局部离散时间分岔提供预警信号。他们使用生理学、经济学和生态学中使用的离散时间模型的模拟数据以及经历倍周期分岔的自发跳动的鸡
2023 戈登贝尔奖揭晓:Frontier 超算「量子级精度」材料模拟获奖
编辑 | 泽南、杜伟戈登贝尔奖(ACM Gordon Bell Prize)设立于 1987年,由美国计算机学会颁发,被称为超算界的「诺贝尔奖」。该奖项每年颁发一次,用以表彰高性能计算领域取得的杰出成就。奖金 1 万美元,由高性能和并行计算领域先驱戈登·贝尔提供。近日,在全球超级计算大会 SC23 上,2023年ACM 戈登贝尔奖授予了美国和印度研究人员组成的 8 人国际团队,他们实现了大规模量子精度的材料模拟。相关项目名称为「量子精度的大规模材料建模:金属合金中准晶体和相互作用扩展缺陷的从头计算模拟」。团队成员分
台式PC上可运行,DeepMind天气AI以0.25°分辨率预测全球10天内数百个天气变量,仅1分钟
编辑 | 萝卜皮全球中期天气预报对于许多社会和经济领域的决策至关重要。传统的数值天气预报使用增加的计算资源来提高预报精度,但无法直接使用历史天气数据来改进基础模型。Google DeepMind 团队介绍了「GraphCast」,一种直接从再分析数据训练的基于机器学习的方法。它可以在一分钟内以 0.25° 的分辨率预测全球 10 天内的数百个天气变量。研究人员用 1380 个验证目标进行了测试,GraphCast 在 90% 的验证目标中显著优于当前最准确的操作确定性系统,其预测支持更好的严重事件预测,包括热带气旋
数因智科袁野:CINS模型依据单细胞数据揭示细胞间互动的秘密
编辑 | X随着单细胞测序技术的发展,我们能够在单个细胞水平上观察基因表达,这就像是能够听到一个巨大合唱团中每个人的声音,但是如何理解这些细胞之间的交流和合作却是一个并不容易解决的问题。如在肿瘤生物学中,肿瘤细胞与其周围的微环境中的细胞(如免疫细胞、纤维细胞和血管细胞)之间存在复杂的相互作用,这些相互作用对于肿瘤的生长、转移和治疗反应都至关重要。如果我们能够研究清楚这些相互作用网络,就可能找到新的治疗方法,比如靶向微环境中的特定细胞或通讯通路的药物分子。数因智科创始人袁野博士发表于期刊PLoS Computatio
该更新啦!6款超好用的SDXL负面提示词Embedding模型
大家好我是花生~
SDXL 1.0 模型发布以来,优质的 SDXL 大模型不断涌现,让图像的生成质量越来越高。但版本迭代后,之前的 SD1.5 的负面提示词 Embedding 并不能和 SDXL 大模型配合使用,而每次都输入一大串的反向提示词又实在麻烦。所以今天就继续给大家推荐 6 款可以配合 SDXL 模型使用的负面提示词 Embedding,它们可以在 SD WebUI 和 ComfyUI 中使用,能有效修复图像缺陷,提升画面细节和质感。
上期回顾:一、UnaestheticXL
链接直达: (文末有资源包
一句话秒出4K高清大片,视频生成Gen-2重磅更新又炸了
机器之能报道编辑:咚咚锵难以置信的高清、流畅、稳定,视频效果震撼人心。「我坚信 2023 年会是属于视频生成模型的一年。」总部位于纽约的当红生成式 AI 视频初创公司 Runway CEO 预测。今天,这家喜欢创造不可能的公司再次应验这一预言——Runway 当家 AI 视频生成工具 Gen-2 迎来重大更新,结果又是一个王炸!现在,你仅需一句简单输入,即刻获得高达 4K 水平的高保真视频。效果有多惊艳?官方视频为证,先睹为快。Gen-2史诗级更新目前 AI 生成的视频存在两个主要的问题:首先,单帧并不完全逼真;其
一句输入、秒出 3D 全景,自由打造你的VR世界
机器之能报道编辑:佳琪、大盘鸡用 AIGC 工具体验虚拟世界奇妙游。精美的游戏场景与卓越的视觉效果让玩家在虚拟世界中流连忘返。然而,想要搭建出想象中的画面,无疑需要消耗大量成本。相比于 2D 场景,3D 场景的生成需要原画、建模、渲染、优化等重重考验,难度更是层层累积。想要开发出一个 3D 游戏更是难上加难。不过,新的工具出现了,不需要复杂的步骤,也不需要高昂的成本,只需几笔、几句话,就能让想象成为真正的游戏环境。Blockade Labs 新推出的 Skybox AI 就能做到这一点。使用者无需设计或代码基础,也
「OpenAI春晚」对我们意味着什么?比尔·盖茨亲笔撰文讲透了
机器之能报道编辑:吴昕这篇文章发布时间正好在OpenAI首届开发者大会(也被一些人称为开发者的春晚)之后,盖茨显然也了解发布会内容,在这篇文章中,他对GPT技术将走向何方以及将如何影响我们的生活做了最通俗易懂的解读。今天,我仍然和创办微软时一样热爱软件。软件在之后几十年里有了很大改进,但在许多方面仍然相当笨拙。在电脑上执行任何任务,必须告诉设备使用哪个应用程序。你可以用 Microsoft Word 和 Google Docs 起草商业计划书,但它们无法为你发送电子邮件、分享自拍、分析数据、安排聚会或购买电影票。即
OpenAI CEO:GPT-5在开发中,拟进一步向微软寻求资金支持
机器之能报道编辑:吴昕公司还在开发下一代人工智能模型 GPT-5,可能比它的前辈更复杂。他没有承诺发布时间表, 不过通向 AGI 之路还需要更多的数据、资金和芯片。据《金融时报》消息,OpenAI 计划从其最大的投资者微软那里获得进一步的资金支持。因其 CEO Sam Altman 正在推进创建通用人工智能 (AGI) 的愿景——与人类一样智能的计算机软件。 Altman 在接受英国《金融时报》采访时表示,公司与微软 CEO 萨蒂亚·纳德拉的合作关系「运作得非常好」,他预计「随着时间推移,将从这家科技巨头和其他投资
被谷歌收购后,我终于知道为什么大模型竞争落后于OpenAI了
机器之能报道编辑:sia俨然一部豪门生存指南。2018 年 3 月,一家科技教育初创 Socratic 被谷歌收购。当时这家仅 10 人的小公司打造了一款家庭作业助手(也被国内媒体称为海外「作业帮」)——学生拍下家庭作业的问题,助手就能帮助解答。除了数学,Socratic 还可以解决科学、文学、社会研究等学科的问题。「一入豪门深似海」,成为谷歌旗下一款产品后,Socratic 历经了一系列变化,并以谷歌的方式重建自身。如今,Socratic 在豪门争斗中活了下来,每年处理大约 50 亿次查询,但距离创业团队愿景中的
Copilot 正在吞噬世界,与 ChatGPT 一起
机器之能报道编辑:SIa2023 年属于 AI (尤其是生成式 AI ),几乎每个人都或多或少尝试过大型语言模型 ( LLM ),无论是教师、政客、脱口秀甚至儿童活动支持人。凭借每周超过 1 亿的活跃用户,ChatGPT 跻身当之无愧的顶流。不过,很多日常用例只触及了可能性表面。透过表面,那些真正从事技术工作的人们正在使用广泛 AI 工具来改造产品、重构业务,或者以前所未有的方式提供客户体验.......至少,大家承诺如此。那么,真实情况是什么呢?8月,低代码开发平台独角兽 Retool 对 1,578 名技术人员
BCG联手哈佛,史无前例验证GPT-4是把双刃剑,OpenAI总裁转发
机器之能报道编辑:吴昕比尔·盖茨说 GenAI 将彻底变革人类知识工作,但终归是一个预测。经验层面,没有人真正了解最先进的大型语言模型(如 GPT-4)的全部功能。没有人真正知道使用它们的最佳方法,或者它们在什么条件下会失败。我们手里没有使用手册。在某些任务上,GenAI 非常强大,但在其他任务上又会或完全或微妙地失败。除非经常使用 GenAI,否则你都搞不清楚自己遇到的到底是哪种情况。最近,OpenAI 总裁 Greg Brockman 转发了一项被顶尖咨询公司波士顿咨询集团( BCG )称为「史无前例」的实证研
有人要做「AI 科学家」,每天刷上万篇论文还能提出假设,前谷歌董事长背书
机器之能报道编辑:sia当今生物学的根本瓶颈不仅仅是数据或计算能力,还有人类的局限性:没有一个科学家有时间设计数以万计的假设,阅读完每天发表的数千篇生物学论文。如果在 19 世纪之前的科学和自然主义作品集,(比如英国皇家学会档案、植物学之父泰奥弗拉斯托斯的《植物探究》、亚里士多德的《动物志》、收集标本的照片)上训练一个 LLM,它会不会像达尔文那样悟出进化论这个大胆假设?这是《大西洋月刊》记者采访 OpenAI CEO Sam Altman 时抛出的一个问题。「我想尝试一下,我相信答案是肯定的,」Altman 当时
0.6秒出图!手机跑Stable Diffusion创下最快速度,而这仅仅是开始
如今,随着将大模型塞进手机的进程加快,普通用户也能亲自体验生成式 AI 的魅力了。2023 已经行至尾声,这一年大模型和生成式 AI 成为人工智能圈的主流趋势。自 ChatGPT 出现以来,各式各样通用、专业的 AI 大模型层出不穷,喷涌之势已经不可阻挡。随着量化、网络剪枝和知识蒸馏等模型压缩技术进步,手机等终端设备 AI 算力持续增强,大模型在云端部署之外正在向终端落地迈进。对于这场已经拉开了序幕的「终端侧革命」,芯片巨头和手机厂商们成为主力军,他们不断尝试在手机等终端设备上部署运行生成式 AI 大模型,时不时给
微软深夜放大招:GPT-4 、DALL·E 3、GPTs免费用,自研大模型专用AI芯片
今天凌晨,微软公司召开最新一场 Ignite 大会,CEO 萨提亚・纳德拉在大会上介绍了 100 多项产品和技术的发布与更新,涉及范围非常广泛,包括应用、生产力以及安全性等多个方面。Microsoft Ignite 是该公司为开发人员和 IT 专业人士举办的年度会议,而生成式 AI 的一切无疑是本年度的最大热点。不出意外,在本次大会上,我们看到了来自 Bing Chat、专用 AI 芯片、Windows、Microsoft 365 和 Azure 等业务的最新动态。大会现场还请来了英伟达创始人黄仁勋,之后微软会将