资讯列表
Stable Diffusion ComfyUI 基础教程(八):如何使用 Controlnet
一、前言
终于到了最激动人心的时刻,我们使用 Stable Diffusion 最重要的就是他的可控性,其中 Controlnet(控制网络)的作用居功至伟,它可以引入更多的条件来让我们出图更加可控。
往期回顾:在最开始之前我们需要安装 Controlnet 预处理器插件以及下载 Controlnet 模型:
①Controlnet 预处理器插件:插件地址:
如果安装后,运行 ComfyUI 显示无法导入插件
请运行“ComfyUI\custom_nodes\comfyui_controlnet_aux”目录下的
讯飞星火V3.5正式发布,基于全国产算力平台“飞星一号”训练
1月30日,科大讯飞举行星火认知大模型V3.5升级发布会。科大讯飞董事长刘庆峰、研究院院长刘聪正式发布基于首个全国产算力训练的讯飞星火V3.5。2023年10月24日,科大讯飞携手华为,宣布首个支撑万亿参数大模型训练的万卡国产算力平台“飞星一号”正式启用。启用后的90多天里,讯飞星火基于“飞星一号”,启动了对标GPT-4的更大参数规模的大模型训练,带来了1月30日这场讯飞星火V3.5升级发布。首个基于全国产算力训练的全民开放大模型讯飞星火V3.5在语言理解、文本生成、知识问答、逻辑推理、数学能力、代码能力和多模态能
这款国产免费编程工具火了!清华博士团队开发,响应延迟短、准确率高
在过去一年中,随着大模型技术的广泛应用,我们已经见证了 AI 如何深刻地改变着我们的工作方式。在程序编写领域,AI 的介入同样将为程序员们带来前所未有的便利。近日,非十科技推出了一款基于自研代码大模型打造的 AI 代码助手 ——Fitten Code,它可以帮助程序员更迅捷、更准确、更高质量地完成编码任务,大幅提升编码效率,并且向用户免费开放使用!产品官网地址: Code 自上次发布以来迅速走红。开发团队日以继夜地工作,带来了功能、性能和速度上的重大升级。此外,还增加了对更多编辑器的支持,为开发者们提供了全新的福利
大模型时代,南大周志华埋头做学件,最新论文上线
机器学习在众多领域取得巨大成功,海量的优质机器学习模型被不断开发。但同时,普通用户想要得到适合自己任务的模型并不容易,更不用说从头开始构建新模型了。南京大学周志华教授提出的「学件」范式通过模型 规约的思路构建学件市场(现称学件基座系统),让用户根据需求从中统一地选择和部署模型。如今学件范式迎来了首个开源的基础平台 —— 北冥坞(Beimingwu)。在经典的机器学习范式中,为一项新任务从头训练高性能的模型需要大量的高质量数据、专家经验和计算资源,无疑耗时耗力且成本高昂。此外,复用已有的模型也存在很多问题,比如很
马斯克:Neuralink首次将芯片植入人体,产品已在路上
第一个商用产品名字有了:Telepathy。马斯克的脑机接口公司 Neuralink,终于开始人体临床研究了。今天早晨,伊隆・马斯克宣布了一个重要消息。根据他在推特上的说法,Neuralink 已在上周日首次将脑机接口设备植入了一个人体,患者「恢复良好」。这是 Neuralink 在去年获得 FDA 批准开展人体临床研究,于秋季开始招募患者后进行的首次人体临床试验。也是 Neuralink「脑后插管」技术通往商业化道路上的最新一步。与 SpaceX 火箭、特斯拉电车相比,马斯克旗下的脑机接口创业公司 Neurali
大模型也能切片,微软SliceGPT让LLAMA-2计算效率大增
删除权重矩阵的一些行和列,让 LLAMA-2 70B 的参数量减少 25%,模型还能保持 99% 的零样本任务性能,同时计算效率大大提升。这就是微软 SliceGPT 的威力。大型语言模型(LLM)通常拥有数十亿的参数,用了数万亿 token 的数据进行训练,这样的模型训练、部署成本都非常高。因此,人们经常用各种模型压缩技术来减少它们的计算需求。一般来讲,这些模型压缩技术可以分为四类:蒸馏、张量分解(包括低秩因式分解)、剪枝和量化。其中,剪枝方法已经存在了一段时间,但许多方法需要在剪枝后进行恢复微调(RFT)以保持
小扎官宣Code Llama重量级更新,新增70B版本,但还有能力限制
功能更强大的 Code Llama 70B 模型来了。今天,Meta 正式发布 Code Llama 70B,这是 Code Llama 系列有史以来最大、性能最好的型号。我们正在开源一个全新的改进版 Code Llama,包括一个更大的 70B 参数模型。编写和编辑代码已成为当今人工智能模型最重要的用途之一。事实证明,编写代码的能力对于人工智能模型更严谨、更合理地处理其他领域的信息也非常重要。我为这一进展感到自豪,并期待着将这些进展纳入 Llama 3 和未来的模型中。Code Llama 70B 提供与之前发布
ICLR 2024|把图像视为外语,快手、北大多模态大模型媲美DALLE-3
动态视觉分词统一图文表示,快手与北大合作提出基座模型 LaVIT 刷榜多模态理解与生成任务。当前的大型语言模型如 GPT、LLaMA 等在自然语言处理领域取得了显著进展,能够理解和生成复杂的文本内容。但你是否想过,如果能够将大语言模型这强大的理解和生成能力迁移到多模态数据上,就可以轻松理解海量的图像与视频,并辅助创作图文并茂的内容。近期,来自快手和北大合作的最新多模态大模型 LaVIT, 正在让这个想法逐步变为现实。论文标题:Unified Language-Vision Pretraining in LLM wi
AI Infra 往事之异构计算篇:吴韧与他的学生们
2013年9月底,吴韧受百度邀请,以杰出科学家的身份加入百度深度学习研究院(IDL),此时正值他五十知天命的年纪。 吴韧在人工智能领域耕耘多年,当时已是一名顶尖的AI计算科学家。 2012年深度学习崛起前后,多年在AI领域的研究和工作经验让他坚信:这一轮人工智能竞争其实比拼的是计算能力。
牛津大学团队使用机器学习方法,来弥合量子设备的现实差距
编辑 | 萝卜皮现实与模拟之间的差异阻碍了固态量子器件的优化和可扩展性。由不可预测的材料缺陷分布引起的无序是造成现实差距的主要原因之一。牛津大学的研究团队使用物理感知机器学习来弥补这一差距,特别是使用结合物理模型、深度学习、高斯随机场和贝叶斯推理的方法。这种方法使科学家能够从电子传输数据推断纳米级电子设备的无序潜力。通过验证算法对 AlGaAs/GaAs 中横向定义的量子点器件所需的栅极电压值的预测来验证这一推论,从而产生与双量子点体系相对应的电流特征。该研究以「Bridging the Reality Gap i
2024,AI for Science 如何赋能科研第一线?
编辑 | 萝卜皮科技的新篇章正在被撰写:AI for Science——将人工智能与科学研究深度结合,利用 AI 的技术和方法来学习、模拟、预测自然和人类社会的各种现象和规律。这不仅能够推动科学的发现,也悄无声息地改变着我们的生活。AI 技术的大爆发,正催动着科研领域的剧变。AI for Science 这一科研新范式,正以前所未有的速度改变人类探索未知的进程。无论是预测气候变化、探索外星奥秘、研发新药,还是预警灾害发生、发现生命奥义……AI 都展现出了无比强大的潜力。以下 6 个精彩案例,将为大家展示 NVIDI
采摘场面如此魔性,难怪比尔·盖茨也要给它点赞
机器之能报道编辑:sia2023 年,位于意大利东北部艾米利亚-罗马涅波河畔的城市费拉拉迎来苹果收获季节。在意大利三大顶尖种植基地 Vivai Mazzoni 田园诗般的果园里,八个会飞的采摘机器人正熟练地收获苹果。2023 年苹果收获季节,在意大利费拉拉的 Mazzoni 集团果园机器人自如盘旋在果树旁,在 AI 和计算机视觉算法帮助下精确评估每个苹果的大小和颜色,然后用高吸力臂毫不费力地摘下完全成熟的果实,轻轻地放入传送带,滚入收集箱。系统由八个自动飞行机器人组成,连接到自动传送带上,每 2.5 秒采摘并存放一
第五波!2024年1月精选实用设计工具合集
大家好,这是 2024 年 1 月的第5波干货合集!这一期干货合集中有一些非常稀有的东西,比如来自瑞士工作室的在线字体设计工具,也有非常有用的工具,比如免费的 3D 角色素材和免费的 3D 材质库,当然还有非常新的工具,比如可以调整照片内容的 AI 工具。
当然,在此之前记得看看往期干货中有没有你感兴趣的素材:下面我们具体看看这一期的干货:
1、在线字体排版设计网站
、包豪斯,对于相关的设计感兴趣,那么很大概率你会爱上这个网站。这其实是来自瑞士的独立设计工作室 Studio Feixen 的网站功能的一部分,这个生
Midjourney 再更新!V6 模型支持外绘拓展与局部重绘了!
大家好我是花生~
上周末 Midjourney 又更新了一波新内容,一是 V6 版本增加了 3 个功能,二是 Alpha 内测网站调低了进入门槛,用户只要生成图像超过 5000 张就能体验网站内的图像生成功能,今天就为大家详细介绍一下相关内容~
相关推荐:一、V6 功能完善
此次更新最值得关注的就是 Zoom Out 外绘拓展、Pan 平移外绘和 Vary (Region) 局部重绘 3 种图像编辑功能终于能在 V6 版本中使用了,用法还是和之前也是一样的:先将图像放大,然后通过底部的按钮进行对应操作。官方提到 V
深度解析!ControlNet模型的工作原理与应用场景(附案例解析)
一、川言川语
大家好,我是言川。本期文章是 2024 年的第一篇文章,也是 2023 年农历的最后一篇文章。截至这篇文章完成时,距离春节也只有最后一周的时间了,我无法单独向支持我的朋友们传达祝福之意。所以在本篇文章的开头,向大家说一些祝福之词:
2024 年,祝大家在新的一年里事业有成,大展宏图,前程似锦。同时在事业之外,祝大家健康、快乐以及幸福。
2024 年,辰龙年,祝大家龙飞凤舞,事业腾飞;祝大家金龙献瑞,好运连连;祝大家龙年吉祥,幸福安康。
最后,新年快乐,准备准备回家吃饺子咯~二、生成式 AI 回顾
开始
登Science,速度和准确性均超越人类化学家,且具独创性,AI自主化学合成机器人加速化学发现
编辑 | X最近,在光化学和光催化方面的研究出现了惊人的爆发,部分原因在于光作为反应源对环境无害。然而,许多研究展示的是小规模反应,而扩大规模依赖于不同技术的拼凑,可能需要大量的试验和错误来优化。针对复杂光催化反应条件高效优化的需求,荷兰阿姆斯特丹大学 (UvA) 范特霍夫(Van 't Hoff)分子科学研究所的 Timothy Noël 教授团队,开发了一种集成人工智能驱动机器学习单元的自主化学合成机器人。这款台式设备被称为「RoboChem」,在速度和准确性方面都超过了人类化学家,同时还表现出高水平的独创性。
基于量子辅助深度学习的逆向分子设计
作者 | 康奈尔大学 Fengqi You 团队编辑 | ScienceAI康奈尔大学Fengqi You教授团队,通过结合量子计算(QC)与生成式AI的优势,提出了一个新颖的逆向分子设计框架。该框架利用QC辅助的深度学习模型来学习和模拟化学空间,从而预测并生成具有特定化学性质的分子结构。生成式AI在此过程中起着核心作用,它能够从大量的分子数据中学习潜在的结构-性质关系,并生成新的分子候选物,这些分子不仅符合预设的性质,还考虑到合成的可行性。量子计算的加入则为这一过程提供了高效的计算能力和优化算法,克服了传统计算机
王延峰:迫切需要重新审视我国大模型科研组织模式
ChatGPT 掀起的通用人工智能热潮仍在快速向前,产业竞争关键要素日渐明确,中美在通用人工智能领域的竞争也进入更高的战略层面。上海是中国人工智能发展最先进的城市之一。在 1 月 26 日结束的上海市第十六届人民代表大会第二次会议上,第十六届上海市人大代表王延峰教授提交了《关于上海加快建设具有全球影响力的大模型创新集聚区的建议》(下称《建议》)。王延峰建议,上海应当集中精力,抢抓发展机遇,加快建设具有全球影响力的大模型创新集聚区,避免中美大模型方面的差距进一步拉大。王延峰是上海人工智能实验室主任助理、上海交通大学人