应用
ComfyUI 进阶篇!完整梳理 ComfyUI 的核心节点(一)
前言:
学习 ComfyUI 是一场持久战。当你掌握了 ComfyUI 的安装和运行之后,会发现大量五花八门的节点。面对各种各样的工作流和复杂的节点种类,可能会让人感到不知所措。在这篇文章中,我们将用通俗易懂的语言对 ComfyUI 的核心节点进行系统梳理,并详细解释每个参数。希望大家在学习过程中培养自我思考的能力,真正掌握和理解各个节点的用法与功能。在实践中不断提升自己的技术水平。只有通过不断的探索和总结,才能在面对复杂的工作流时游刃有余。祝大家学习顺利,早日成为 ComfyUI 的高手!一、Load Check
三星 Galaxy AI 新增“作业帮手”功能,可教学生解数学题
在昨天的发布会上,三星不仅发布了两款全新折叠屏手机 Galaxy Z Fold 6 和 Galaxy Z Flip 6,还着重展示了 Galaxy AI 人工智能功能。三星自豪地宣布,到今年年底,搭载 Galaxy AI 的设备将达到 2 亿台。外媒 Sammobile 称,这是一个巨大的成就,要知道苹果尚未将任何近期发布的人工智能功能应用到手机上。而三星仍在不断推出新功能,其中一项可以帮助孩子们完成作业。据AI在线了解,“圈选搜索”是 Galaxy AI 的核心功能之一,这个功能允许用户通过长按虚拟主页键后圈选屏
商汤发布“东风”泰语大模型:全球首次实现可在泰 / 中 / 英环境下高效工作
商汤科技官方公众号今日晚间发文宣布,7 月 10 日,商汤联合泰国 DTGO 集团及旗下 Quinnnova 共同发布“东风”泰语大模型(DTLM)。“东风”号称全球首个能在泰文、中文、英文三种语言环境下高效工作的 AI 大语言模型,将商汤的基模型和算力优势与 DTGO 的泰国语言文化优势相结合,提供本地化的生成式 AI 体验。其能够实现自然、流畅的实时对话、文本阅读理解等功能。官方表示,“东风”来自在中泰两国都深受欢迎的中国古典名著《三国演义》,寓意两国自古以来的文化交流,借生成式 AI 时代的东风进一步发扬光大
人形机器人将当上银行“大堂经理”,国内首个场景训练基地在上海浦东启用
据“上海金融官微”公众号,国内首个人形机器人银行大堂经理场景训练基地在建行上海浦东分行正式启用。银行大堂经理场景训练基地是业内首个商业银行场景应用训练基地,其首次采用开放式的创新训练模式,有助于加快提升人形机器人的能力,推动关键技术、重点产品和重点场景应用。据介绍,此次参训的机器人拥有高度仿生的躯干构型和拟人化的运动控制,结合视觉、听觉、语音等人工智能技术,科学家可以通过具身智能的推理和规划等对其进行训练。目前,该银行已对智能人形机器人开展银行大堂业务咨询、业务分流、智慧柜员机个性化操作指南、反欺诈宣传等面向客户的
落幕再谈,「WAIC 2024」的一些细节与预判
机器之能报道作者:姜菁玲在这次的世界人工智能大会上,百度CEO李彦宏提到的一句话吸引了很多关注。他说,没有应用,光有基础模型,不管是开源还是闭源都一文不值。「大家不要去卷模型了,要去卷应用」。这句话虽然有些极端,但是在当下的阶段有几分代表性。正如这句话所表达的,如果说去年的WAIC上,各家厂商还在展示自己的大模型本身实力,今年的WAIC的主要观赏点则已经集中在应用上。一众AI厂商从去年的「占位」秀,来到了新阶段。应用成为新赛点大模型厂商应用大规模试错技术本身是抽象的,但应用却是具象的。在今年的WAIC现场,凝聚在观
韩国美妆业拥抱 AI:机器人调配专属粉底,还能帮你选口红色号
据路透社报道,韩国美妆巨头爱茉莉太平洋的人工智能 (AI) 美容实验室最近客似云来。在这里,机器人可以根据顾客皮肤状况调配专属粉底,还能推荐最适合顾客的口红色号。32 岁的顾客 Kwon You-jin 在体验了定制护肤品服务后表示:“每个人的肤色都独一无二,但通常只能买到市面上最常见的色号。通过 AI 生成的数据更深入了解自己的肌肤状况,并能亲眼目睹前后对比,这太棒了!”在收到一份由 AI 生成的皮肤状况报告后,一台机器人随即为她调配了完美匹配其肤色的粉底液。AI在线注意到,如今,越来越多的化妆品公司开始拥抱 A
18个月326项能力,这家大厂猛猛上新生成式AI,如今纯靠Prompt就搞定企业级应用了
构建生成式 AI 应用,现在只需要几分钟。「生成式 AI 的半衰期只有六个月,」亚马逊云科技全球 AI 产品副总裁 Matt Wood 说道。2024 开启下半年,人们发现,生成式技术和落地之间的距离,已经不能用「远」或「近」完全概括。狂热的百模大战之后,即使生成式 AI 技术展现出了前所未有的能力,为何一部分企业还没有投身到新技术的变革之中?技术门槛和高昂的研发投入、应用成本是它们保持谨慎态度的主要影响因素。今天凌晨,亚马逊云科技给全世界带来了解决方案。一系列生成式 AI 技术的重磅发布,将全球最先进的大模型技术
GitHub 8k Star,一作实习生,字节这个大模型成果被苹果选中了
字节跳动大模型团队成果 Depth Anything V2 现已被苹果官方收入 Core ML 模型库。本文介绍了 Depth Anything 系列成果的研发历程、技术挑战与解决方法,分享了团队对于 Scaling Laws 在单一视觉任务方面的思考。值得一提的是,Depth Anything V1 与 V2 两个版本论文一作是团队实习生。近日,字节跳动大模型团队开发的成果 Depth Anything V2 ,入选苹果公司 Core ML 模型库,目前已呈现在开发者相关页面中。Depth Anything 是一
AI 根据声音内容帮照片“对口型”,蚂蚁集团开源 EchoMimic 项目
蚂蚁集团 10 日开源了名为 EchoMimic 的新项目,其能够通过人像面部特征和音频来帮人物“对口型”,结合面部标志点和音频内容生成较为稳定、自然的视频。该项目具备较高的稳定性和自然度,通过融合音频和面部标志点(面部关键特征和结构,通常位于眼、鼻、嘴等位置)的特征,可生成更符合真实面部运动和表情变化的视频。其支持单独使用音频或面部标志点生成肖像视频,也支持将音频和人像照片相结合做出“对口型”一般的效果。据悉,其支持多语言(包含中文普通话、英语)及多风格,也可应对唱歌等场景。 AI在线附相关链接:项目地址: G
这些VLM竟都是盲人?GPT-4o、Sonnet-3.5相继败于「视力」测试
四大 VLM,竟都在盲人摸象?让现在最火的 SOTA 模型们(GPT-4o,Gemini-1.5,Sonnet-3,Sonnet-3.5)数一数两条线有几个交点,他们表现会比人类好吗?答案很可能是否定的。自 GPT-4V 推出以来,视觉语言模型 (VLMs) 让大模型的智能程度朝着我们想象中的人工智能水平跃升了一大步。VLMs 既能看懂画面,又能用语言来描述看到的东西,并基于这些理解来执行复杂的任务。比如,给 VLM 模型发去一张餐桌的图片,再发一张菜单的图片,它就能从两张图中分别提取啤酒瓶的数量和菜单上的单价,算
视频生成新公司!马尔奖、清华特奖得主曹越创业,「风投女王」押注
继月之暗面之后,眼光毒辣的「风投女王」徐新又投了一家 AIGC 创业公司。近期,有关今日资本裁撤一级市场团队的传言在业内引发关注。7 月 10 日晚,今日资本集团总裁徐新亲自在微信朋友圈辟谣,并透露了一则投资消息:2024 年 5 月,今日资本领投了 SandAI 的早期融资轮。据 IT 桔子数据,北京 SandAI 成立于 2023 年,是一家志在「做世界有影响力的事情」的 AI 创业公司。目前,SandAI 主要聚焦于类似 OpenAI Sora 的视频生成技术,为用户提供高效、便捷的视频生成服务。公司创始人兼
首届AI奥数竞赛方案公布:4支获奖队伍,竟都选择国产模型DeepSeekMath
获胜的 AI 数学奥林匹克模型出炉!几天前,随着榜单的公布,大家对全球首届 AI 数学奥林匹克竞赛(AIMO)进步奖的讨论量居高不下。这次比赛共有 5 个团队胜出,获得第一名的是 Numina 的团队,CMU_MATH 位列第二,after exams 暂居第三,codeinter、Conor #2 团队分别拿到第四、第五的成绩。 图源:,曾让陶哲轩感到惊讶。当时官方只公布了获奖名单,并未透漏背后模型的更多信息。大家都在好奇,获得冠军的队伍到底是用了哪种模型?
三星确认今年将推出 AI 升级版 Bixby,由自研大语言模型提供支持
三星确认 Bixby 将很快获得人工智能升级。在 Galaxy Z Flip 6 和 Galaxy Z Fold 6 发布后,三星移动部门 CEO TM Roh 在接受 CNBC 采访时表示,公司将在今年晚些时候发布升级版 Bixby,并由三星自家的大语言模型(LLM)提供支持。Roh 表示:“我们将通过应用生成式人工智能技术来提升 Bixby 的能力。”几个月前,三星推出过名为“Samsung Gauss”的自研 LLM。此前曾有报道称三星正在研发升级版 Bixby,但这是三星首次确认相关消息,并透露了大致发布时
帮你把草图变成完整画作,三星 One UI 6.1.1 引入“手稿到图像”等 AI 功能
三星在昨晚的 Galaxy Unpacked 发布会上带来了 Galaxy Z Fold6 / Flip6 等手机新品,两款新机都将内置基于 Android 14 的 One UI 6.1.1。据悉,在此次更新中,三星还带来了一系列基于 Galaxy AI 的新功能,预计后期会登陆其他支持的 Galaxy 系列设备。据介绍,三星此次引入了名为“手稿到图像(Sketch To Image)”的新功能。用户可预先在手机上使用 S-Pen 或徒手绘制草图,Galaxy AI 就会通过 AI 和机器学习创建图形元素,使草图
“云计算一哥”亚马逊深夜放大招:几分钟纯靠 Prompt 打造一个 App
现在开发一个 App 需要多久?“云计算一哥”亚马逊云科技,深夜给出了一个新标准 —— 只需三步,几分钟,纯靠自然语言和鼠标“点点点”即可。话不多说,直接展示!第一步:说出你的想法我们首先可以直接用自然语言描述一下想要打造 App 的需求,例如:为我的团队创建一个应用程序,可以通过一个表单提交项目审批。这个表单将接受详细信息,并允许用户上传相关文件。静候几秒之后,这个 AI 便会根据你的需求,分析总结 App 的用例、流程和关键特征等信息。在确认没问题之后,我们就可以点击右下角的“生成 APP”按钮。第二步:编辑
夸克升级“超级搜索框” 推出AI搜索为中心的一站式AI服务
大模型时代,生成式AI如何革新搜索产品?阿里智能信息事业群旗下夸克“举手答题”。7月10日,夸克升级“超级搜索框”,推出以AI搜索为中心的一站式AI服务,为用户提供从检索、创作、总结,到编辑、存储、分享的一体化信息服务价值。“能回答、能创作、能总结的超级搜索框,是夸克对AI搜索的新定义。”阿里智能信息事业群总裁吴嘉表示,大模型、数据、场景等优势,推动夸克加速革新搜索产品,创造更大用户价值。“跨过大模型应用全新体验的临界点,夸克全面进入AI时代,一站式AI服务的创新涌现将滔滔不绝。”全新AI搜索,一框实现回答、创作、
Anthropic 基于 Claude 3.5 Sonnet 扩充 AI 开发工具:细化提示词、增强评估和测试
Anthropic 公司昨日(7 月 10 日)发布新闻稿,宣布推出了多项新工具,基于 Claude 3.5 Sonnet 大语言模型自动化、细化提示词(prompt)。AI在线附上完整演示视频如下: 增强开发环境,可生成提示Anthropic 控制面板新增“评估”(Evaluate)单元,借助 Claude 3.5 Sonnet 大语言模型,帮助开发者高效地生成、微调和测试提示(Prompt)。这些增强功能旨在改进语言模型对各种任务的响应,为使用 Claude 开发人工智能产品的企业提供宝贵的资源。开发者只需描述
第二波!2024年7月精选实用设计工具合集
大家好,这是 2024 年 7 月的第 2 波干货合集!这一期干货合集有专门生成 SVG 矢量素材的 AI 平台,免费生成 PNG 透明背景的 AI 平台,基于 AI 进行前期产品灵感探索的平台,以及在线生成可编辑 Banner 的 AI 平台,此外还有免费生成渐变背景的工具,以及次世代 3D 可视化设计的平台,都是精选的好东西。
当然,在此之前记得看看往期干货中有没有你感兴趣的素材:下面我们具体看看这一期的干货:
1、AI 生成的免费 SVG 矢量素材合集网站
SVGStud.io 的网站,是一个基于 AI 来