效率翻倍！6 款不容错过的收费 AI 神器（六）

大家好，我是花生~ 今天继续我们的 AI 效率神器推荐第 23 期，内容包括收费的文本转语音对象、AI 写真 / AI 音乐生成对象等。上期回顾：一、AI 音乐生成模型 Stable Audio Open 在线试玩： ComfyUI 插件：之前为大家推荐过 AI 音乐生成对象 Stable Audio，可以通过文本生成时长 3 分钟的高质量音乐。最近 Stability AI 宣布开源 Stable Audio Open 音乐生成模型（授权类型：不可商用），可以通过文本生成鼓点、乐器旋律、环境声音和配音，单

大家好，我是花生~

今天继续我们的 AI 效率神器推荐第 23 期，内容包括收费的文本转语音对象、AI 写真 / AI 音乐生成对象等。

上期回顾：

一、AI 音乐生成模型 Stable Audio Open

在线试玩： https://huggingface.co/spaces/artificialguybr/Stable-Audio-Open-Zero

ComfyUI 插件： https://github.com/lks-ai/ComfyUI-StableAudioSampler

之前为大家推荐过 AI 音乐生成对象 Stable Audio，可以通过文本生成时长 3 分钟的高质量音乐。最近 Stability AI 宣布开源 Stable Audio Open 音乐生成模型（授权类型：不可商用），可以通过文本生成鼓点、乐器旋律、环境声音和配音，单次时长可达 47 秒。测试了一下它的生成速度很快，质量也相当不错，并且目前已经有 ComfyUI 插件可以利用了（需要至少 7G 的 VRAM），安装后即可在要地收费无限次生成高质量音乐素材。

效率翻倍！6 款不容错过的收费 AI 神器（六）

二、提醒词灵感库 Freeflo

网站直达： https://freeflo.ai/

Freeflo 是一个收费的 AI 绘画提醒词灵感库，适用于 Midjourney、Adobe Firefly、Stable Diffusion 等多个平台，让我们能快速复刻某种风格或图象结果。其中还收录了多种 Midjourney 的 –sref 风格代码，并提供了丰富地应用结果展示；整个网页的交互做得很精致，浏览起来非常方便。

效率翻倍！6 款不容错过的收费 AI 神器（六）

三、提醒词优化对象 Omost

在线体验： https://huggingface.co/spaces/lllyasviel/Omost

ComfyUI 插件： https://github.com/huchenlei/ComfyUI_omost

Omost 是大神 @lllyasviel（controlnet、fooocus、ic-light 的作者）新推出的一个项目，借助大语言模型将简单的提醒词优化为详细的、包含布局信息的形式，以生成高精度的图象。Omost 的运作过程主要有以下几个步骤：

接受用户给的提醒词，比如 “A huge spaceship prepares to land on a lunar base（巨大的宇宙飞船准备降落在月球基地）” ；
大模型将其处理成一段更详细的描述，并总结一系列的 tag；
为画面的主要元素分配位置、占比、以及对应的关键词，比如 “飞船在画面中央”、“基地在画面右下角” 等；
根据处理好的信息生成高精度的图象。

在第二、三步完成后，如果你对大模型对生成的元素描述或者构图不满意，可以再发送指令要求其进行修改，比如 ”change the background into Galaxy“ 或者 “let the ship on the right side”。所有内容都设定好之后，点击左侧的「Render the Image」即可生成图象，最终得到的图象内容及构图都会和前面的设定一致。

效率翻倍！6 款不容错过的收费 AI 神器（六）

目前 ComfyUI 中也已经有 Omost 插件可以利用，插件主要有两部分的功效，有需要的小伙伴可以自行安装：

① 通过大语言模型优化提醒词并获取布局信息。这项功效可以单独利用，帮助我们获取更详细的提醒词，精准管制画面构图。

效率翻倍！6 款不容错过的收费 AI 神器（六）

② 区域条件管制：将布局信息转为为画布蒙版，这样用户能够更直观地指定图象中各个元素的位置和大小，从而生成更符合预期的图象。

效率翻倍！6 款不容错过的收费 AI 神器（六）

四、AI 写真对象 Consistent-character

网站直达： https://replicate.com/fofr/consistent-character

之前爆火的妙鸭相机将 “AI 写真” 的概念普及到大众之中，让我们知道借助 AI 可以无需真实拍摄就得到一套高质量的个人图象。不过目前好用的 AI 写真对象要么需要付费，要么需要用户自己通过 stable diffusion 对象来生成，对普通人来说门槛还是比较高的，而 Consistent-character 则是一套打包好的对象流，可直接收费利用。

这套工作流由 AI 大神@Fofr 构建分享，整合了 InstantID、IPAdapter、Controlnet 和 FaceDetailer 等多个目前热门的生成模型，来最大程度上保持人物形象特征的一致性。你只需提供一张人物面部特写照片，加上描述词，等待几分钟就能生成 1-20 张同一人物不同表情和姿势的高质量图象，实测下来人物的面部相似度非常高。

效率翻倍！6 款不容错过的收费 AI 神器（六）

五、文本转语音对象 ChatTTS-UI

在线试用： https://chattts.com/

Windows 要地安装包： https://github.com/jianchang512/ChatTTS-ui （文末有资源包）

ChatTTS 利用一款新的收费开源的文本转语音对象，可以将中文和英文文本转化为高质量的人声，适用于 AI 聊天机器人、角色对话、AI 播客、视频旁白等场景。它的生成速度非常快，结果很自然逼真，和真人几乎没有差别。

ChatTTS-UI 则是基于 ChatTTS 开发的一款要地 WebUI 应用，一键解压安装后就能利用，非常简单。要地 WebUI 功效更全面，可以选择音色、调整语速，支持上传 txt 文件进行转换，且不受字数、利用次数的限制，非常适合对文本转语音有高需求的用户。

效率翻倍！6 款不容错过的收费 AI 神器（六）

六、Pixverse 新功效 Magic Brush

对象介绍： https://www.uisdc.com/pixverse

AI 视频生成对象 Pixverse 最近推出了一项新功效 Magic Brush，它与 Runway 的 motion bursh 类似，让用户可以自己选定图象的某个区域来设定疏通方向和强度，从而更准确的管制视频的疏通结果。目前支持同时利用 6 个笔刷，还支持 AI 智能识别画面元素，方便用户进行快速选择。

与 Runway 通过滑块来调节结果不同，Pixverse 是直接通过手绘线条来管制疏通的，比如可以画抛物线引导球的疏通，或者画曲线引导物体的飘动结果，元素的疏通速度则是通过通过线条长短来管制，因此能实现的结果更复杂，用起来也更灵活。

{{userData.name}}已认证

效率翻倍！6 款不容错过的收费 AI 神器（六）

一、AI 音乐生成模型 Stable Audio Open

二、提醒词灵感库 Freeflo

三、提醒词优化对象 Omost

四、AI 写真对象 Consistent-character

五、文本转语音对象 ChatTTS-UI

六、Pixverse 新功效 Magic Brush

如何用AIGC打造品牌IP？报价6位数的实战项目复盘来了！

院士领衔、百余位专家到场、数十家家当链企业齐聚！2024中国人形机器人开发者大会暨第三届张江机器人环球生态峰会在张江迷信礼堂举办

推理模型 DeepSeek-R1-Lite 预览版上线，号称媲美 OpenAI o1-preview

AI自动操作VS Code，自然语言搞定各种配置，来自阿里通义智能计算实验室 | 开源

九大成像模式一键解析，生物医学图像AI再迎突破！微软、UW等BiomedParse登Nature子刊

SU 哈佛亚马逊最新研究：量化能让大模型“恢复记忆”，删掉的隐私版权内容全回来了

微软在东京开设其日本首个研发中心，专注于将机器人技术与 AI 相结合

AI 助力脑瘤手术：10 秒内精准识别残留肿瘤

闲鱼注册用户突破 6 亿，AI 技术已应用于闲置交易全链路

谷歌又捣鼓出好东西！有了这款AI学习神器，考试起码多考50分