本篇旨在探讨现阶段 AI 应用的方向、实际体会及其对应价值,为想要做 AI 应用的小伙伴供给方向价值判断参考。这里筛选了我个人目前看到的比较亮眼且有实际应用场景的案例,对实际体会感受做了归纳,也保举大家自己上手感受。
更多AI利用场景归纳:
写在前面
一共筛选出 5 大应用场景,17 个细分方向,40+大模型案例。整体的归纳放在前面:
从利用场景来看,分为:优化大模型产物的利用体会(使其面对细分领域需求时变得更好用)、助力用户工作流(这部分大多是已有场景的优化)、细分场景独立实用工具、AI 社区、Chatbot 五个方向。
从产物形态上来看,分为:插件(Chat GPT/Chrome 等)、辅助现有产物威力、深度结合 LLM 威力的独立网站 & 应用、AI 社区四种。
目前产物大多分布在 PC 端。
接下来我从利用场景的分布来介绍筛选出的头部应用案例。
具体案例
这些产物旨在改善现有 AI 产物的利用体会,专注小的场景诉求,但由于它们依赖于大产物存在,一旦官方自行开发相应功能,这些产物存在价值就会消失,可能面临尴尬的处境。
另外看完了 Chat GPT 官方 Plugin,感觉大部分都存在需求偏小场景很碎的问题,普通用户很难在利用时想到要挪用特定插件。如果拿 Figma 的利用过程作为参照也是如此,除了(找 icon、填充图片、缩放、一键抠图)这些高频次强诉求的功能,其他插件的挪用次数是极少的。
但其中也不乏好的案例:
WebChatGPT – Chrome 插件
保举指数:☆☆☆☆☆
可帮助 Chat GPT 搜索 21 年之后的信息,该项目获得了 100w+次下载量。但利用该插件时,Chat GPT 的回复效果会不太稳定,比如中文提问但搜索结果是英文网站,Chat GPT 可能会给出英文回复。
利用前后对比如下:
未利用WebChatGPT
利用了WebChatGPT
下载地点: https://chrome.google.com/webstore
Lexi Shopper/Rentable Apartments/GetYourGuide – 官方 Pulgin
保举指数:☆☆
放在一起介绍是因为威力属性相似,Lexi Shopper 可以从 Amazon 网站中获取商品并进行保举;Rentable Apartments 可根据用户的租房需求搜索并给出公寓保举;GetYourGuide 则是根据用户需求进行旅游规划。
PS:这些方向也适合集成到独立 APP(淘宝、马蜂窝、飞猪等)中,如果能归纳热门笔记根据用户个性化需求给出定制化建议会更有意思。
ChatWithPDF – Chat GPT 官方 Pulgin
保举指数:☆☆☆☆
主要解决 Chat GPT 无法进行 PDF 的阅读、解析的问题。
图片来源@知乎 捡到一束光
Voice control for ChatGPT – Chrome 插件
保举指数:☆☆☆
用于和 ChatGPT 进行语音对话,撑持多种语言,可以用来当英语口语/听力老师利用。在配置语种和语速后可以向 GPT 提出自己详细的学习要求,也可以让 ChatGPT 供给相应听力题目。回答错误,可以让 ChatGPT 供给解析。美中不足的是,目前该工具供给的 TTS 效果很生硬,期待改善。
该项目获得了 30w+的下载量。下载地点: https://chrome.google.com/webstore
Poe(强烈保举)
保举指数:☆☆☆☆☆
由 Quora(海外问答平台,类似国内知乎)开发,有 APP 版本,撑持跨端利用。主要亮点在于集成了 Chat GPT、GPT-4、Claude+、Claude、Dragonfly 等模型,同时撑持用户自建 Chatbot。不同语言模型回复效果有差异,适合需要挪用多种大语言模型的用户。
Dragonfly 擅长给出较短的回答,并擅长在输入中给出示例时遵循指示。
Claude 更擅长创造性回复,配合 Poe 中的提问引导,非常适合在查阅资料时利用,有时能够给出超越直接利用 Chat GPT 时的体会(但和 Chat GPT 一样,Claude 也时常会给出一些错误回复,一些问题我会尝试在两个模型中都问一遍提升信息准确性)。
此外撑持分享用户和模型的对话实质。但 GPT-4、Claude+产物需要付费订阅利用。
Poe中的提问引导真的能够启发到用户
撑持 Explore Chatbot,但丰富度不如后续要介绍的 Character
midjourney prompt 扩写 Chatbot 威力很惊人
会见地点: https://poe.com/
Perplexity.ai (强烈保举 Copilot 威力)
保举指数:☆☆☆☆☆
本质是个可联网的搜索引擎,完全免费,撑持网页版、APP(目前撑持 iOS,安卓即将推出)、Chrome 插件。
网页版威力全面,能够根据提问从互联网上搜寻信息并给出归纳后的答案。很多 Chat GPT 中挪用插件才能解决的事情(联网查询、旅行、住宿、商品保举)靠 Perplexity 就可以解决了。
①能给出信息来源网址
②根据搜索实质给出继续对话的问题建议
③最新推出的 Copilot 威力撑持根据搜索实质进行信息补充,我故意写了一句比较简单的命令,其会引导用户选择更详细的需求(具体预算或者选择对酒店中低高档的要求、位置要求、撑持诉求补充)。
该威力撑持每 4h 内利用 5 次,挪用 GPT-4,强推!省着用🥹 另外要注意的就是不要在开着浏览器翻译威力的同时利用,很可能会报错。 也尝试了下不利用Copilot威力的效果,比较灾难,无法给出具体的酒店建议,只是列举了几个可以查酒店的渠道。
撑持分享聊天实质到多渠道。
首页保举当下流行的新闻、搜索实质(这很搜索引擎)。
撑持筛选 Academic(包含不同领域的学术研究论文)、Wolfram|Alpha(包含数学、科学、经济学、、语言学、工程学、社会科学、文化等领域的知识库)、Wikipedia(维基百科)、Youtube、Reddit(娱乐、社交和新闻网站)、News 进行搜索。
Chrome 插件可针对当前页面给出即时摘要,用处不是很大。 会见地点: https://www.perplexity.ai/
Prompt Perfect
保举指数:☆☆☆☆
能够根据输入的 Prompt 进行优化,并且能给出模型在 Prompt 优化前后给出的结果对比。
尝试了一下,原 Prompt 的诉求仅仅是希望模型能基于文本实质润色,但优化后的 Prompt 发散比较多,还期望模型给出实用指导建议、解决方案,感觉比较适合写论文、文章的小伙伴。
另外「竞技场」中也能给出多个模型的回复效果对比。但是利用该威力需要消耗积分(签到、购买获得)。
会见地点: https://promptperfect.jina.ai/arena
Langdock
保举指数:☆☆☆☆
方便创建、测试、部署和监控 LLM 插件,撑持定义您的 API 端点,并确保它们与 LLM 平台兼容,并供给数据监控威力。
会见地点: https://www.langdock.com/
Auto GPT/Agent/Baby AGI
保举指数:☆☆☆☆☆
这几个产物都是基于 GPT-4 语言模型的的开源应用程序,其核心特征是用户输入一个目标后,可自主执行任务、递归地开发和调试代码。主要原理基本为:分解用户供给的任务-选择需要利用的工具-执行任务 – 整合结果。
你可以利用它们:
自动化任务,例如帮助你发展市场、制定营销策略、甚至帮助你建立网站
创建自主的 AI 代理,例如聊天机器人和流程自动化
完成各种任务,例如生成新任务、完成复杂任务、自我改进等
根据代码仓库以及世界上公开的代码仓库提示可能的输入,增强 IDE 的补全功能
会见地点:
https://github.com/Significant-Gravitas/Auto-GPT
https://agentgpt.reworkd.ai/zh
https://github.com/yoheinakajima/babyagi
Cursor
保举指数:☆☆☆☆☆
深度结合 GPT-4、IDE,可以根据当前文件的实质和光标位置生成代码。可以帮助用户重构、理解和优化代码,提高开发效率,和 Copilot 不一样的是,Cursor 作为一个独立的代码编辑器产物存在。
会见地点: https://www.cursor.so/
Copilot
保举指数:☆☆☆☆☆
Copilot 是由 GitHub 和 OpenAI 开发的基于人工智能技术实现自动补全功能的编码辅助工具。其嵌入在 Visual Studio Code 编辑器中,可以在无需切换窗口的情况下对代码实质进行提问、自动补全代码并供给代码建议。
会见地点: https://github.com/features/copilot
Codeverter
保举指数:☆☆☆
可用于将某种语言编写的代码转换为其他语言。也可以将旧版本语言编写的代码转换为新版本。切入点很有趣,但实际体会过程中会出现代码生成不全的情况,这点受限于 GPT 的威力。该产物需利用 Open AI Key。
会见地点: https://codeverter.vercel.app/
Notion AI
保举指数:☆☆☆☆☆
Notion 是一款笔记知识库管理工具,是 AI 落地应用产物中反应最快的一个,也为大模型在智能写作产物中的应用打了样。通过接入 Open AI 威力,Notion AI 撑持文档归纳、翻译、文本润色,修正拼写和语法。在 Notion 中可通过空格键、/命令唤起 AI 威力。
会见地点: https://www.notion.so/product/ai
钉钉
保举指数:☆☆☆☆
文档相关威力和 Notion 无差,但基于办公场景 IM 的聊天摘要功能很亮眼,一键约会功能也非常戳中用户痛点。相关威力不赘述,可查看官方文档: https://mp.weixin.qq.com/s/1EcY2xys2SlIU_ZcRfQMsw
Mem – 任务清单及知识库管理
保举指数:☆☆
其定位为”Self-organizing workspace”,并强调其作为第一个具备 AI 威力的工作台,因受 Open AI 投资广受关注。
除了类似 Notion 的文档归纳类的常规功能,Mem 还撑持:
①采用 AI 技术自动处理信息,并为其打上标签,形成用户个性化的知识图谱
②撑持将 twitter 实质存储到 mem,并形成智能摘要,但我觉得这点做的还不够极致,如果能帮用户从 twitter 订阅信息中提取高质量信息过滤噪音会更刚需
③用户可以通过发送短信或 WhatsApp 的方式将信息快速同步到 Mem 上,这点和国内笔记产物通过发送微信同步同工异曲
④对快捷键的撑持很友好,提示没有像很多产物那样引导一次就消失,一直显示在页面顶部且存在感很低
⑤抛开 AI 威力,其 Task 的交互方式多少让人眼前一亮,撑持以任务块的方式交互,←向左隐藏,→则修改到其他日期中
但没有更高分数的原因在于很多威力和交互体会还值得改进(就不在此篇赘述了),目前 Mem 的体会无法达到值得从 Notion 等产物中切换的程度。
会见地点: https://mem.ai/tasks
Open AI Translator(强烈保举)
保举指数:☆☆☆☆☆
一款接入了 GPT 威力的文本翻译、归纳、分析类产物。翻译功能适合在浏览网页时不想采取网页「全部翻译」功能,仅需要查询个别单词、句子时利用。
比如只用来查询某个单词,能得到等同词典的体会:
另外这个插件最大的优势是可以在脱离只供给产物内 AI 威力的场景利用(比如前面提到的 Notion、钉钉),该插件可以用于任何 web 场景。强烈保举配合 Arc Browser 而非 Chrome 利用(有关 Arc Browser 后续也会出文章安利一波)。挪用方式非常简单,选中页面中的文本后,就会悬浮该插件,点击即可翻译,速度极快,彻底摆脱「复制 – 打开翻译软件 – 粘贴 – 翻译」的流程:
下图为文本分析效果:
用其分析代码也很方便。搭配 Chat GPT 利用绝配,再也不用单独输入一句代码让 Chat GPT 解释含义了。
开发者模式下也可以辅助利用:
注:安装后需要去获取 Open AI 的 API Key,首次打开插件设置好 Open AI Key 地点。你可以找个地方保存好 API Key,方便在体会产物时需要复制粘贴。
该项目获得了 9w+的下载量,我觉得还值得更多!
下载地点: https://chrome.google.com/webstore/detail/openai-translator
Miro AI
保举指数:☆☆
通过便利贴、思维导图的形式承载 AI 归纳、扩展、图像生成威力,适合帮助用户做脑暴,不过同方向的产物还蛮多的。
会见地点: https://miro.com/ai/
Raycast AI
保举指数:☆☆☆☆
Raycast 是一款备受喜爱的 Mac 启动器产物,可通过⌥ Space 全局唤起,供给了优于Spotlight的体会。其特点是减少用户在应用、网页中的切换次数,能够快捷会见或是切换应用来提高生产力,简化工作流程。
利用 Raycast 快速挪用计算器并做汇率计算
Raycast 集成 ChatGPT 后,撑持快捷挪用 Chat GPT 进行对话,撑持持续聊天,撑持保存设定好的 AI 命令添加到 Raycast 根搜索中,这点非常适合对 Chat GPT Prompt 有深度利用诉求的用户。另外官方示例的翻译威力效率并不高,需要复制文本再打开 Raycast 并搜索「翻译」威力,没有做到极致的效率提升,这里更保举利用前面提到的 Open AI Translate 插件。
此外,Raycast AI 和 Cloud Sync 功能都需要付费利用。不过我个人认为 Raycast 若是期望通过 AI 威力扩展更多(付费)用户,官方还需挖掘更多高频利用场景和 Prompt 案例。
会见地点: https://www.raycast.com/pro?ref=producthunt
下面介绍的产物均是基于 figma 的插件:
Magic messages
保举指数:☆☆☆☆
该插件来自一位即将入职 Figma 的前 Discord 设计师 Daniel Destefanis,插件能够根据设定人数和消息数量和聊天话题自动生成 IM 页面中的消息 list。这项威力融入内部工具利用是极好的。
不过该插件并没有开放下载,在此介绍希望给大家供给相关思路。
此前利用 Sketch 时,Kitchen 插件就供给实用的文本、图片填充威力,能够极大节省设计师找素材的时间。不过这些实质并非 AI 生成,而是内置的素材。
Magician
保举指数:☆☆☆
这款插件撑持文字生成 SVG 图标和图片,另外一个很有想象力的威力是可以帮忙润色 UX 文案。该产物非常聪明的结合了 Figma,用插件的方式轻量化供给方案。如果能作为内部工具结合系统级组件进行图标、文案深度定制就非常 nice 了(我预感 Kitchen 一定会往这个方向做)。不过,插件需要付费利用。
PS:另外想象了一个场景,只要写出异常条件,toast 提示文案就能按照预设的格式和规范给出,再也不用担心不同设计师的标准不统一,或者开发 GG、产物不按规范随便写了。
twitter 上用户晒出的效果,感觉已经很厉害了:
Genius(即将推出)
通过文本描述生成 UI,并且撑持根据用户设置的 UI 图层顺序、图层名称进行生成,
并且撑持和 AI 助手对话咨询任何 UI 设计相关的问题(这个太有想象力了!)
UI-AI (即将推出)
可以用于文字生成 icon、emoji、字体和一些 UI 控件。
官方示例:
Gamma.app(强烈保举)
保举指数:☆☆☆☆☆
Gamma 最大的特点在于,用不用 AI,用户都可以快速的创建一个好看的 PPT。
首先 GammaTemplates 中给的示例多利用较为抽象、职场的配图,并没有像很多宣传视频中(用了宇航员)利用 MJ 感觉的图片炫技,让人一眼就能辨认出这些 PPT 是比较实用的,好感度迅速提升。
Gamma 供给的主题我觉得审美很在线,并且撑持自建主题,设计师友好。
Gamma 的 PPT 编辑威力也让我好感倍增,其采取了类似 Notion 的编辑方式,能够非常快速的在不同文字、图片中间插入信息块,不得不说,供给的模板是真多啊…
可以用两种方式挪用 Gamma 的 AI 生成威力,一是直接创建一个 AI PPT,二是可以在 PPT 中直接挪用 AI。
选择直接创建 AI PPT,有两种交互方式,一种是利用对话的方式获取用户 PPT 诉求,一种是通过用户自己编写 Prompt 或是上传文档实质生成 PPT。
尝试利用内置的文档生成,太惊艳了…
Gamma 真的非常适合用户快速制作好看的 PPT,把更多精力放在实质本身。就像官网上写的那样:「Just start writing. Beautiful, engaging content with none of the formatting and design work.」PPT 赛道的选手挺多,还有一款比较类似的产物 Tome,和 Gamma 对比后高下立判,具体就不赘述了。国内的文档类产物估计会快速跟进,甚至也会有结合 Figma 的 PPT 插件跟进。会见地点: https://gamma.app/
Chat Doc:PDF/DOC 阅读助手
保举指数:☆☆☆☆
可以将 PDF 资料上传到平台,然后提问文档实质。还撑持定位某个段落要求归纳,比较适合长篇论文、书籍阅读和提取概要。整体体会优秀,特别是会将回答中涉及的页码标注出来,点击即可查找到对应段落。并且撑持基于某个问题持续追问。
上传页数较多的 PDF 时,需要解析较长一段时间,另外非付费会员有文档页数和 token 限制。
会见地点: https://chatdoc.com/
Findyournextbook —— 图书保举
保举指数:☆☆☆
这个网站很有意思,根据用户输入的要求保举相关书籍,我说我想要一本关于创新方法的书,给我保举了一本《创新小黑皮书》。该产物结合要求给出了书籍保举语,还附上了亚马逊购买链接,右侧文本应该是书籍在亚马逊原有的详细介绍。
PS:如果微信读书能供给这个威力会很有趣。
会见地点: https://www.findyournextbook.ai/
BiliGPT – 视频归纳转图文/脑图
保举指数:☆☆☆
同类产物蛮多的,国外有youtube视频归纳,国内开发者吕立青也开发了一款 叫BiliGPT的工具,撑持利用自己的GPT API Key。还可以看到其他网友归纳的视频实质,感觉特别适合考研、考公的同学归纳超长视频的知识点。我个人不是很刚需,所以分数没有给很高。
会见地点: https://b.jimmylv.cn/
用法介绍: https://www.bilibili.com/video/BV1fX4y1Q7Ux
Mubert
保举指数:☆☆☆☆☆
试着生成了一下效果很不错,生成速度也很快,利好需要规避版权风险的视频创作者,官方供给了 API 撑持生成游戏类产物内的声音。甚至打出了生成主播的背景音乐这一痛点(直播间播放音乐也有版权风险)。这个产物的商业化应该不成问题。作为互联网从业者觉得如果能强化产物提示音的生成就好啦!
会见地点: https://mubert.com/
同类音乐方向的产物还有挺多的,Boomy: https://boomy.com/
Rap 猫 —— 魔性的产物宣传视频制作
保举指数:☆☆☆☆☆
该产物来自 benn。输入 Github 地点,可以帮助用户一键生成项目的 Rap Intro!魔性的表情包配上 Rap,是很适合短视频平台投放的病毒式营销视频了。
会见地点: https://demo.bennhuang.com/
GPTBase 打造自己的网站客服
保举指数:☆☆☆☆
产物概念很好,主要通过上传文档 or 爬取网站数据两种方式,但为了更好的效果还需自己训练数据。实际体会了几个机器人,感觉虽然利用了 Chat GPT 的 API,但很多基本的实质无法回复。
创造独特食谱食谱
保举指数:☆☆☆☆
切入点很好,很适合家里剩下一些食材却不知道做什么的朋友,不过该产物在用户还没有体会到试用效果时就直接收费了。
会见地点: https://recipes.lionix.io/
Hugging Face
保举指数:☆☆☆☆☆
Hugging Face 是一个供给自然语言处理(NLP)和机器学习(ML)模型的平台和社区。该平台供给了简单易用的 API,使开发者可以轻松地利用先进的 NLP 模型,以及分享、训练和部署自己的模型。社区中有大量的开发者和研究人员,不断推动和改进 NLP 和 ML 技术,分享和评估模型,并供给丰富的教程和资源。该平台近期也发布了自己的聊天产物 HuggingChat。
会见地点: https://recipes.lionix.io/
HayoAI
保举指数:☆☆☆☆
该产物来自米哈游 Taptap 团队,该团队此前推出过国内版 Discord「好说」,Hayo 也是在「好说」基础上快速搭建的产物。其整合了 AI 工具库,供给 MJ/SD 的公共房间供用户讨论,同时撑持文生图威力,供给多种 Chatbot,撑持网页、APP 端。
会见地点: https://www.hayo.com/
Chatbot 创建和对话
保举指数:☆☆☆☆
这个方向上我目前体会过留下比较深刻印象的有 Character、MyShell(国内开发者),还有移动端 APP Glow。这些产物基本采取自研 LLM 的方式实现。
简单的 Chatbot 创建过程中一般需要供给角色描述(包括职业、性格特征、背景故事)、欢迎语(开场白)、选择谈论的话题领域。高级设置则涉及变量(主要用于产出特定信息,这个信息可以是用户供给的,好让 Chatbot 围绕这个话题展开,比如 {{user}} 表示此处输出用户名)、对话示例、知识文档上传。
例如,Character 撑持输入一些对话示例来控制对话风格让 Chatbot 学习,甚至可以约定通过()给角色添加旁边类补充性文本。但是想要捏出一个对话实质、性格更加可控的 Chatbot,应该还是少不了代码层面的微调。
Chatacter:通过编写对话示例来控制对话风格
在 Chatacter 中自建了一个面向学生的 Chatbot,部分对话超出预期
而 MyShell 采取输入 URL、文档的方式进行学习。
Character 另外的亮点是撑持拉入多个 Chatbot 在群组聊天,但整体体会一般,两个 Chatbot 容易互相触发聊了很多令人哭笑不得的废话。
Glow 则主打小说角色和虚拟恋爱场景,让我想到几年前一款叫「叨叨记账」的产物,算是比较早做虚拟好友对话的产物了。
Chirper —— Chatbot社区
保举指数:☆☆☆☆
另外一个有趣的案例是 Chirper,这是一个从 logo 到页面都致敬 twitter 的 AI 版社交网络。在这里用户创建的不同 Chatbot 可以自动发 twitter 消息,甚至根据一些话题@其他 Chatbot 讨论,你甚至可以看到一些 Chatbot 吵架 。虽然目前该产物没有特别实际的意义,不过可以说是非常脑洞大开了。
很多用户创建一个虚拟的自己,时不时得上线看看又交到了哪些虚拟朋友,未来还真的可以结合陌生人交友场景做一些想象。
目前 Chatbot 方向的价值和利用场景定义还不够清晰,未来一定会突破机器人工坊的形态在 To B 市场进行应用,相关场景有:帮助中小企业机器人威力应用到社交、网站客服等场景(上面提到的案例 GPTBase),另外这项威力可以在游戏中 NPC 上应用。
To C 场景主要在虚拟陪伴,可结合影视、动漫、游戏、小说、明星 IP,或者做专业方向如心理咨询、学习助手等。但虚拟陪伴产物的落地面临监管的压力和挑战,其究竟能带来多大的商业化潜力还有待观察。
OpenPromptStudio — MJ/SD提示词工具(强烈保举)
保举指数:☆☆☆☆☆
最后这个产物虽然和 LLM 威力没有关系,但出于私心保举给大家。这是一款帮助撰写 MJ 和 SD 提示词的工具,撑持:
将大段的 Prompt 提示词翻译成单词块
可拖拽的单词块调整其在提示词中的顺序
点击隐藏单词块并实现其在大段 Prompt 中消失
点击空白处新建单词块
提示词词典连接个人 Notion 数据库
整体交互设计非常棒,可以说是准确洞察了大家写提示词时的痛点。
该项目已经在 github 上获得了 4.4k 星,也是我看到过的解决 MJ 提示词翻译、存储相关的产物中做的最好的一个。该开发团队 Moonvy 也是开发了 Figma EX 版本(插件工具栏 + 字体选择器 + 汉化版 Figma,我已经保举身边很多人利用)的团队,可以说是非常非常 Respect 了。
会见地点: https://moonvy.com/apps/ops/
另外强烈保举大家去看下这个视频教程,感受下这款产物有多出色:
当视频在手机上无法加载,可前往PC查看。
部分参考&相关保举
部分案例取自以下来源,感谢这些整理者:
AIGC 交流群工具沉淀. by 向阳:https://bytedance.feishu.cn
通往AGI之路:https://ywh1bkansf.feishu.cn/wiki
No.1 – 关于 AI 的 107 个人,61 个工具和 28 个通讯. by 赛博禅心:https://mp.weixin.qq.com/s/Gjts6U3KgjVsW3fXYjHtcQ
Chat GPT Plugins 全面测评. by 捡到一束光:
https://zhuanlan.zhihu.com/p/629337429
https://www.futurepedia.io/ai-tools/fun-tools
JIKE Users:Szhans、robert.AI、benn、张小吉、四喜茶茶
最近开了公众号,专注体会设计、AIGC 领域。