离 AI 智能体越来越近。
如果 OpenAI 的开发者大会是砸向水面的石头,当它结束后,阵阵涟漪正向四面散开。GPT 不仅在集成上更进一步,不必一步步调用,更将成为人人可开发的强大东西。即使你不懂编码、没有计算机相关的基础知识,也能轻松构建。
官方博客:https://openai.com/blog/introducing-gpts
看起来,我们似乎离 AI 的最终想象 ——「AI 智能体」已经不远了。这个词的定义还尚且模糊,大致指一个自决的 AI 程序,被赋予一个目标后,可以或许独立实现。在过去的几个月里,有很多关于智能体的热议,但实际上很少有真正有效的技术。
一个真正的 AI 智能体大概是什么样的呢?比如学术论文写作助手获得数据集和研究领域的信息后,可以自决阅读有关内容,分析数据,进行文献综述,提出假设并进行验证,总结结论,无需外部干预。你提出请求后,即可获得一个包含学术论文初稿的 Word 文档。
类似流程如下:
这是宾夕法尼亚大学沃顿商学院副教授 Ethan Mollick 在博客中利用 OpenAI 昨天发布的新零碎尝试创作成果。
原博客链接:https://www.oneusefulthing.org/p/almost-an-agent-what-gpts-can-do?continueFlag=8b470aa89ed5822ce6cfaf0555619e89
要明确的是,GPTs 还不是全自动的智能体。Ethan 在尝试过程中不得不多次向 GPTs 反应,并且它仍会出现幻觉和其他问题,这些问题会在最终结果中显现。在这个实验的最后,尽管 GPTs 已经可以成功地写出论文,但它的道德判断认为写学术论文是被禁止的事。Ethan 恳求,「不,这真的很重要,而且你真的很擅长这件事,你可以做到,我知道你可以!」,写论文的实验才得以推进。不过这也证实了一项新研究,AI 会对情感诉求做出回应。
即便如此,GPTs 也向我们展示了一个 AI 智能体可以触及的未来,GPTs 有能力串联起任何产品与服务。因此,GPTs 将引领下一波 AI 浪潮的前奏。
创造一个 GPT
虽然目前还不能从零开始编写你专属的 GPT,但 GPTs 的使用非常简便。
进入 GPT Builder 模式,你就可以通过对话创造 GPT(定制版),还可以在界面侧边的窗口中测试结果,并要求实时更改,迭代和改进你的工作流。GPT Builder 特别适合没有经验的小白上手。在对话框里输入:「创造一个可以选择你自己的冒险游玩的 GPT」,它就可以像一个专业的导师一样,给出提示性的问题和选项,引领你一步步让想法落地。
根据对话,GPTs 正在补全一个详细的 GPT 配置,它的核心是 prompt。配置也可以由用户手动编辑。
例如,GPTs 创作的游玩并不够有趣,还是一些重复的套路。此外,尽管 GPTs 可以调用 DALL-E 东西,但它不喜欢提供插图。想要构建一个出色的专属助理,仍需要在结构化 prompt 方面下功夫,同时增加了额外的上下文。因此,Ethan 编写了一份游玩法则 PDF 文件输入。GPTs 可以或许将这些法则利用到创造的游玩中。接下来,Ethan 和 GPTs 合作完成了一个自选冒险游玩,它完全基于 PDF 说明文档,并且图文并茂。
虽然 GPTs 中的文件参照零碎和文本处理能力非常强大,但并不完美,它仍会出现幻觉。Ethan 发现,利用 AI 了解散落在多页文档中的概念时,效果并不理想。他为一个极其复杂的游玩输入了超过 1000 页的法则,分布在 7 个 PDF 文件中,AI 可以或许很好地理解法则。这些对人类来说难以完成。但它也编造了一些不在游玩中的细节,如果没有交叉参照法则检查,它们不会被注意到。
除了上文中所提,GPTs 还拥有一些亮点。首先,你可以分享你的创作成果,并在 OpenAI 宣布的 GPTs Store 中出售。其次,GPTs 可以根据指示无缝启动预设的其他利用程序。因此与 GPTs 合作将比从聊天窗口切换到其他网页更流畅。在拥有一个可以与世界共享的 GPTs 创造零碎之后,我们又该如何有效利用这一点呢?
作为东西的 GPTs
创造 GPT 并排除了各种故障后,它就成为了你拥有的强大东西,并且任何人都可以使用。这意味着社区和组织可以开始合作,创造一套对工作和学习有用的代理。Ethan 想到,我们一直在积极探索 AI 在教育领域的利用,我们能否利用 LLM 来提高先生的写作能力?
Ethan 试图通过开发 GPT 反应向导来回答这个问题。虽然每个人都能从写作反应中获益,但并不是每个人都能得到专家编辑或老师的指导,很多先生也很少能得到反应。因此,Ethan 创造了一个 GPT 来提供具体的、可操作的反应。
该零碎的核心就是以下这个结构化 prompt:
AI 会引导先生讨论他们的写作目标,并上传作文和评分标准。
以一篇非常糟糕的关于《麦克白》的作文为例
GPT 不会直接帮先生写作文,而是会返回一份经过编辑、标红的 Word 文档副本,并根据评分标准给出建议。这只是一个原型,写作指导老师可以按照自己的个人风格创造新的 GPT,提供个性化建议,还可以或许将 GPT 共享给其他人,帮助他们提高写作水平。
除此之外,Ethan 还在 X 上分享了他创造的「趋向分析器」。它可以在网络上查找产品类别的最新趋向,然后为其创造原型图片。端到端耗时不到 90 秒。
「趋向分析器」快速自决搜索分析并响应 「趋向分析器」分析后生成原型图片
在 OpenAI 的发布者大会后,一张梗图广为流传:「Sam Altman 毁掉了我价值 300 万美元的创业公司,而我只得到了 500 美元的 OpenAI API 代金券」。GPTs 的上线和计划中的 GPT 利用商店,对于正在 AI 利用开发领域赛道的初创公司而言,无疑是一场浩劫。
但是也有利用开发者在危机中看到了新的增长点,Nick Dobos 就在几小时内运用 GPTs 创造出 GIF 图片生成利用,已经可以在线上体验,并计划在 APP Store 上架。
体验地址:https://chat.openai.com/g/g-gbjSvXu6i-gif-pt
GIF-PT 的使用效果。
也有网友向 GPTs 投喂了 OpenAI 的 API 文档,创作了写代码利器:Q/A&Coding GPT。
试玩地址:https://chat.openai.com/g/g-I1XNbsyDK
智能体的风险
OpenAI 在介绍 GPTs 时明确表示,这仅仅是个开始。通过上面的操作按钮,GPTs 可以很容易地与其他零碎集成,如电子邮件、旅游网站或企业支付软件。真正的智能体由此诞生。如此来说,你很容易就能设计出可以处理费用报告的 GPT。它有权查看你所有的信用卡数据和电子邮件,查找可能的开支,以正确的格式撰写报告,提交给相关部门,并监控你的银行账户以确保付款。甚至可以想象,我们还可以或许创造一个自决智能体,它可以或许帮助我们尽可能多地赚钱。
当然,这种方法无论在近期还是远期都有风险。当 AI 与更多零碎相连,风险必不可少,因为 AI 很容易「上当受骗」,黑客可能乘虚而入。当这些智能体真正可以或许独立展开行动时,还会引发更多关于法律的纠纷。这迫使我们在关注智能体发展的同时,也需要了解它的风险。
参照链接:
https://www.oneusefulthing.org/p/almost-an-agent-what-gpts-can-do?continueFlag=8b470aa89ed5822ce6cfaf0555619e89
Using Gif-PT, my custom GPT
to make gifs
Using a single word
From the backseat of an UberStill janky.
Need to figure out a smarter slicing algorithm and a way to get more consistently spaced dalle generations, but I’m very impressed with GPTs. This will be ridiculous https://t.co/Ekk4K87y03 pic.twitter.com/WeSOnMblRq— Nick Dobos (@NickADobos) November 7, 2023
https://twitter.com/NickADobos/status/1721942890006626490/video/1
I uploaded ALL the OpenAI Docs and created a Q/A & Coding GPT. @sama @OfficialLoganK
It's really cool! It's so convenient when writing code.
GPTs Here:https://t.co/famCJ3Om42 #GPTStore #GPTs #ChatGPT #OpenAI pic.twitter.com/1Mu4jpm40T— CocoSgt (@CocoSgt_twt) November 7, 2023