人人可做提示工程师！Claude上新：一键生成、测试和评估prompt

应用
7月10日
编辑

机器之心

不会写 prompt 的看过来。在构建 AI 应用时，prompt 质量对结果有着重大影响。但制作高质量的 prompt 具有挑战性，需要研究者深入了解应用需求，并具备大型语言模型方面的专业知识。为了加快开发速度并改善结果，AI 初创公司 Anthropic 简化了此流程，可以让用户更轻松地制作高质量的 prompt。具体来说，研究者为 Anthropic Console 添加了新功能，可以生成、测试和评估 prompt。Anthropic 提示工程师 Alex Albert 表示：这是他们过去几周投入了大量工作才

不会写 prompt 的看过来。

在构建 AI 应用时，prompt 质量对结果有着重大影响。但制作高质量的 prompt 具有挑战性，需要研究者深入了解应用需求，并具备大型语言模型方面的专业知识。为了加快开发速度并改善结果，AI 初创公司 Anthropic 简化了此流程，可以让用户更轻松地制作高质量的 prompt。

具体来说，研究者为 Anthropic Console 添加了新功能，可以生成、测试和评估 prompt。

Anthropic 提示工程师 Alex Albert 表示：这是他们过去几周投入了大量工作才得到的成果，现在 Claude 在提示工程（Prompt Engineering）方面表现得非常好。

人人可做提示工程师！Claude上新：一键生成、测试和评估prompt

难写的 prompt，交给 Claude

在 Claude 中，写一个好的 prompt 就像描述任务一样简单。控制台提供了一个内置的 prompt 生成器，由 Claude 3.5 Sonnet 提供支持，允许用户描述任务并让 Claude 生成高质量的 prompt。

生成 prompt。首先点击 Generate Prompt，进入 prompt 生成界面：

人人可做提示工程师！Claude上新：一键生成、测试和评估prompt

然后输入任务描述，Claude 3.5 Sonnet 将把任务描述转换为高质量的 prompt。例如「撰写一个用于审查入站消息的 prompt…… 」，点击生成 prompt 就可以了。

人人可做提示工程师！Claude上新：一键生成、测试和评估prompt

生成测试数据。如果用户有了 prompt，可能需要一些测试用例来运行它。Claude 可以生成那些测试用例。

人人可做提示工程师！Claude上新：一键生成、测试和评估prompt

用户可以根据需要修改测试用例，并一键运行所有测试用例，还可以查看并调整 Claude 对每个变量生成要求的理解，以实现对 Claude 生成测试用例更细粒度的控制。

这些功能让优化 prompt 变得容易，因为用户可以创建 prompt 的新版本并重新运行测试套件以快速迭代和改进结果。

此外，Anthropic 还按照 5 分制为 Claude 响应质量设置了评分。

人人可做提示工程师！Claude上新：一键生成、测试和评估prompt

评估模型。如果用户对 prompt 感到满意，之后可以在「评估」选项卡中一次针对各种测试用例运行它。用户可以从 CSV 导入测试数据，也可以直接使用 Claude 为用户生成合成测试数据。

人人可做提示工程师！Claude上新：一键生成、测试和评估prompt

比较。用户还可以在测试用例中相互测试多个 prompt，并对更好的响应进行评分，以跟踪哪个 prompt 表现最佳。

人人可做提示工程师！Claude上新：一键生成、测试和评估prompt

AI 博主 @elvis 表示：Anthropic Console 是一项出色的研究，其自动化设计和优化 prompt 的过程可以节省大量时间。虽然生成的提示可能并不完美，但给了用户一个快速迭代的起点。此外，生成测试用例功能也很有帮助，因为开发者可能没有可供测试的数据。

人人可做提示工程师！Claude上新：一键生成、测试和评估prompt

看来，以后写 prompt 这个活，可以交给 Anthropic 了。

了解更多内容，请查看文档：https://docs.anthropic.com/en/docs/build-with-claude/prompt-engineering/overview

给TA打赏

共{{data.count}}人

人已打赏

Anthropic Claude

深度解析RAG大模型知识冲突，清华西湖大学港中文联合发布

2024-7-10 14:34:00

WAIC观察：隐私计算加速落地产业，全新的技术标准体系呼之欲出

2024-7-10 14:47:00

0 条回复 A文章作者 M管理员

更换删除

暂无讨论，说说你的看法吧

TOP1

刚刚，AI颠覆物理模拟：一句话精准仿真，学术圈半壁江山联手耗时24个月研究成果
12月19日
TOP2

历时2年，华人团队力作，震撼开源生成式物理引擎Genesis，可模拟世界万物
12月19日
TOP3

细节表现超Sora，网友：真正的国产之光！MiniMax视频模型再上新
12月16日
2024年AI 编程现在可以做到什么程度？
12月18日
超越所有SOTA！最新UniScene：视频点云Occ三大生成任务全部暴力提升~
12月12日
腾讯基于 RAG 和 Agent 技术的混元大模型业务落地实践
12月11日
抢跑OpenAI！谷歌Gemini 2.0震撼登场：全面转向Agent，多模态输入输出，免费随便玩
12月12日
实测来了！Kimi发布k1视觉思考模型，实力颠覆K12教育赛道，涌现能力强得可怕，免费可用！网友：国产之光！
12月16日

❯

个人中心

今日签到

搜索

幸运之星正在降临...

点击领取今天的签到奖励！

恭喜！您今天获得了{{mission.data.mission.credit}}积分

今日签到

连续签到

{{item.credit}}

连续{{item.count}}天

我的优惠劵

_￥_优惠劵
使用时效：无法使用
使用时效：
之前
使用时效：永久有效

优惠劵ID：
×
限制以下商品使用：限制以下商品分类使用：不限制使用：

[{{ct.name}}]
所有商品和商品类型均可使用

没有优惠劵可用!

购物车

×
删除

购物车空空如也!

清空购物车前往结算

您有新的私信

没有新私信

写新私信查看全部