Anthropic 基于 Claude 3.5 Sonnet 扩充 AI 开发工具：细化提示词、增强评估和测试

2024-07-11 11:31

Anthropic 公司昨日（7 月 10 日）发布新闻稿，宣布推出了多项新工具，基于 Claude 3.5 Sonnet 大语言模型自动化、细化提示词（prompt）。AI在线附上完整演示视频如下：增强开发环境，可生成提示Anthropic 控制面板新增“评估”（Evaluate）单元，借助 Claude 3.5 Sonnet 大语言模型，帮助开发者高效地生成、微调和测试提示（Prompt）。这些增强功能旨在改进语言模型对各种任务的响应，为使用 Claude 开发人工智能产品的企业提供宝贵的资源。开发者只需描述

Anthropic 公司昨日（7 月 10 日）发布新闻稿，宣布推出了多项新工具，基于 Claude 3.5 Sonnet 大语言模型自动化、细化提示词（prompt）。

AI在线附上完整演示视频如下：

增强开发环境，可生成提示

Anthropic 控制面板新增“评估”（Evaluate）单元，借助 Claude 3.5 Sonnet 大语言模型，帮助开发者高效地生成、微调和测试提示（Prompt）。

Anthropic 基于 Claude 3.5 Sonnet 扩充 AI 开发工具：细化提示词、增强评估和测试

这些增强功能旨在改进语言模型对各种任务的响应，为使用 Claude 开发人工智能产品的企业提供宝贵的资源。

开发者只需描述任务（例如“分流处理客户支持请求”），Claude 就会为你生成一个高质量的提示。

Anthropic 基于 Claude 3.5 Sonnet 扩充 AI 开发工具：细化提示词、增强评估和测试

有效测试和评估

开发者在“评估”选项卡中，可以根据各种场景测试其人工智能应用程序的提示。

用户可以上传真实示例或者使用 Claude 生成案例，从而对比不同提示之间的有效性，答案以五分制进行评估，便于开发者直观评估。

Anthropic 基于 Claude 3.5 Sonnet 扩充 AI 开发工具：细化提示词、增强评估和测试

在 1 个博客示例中，开发者只需调整一行，就能在所有测试中生成更长、更详细的答案，从而节省时间和提高生产率。

测试机制

新工具支持手动和自动测试提示。开发人员可以生成输入变量，查看 Claude 的响应情况，并在需要时手动输入测试用例。

根据多个真实输入进行测试有助于在生产部署前验证提示质量。开发人员可以手动添加或从 CSV 中导入新的测试用例，或请求 Claude 创建测试用例。

Anthropic 基于 Claude 3.5 Sonnet 扩充 AI 开发工具：细化提示词、增强评估和测试

不停PUA大模型「写更好点」，无需其它花哨技术就能让AI代码水平暴增

AI 的编程能力已经得到了证明，但还并不完美。近日，BuzzFeed 的资深数据科学家 Max Woolf 发现，如果通过提示词不断要求模型写更好的代码（write better code），AI 模型还真能写出更好的代码！这篇文章在网络上引发了热议，著名 AI 科学家在看完这篇文章中更是发出了 matters 三连：迭代很重要，提示词设计很重要，代码执行能力很重要。

1/11/2025 3:37:00 PM

机器之心

AI在用| Midjourney+一个提示咒语，广告摄影师可以躺平了

机器之能报道编辑：Cardinal以大模型、AIGC为代表的人工智能浪潮已经在悄然改变着我们生活及工作方式，但绝大部分人依然不知道该如何使用。因此，我们推出了「AI在用」专栏，通过直观、有趣且简洁的人工智能使用案例，来具体介绍AI使用方法，并激发大家思考。我们也欢迎读者投稿亲自实践的创新型用例。无论是打开餐厅菜单、翻开一本杂志，还是点咖啡时瞟一眼上新，我们都会看到很多质感精致，极富视觉冲击力的广告图片。人工拍摄的专业广告图片为了让食物、化妆品、日用品等产品呈现出精致、极富吸引力的视觉效果，这类专业图片（带有

4/8/2024 3:03:00 PM

机器之能