Anthropic 基于 Claude 3.5 Sonnet 扩充 AI 开发工具：细化提示词、增强评估和测试

作者：故渊

2024-07-11 11:31

Anthropic 公司昨日（7 月 10 日）发布新闻稿，宣布推出了多项新工具，基于 Claude 3.5 Sonnet 大语言模型自动化、细化提示词（prompt）。AI在线附上完整演示视频如下：增强开发环境，可生成提示Anthropic 控制面板新增“评估”（Evaluate）单元，借助 Claude 3.5 Sonnet 大语言模型，帮助开发者高效地生成、微调和测试提示（Prompt）。这些增强功能旨在改进语言模型对各种任务的响应，为使用 Claude 开发人工智能产品的企业提供宝贵的资源。开发者只需描述

Anthropic 公司昨日（7 月 10 日）发布新闻稿，宣布推出了多项新工具，基于 Claude 3.5 Sonnet 大语言模型自动化、细化提示词（prompt）。

AI在线附上完整演示视频如下：

增强开发环境，可生成提示

Anthropic 控制面板新增“评估”（Evaluate）单元，借助 Claude 3.5 Sonnet 大语言模型，帮助开发者高效地生成、微调和测试提示（Prompt）。

Anthropic 基于 Claude 3.5 Sonnet 扩充 AI 开发工具：细化提示词、增强评估和测试

这些增强功能旨在改进语言模型对各种任务的响应，为使用 Claude 开发人工智能产品的企业提供宝贵的资源。

开发者只需描述任务（例如“分流处理客户支持请求”），Claude 就会为你生成一个高质量的提示。

Anthropic 基于 Claude 3.5 Sonnet 扩充 AI 开发工具：细化提示词、增强评估和测试

有效测试和评估

开发者在“评估”选项卡中，可以根据各种场景测试其人工智能应用程序的提示。

用户可以上传真实示例或者使用 Claude 生成案例，从而对比不同提示之间的有效性，答案以五分制进行评估，便于开发者直观评估。

Anthropic 基于 Claude 3.5 Sonnet 扩充 AI 开发工具：细化提示词、增强评估和测试

在 1 个博客示例中，开发者只需调整一行，就能在所有测试中生成更长、更详细的答案，从而节省时间和提高生产率。

测试机制

新工具支持手动和自动测试提示。开发人员可以生成输入变量，查看 Claude 的响应情况，并在需要时手动输入测试用例。

根据多个真实输入进行测试有助于在生产部署前验证提示质量。开发人员可以手动添加或从 CSV 中导入新的测试用例，或请求 Claude 创建测试用例。

Anthropic 基于 Claude 3.5 Sonnet 扩充 AI 开发工具：细化提示词、增强评估和测试

相关标签：

生成开发者 Claude 测试提示

相关资讯

用不了ChatGPT？快试试免费又强大的Anthropic Claude

用不了ChatGPT？快试试免费又强大的Anthropic Claude

大家好，这里是和你们一起探索 AI 的花生~ 前段时间 OpenAI 不稳定导致有些小伙伴没有办法继续使用 ChatGPT 了，不过没有关系，最近又新出现了一个 AI 聊天机器人 Claude，功能与 ChatGPT 不相上下，还比 ChatGPT 更容易获取和使用，目前可以免费使用，一起来看看吧~ 往期回顾：一、Claude 简介 Anthropic 官方： Claude 是最近新开放的一款 AI 聊天机器人，是世界上最大的语言模型之一，比之前的一些模型如 GPT-3 要强大得多，因此 Claude 被认为是

一夜之间，大模型像人一样操控电脑了！Claude 3.5重磅升级，抢先OpenAI

一夜之间，大模型像人一样操控电脑了！Claude 3.5重磅升级，抢先OpenAI

几个小时前，Claude 3.5 模型迎来了一波大更新。Anthropic 推出了升级版的 Claude 3.5 Sonnet 以及一款新模型 Claude 3.5 Haiku。其中，升级版 Claude 3.5 Sonnet 的各项能力全面胜过之前版本，其中代码能力提升显著。

AI在用| Midjourney+一个提示咒语，广告摄影师可以躺平了

AI在用| Midjourney+一个提示咒语，广告摄影师可以躺平了

机器之能报道编辑：Cardinal以大模型、AIGC为代表的人工智能浪潮已经在悄然改变着我们生活及工作方式，但绝大部分人依然不知道该如何使用。因此，我们推出了「AI在用」专栏，通过直观、有趣且简洁的人工智能使用案例，来具体介绍AI使用方法，并激发大家思考。我们也欢迎读者投稿亲自实践的创新型用例。无论是打开餐厅菜单、翻开一本杂志，还是点咖啡时瞟一眼上新，我们都会看到很多质感精致，极富视觉冲击力的广告图片。人工拍摄的专业广告图片为了让食物、化妆品、日用品等产品呈现出精致、极富吸引力的视觉效果，这类专业图片（带有

资讯热榜

罗永浩 Jarvis 初创项目“J1 Assistant AI 助理”上线，利用语音与大模型互动突破非视距条件依赖！大规模区域、低成本的UWB-LiDAR标定与单次定位框架 SK 海力士宣布参展 CES 2025，将展示 122TB 企业级固态硬盘等产品类 Mac Mini 大小的个人 AI 超算：英伟达 Project Digits 发布，起价 3000 美元斯坦福AI科研神器开源，一键成文GPT-4o mini加持！科研写作彻底解放双手从DeepSeek-V3发布谈大模型的技术突破与未来机遇别再将LLM当成数据库了 3 到 5 秒即可同声传译 40 余种语言，时空壶推出 W4 Pro 实时翻译耳机

标签云