OpenAI 的 GPT-4 变身考证能手:无额外训练通过日本理疗师考试,正确率 73.4%

一项新的同行评审研究表明,OpenAI 的 GPT-4 大语言模型无需任何额外训练,即可通过日本国家理疗考试。最新发表在《Cureus》杂志上的新研究,测试了 GPT-4 的文字和视觉技能。AI在线注:日本国家物理理疗师考试包括 160 道综合题和 40 道实践题,测试记忆、理解、应用、分析和评估能力。研究人员在 GPT-4 中输入了 1000 个问题,并将答案对比了官方解决方案。GPT-4 通过了所有五个测试部分,正确回答了 73.4% 的问题。不过,人工智能在处理技术性问题和包含图片或表格的问题时显得有些吃力。

一项新的同行评审研究表明,OpenAI 的 GPT-4 大语言模型无需任何额外训练,即可通过日本国家理疗考试。

OpenAI 的 GPT-4 变身考证能手:无额外训练通过日本理疗师考试,正确率 73.4%

最新发表在《Cureus》杂志上的新研究,测试了 GPT-4 的文字和视觉技能。

AI在线注:日本国家物理理疗师考试包括 160 道综合题和 40 道实践题,测试记忆、理解、应用、分析和评估能力。

研究人员在 GPT-4 中输入了 1000 个问题,并将答案对比了官方解决方案。

GPT-4 通过了所有五个测试部分,正确回答了 73.4% 的问题。不过,人工智能在处理技术性问题和包含图片或表格的问题时显得有些吃力。

OpenAI 的 GPT-4 变身考证能手:无额外训练通过日本理疗师考试,正确率 73.4%

该模型在常规问题上的表现(正确率为 80.1%)远远好于实际问题(正确率为 46.6%)。

同样,GPT-4 在处理纯文本问题(正确率为 80.5%)时的表现也远好于那些带有图片和表格的问题(正确率为 35.4%)。这些发现与之前有关 GPT-4 视觉理解局限性的研究结果一致。

有趣的是,问题难度和文本长度对 GPT-4 的性能影响不大。尽管该模型主要以英语数据为基础进行训练,但在使用日语输入时也表现出色。

OpenAI 的 GPT-4 变身考证能手:无额外训练通过日本理疗师考试,正确率 73.4%

AI在线附上参考地址

GPT-4 passes Japan’s National Physical Therapy Examination

Performance of ChatGPT 4.0 on Japan’s National Physical Therapist Examination: A Comprehensive Analysis of Text and Visual Question Handling

给TA打赏
共{{data.count}}人
人已打赏
应用

创领越野新时代,坦克品牌携坦克400汽油版为中国越野造势

2024-8-30 23:50:00

应用

国内运营商最大单集群智算中心在哈尔滨投用,可训练万亿参数大模型

2024-8-31 9:21:36

0 条回复 A文章作者 M管理员
    暂无讨论,说说你的看法吧
个人中心
今日签到
搜索