一项新的同行评审研究表明,OpenAI 的 GPT-4 大语言模型无需任何额外训练,即可通过日本国家理疗考试。
最新发表在《Cureus》杂志上的新研究,测试了 GPT-4 的文字和视觉技能。
AI在线注:日本国家物理理疗师考试包括 160 道综合题和 40 道实践题,测试记忆、理解、应用、分析和评估能力。
研究人员在 GPT-4 中输入了 1000 个问题,并将答案对比了官方解决方案。
GPT-4 通过了所有五个测试部分,正确回答了 73.4% 的问题。不过,人工智能在处理技术性问题和包含图片或表格的问题时显得有些吃力。
该模型在常规问题上的表现(正确率为 80.1%)远远好于实际问题(正确率为 46.6%)。
同样,GPT-4 在处理纯文本问题(正确率为 80.5%)时的表现也远好于那些带有图片和表格的问题(正确率为 35.4%)。这些发现与之前有关 GPT-4 视觉理解局限性的研究结果一致。
有趣的是,问题难度和文本长度对 GPT-4 的性能影响不大。尽管该模型主要以英语数据为基础进行训练,但在使用日语输入时也表现出色。
AI在线附上参考地址
GPT-4 passes Japan’s National Physical Therapy Examination
Performance of ChatGPT 4.0 on Japan’s National Physical Therapist Examination: A Comprehensive Analysis of Text and Visual Question Handling