BSChecker

开源模型「幻觉」更严重,这是三元组粒度的幻觉检测套件

BSChecker:细粒度大模型幻觉检测工具与基准测试排行榜大模型长期以来一直存在一个致命的问题,即生成幻觉。由于数据集的复杂性,难免会包含过时和错误的信息,这使得输出质量面临着极大的挑战。过多的重复信息还可能导致大型模型产生偏见,这也算是一种形式的幻觉。如何检测和有效缓解大模型的生成幻觉问题一直是学术界的热门课题。近日,亚马逊上海人工智能研究院推出细粒度大模型幻觉检测工具 BSChecker,包含如下重要特性:细粒度幻觉检测框架,对大模型输出文本进行三元组粒度的幻觉检测。幻觉检测基准测试集,包含三种任务场景,满足
  • 1