TrustLLM

大语言模型的可信之路:TrustLLM全面揭秘

TrustLLM 是一个统一的框架,用于对 LLM 的可信度进行全面分析,包括现有工作的全面综述、可信 LLM 的不同维度的原则、一个新的测试基准,以及对主流 LLM 的全面可信度评估。大型语言模型(LLMs)在 NLP 方面的卓越能力已引起广泛关注,影响了我们生活各个方面的应用。LLMs 的出色能力归因于多个因素,例如使用来自 Web 的大规模原始文本作为训练数据,使用具有大量参数的 transformer 架构设计,以及先进的模型训练方案等。 然而,LLMs 的兴起也引入了关于它们可信度的担忧。与传统语言模型不
  • 1