推理增强

DeepSeek-R1 模型幻觉问题严重,推理能力与准确性面临挑战

近日,Vectara 的机器学习团队对 DeepSeek 系列的两款模型进行了深入的幻觉测试,结果显示,DeepSeek-R1的幻觉率高达14.3%,显著高于其前身 DeepSeek-V3的3.9%。 这表明,在增强推理的过程中,DeepSeek-R1产生了更多不准确或与原始信息不一致的内容。 该结果引发了对推理增强大语言模型(LLM)产生幻觉率的广泛讨论。
  • 1