AI在线 AI在线

注意力回路

Anthropic AI 最新研究成果发布:揭示大模型中的注意力回路

语言模型怎么“知道”乔丹是篮球运动员的? 近日,Anthropic通过构建归因图呈现了语言模型处理这一问题时的底层机制。 由下图可以看到,对于"Fact: Michael Jordan plays the sport of __"的输入,模型输出的第一条路径源自"plays"和"sport"词元,它们激活了"sport"与"输出运动项目"特征,进而提升了篮球、足球等运动项目的逻辑输出值。
4/11/2025 4:43:00 PM
洪雨欣
  • 1