AI在线 AI在线

xLSTM 7B

原作者带队再次改造xLSTM,7B模型速度最快超Mamba 50%,权重代码全开源

近年来,大型语言模型(LLM)通过大量计算资源在推理阶段取得了解决复杂问题的突破。 推理速度已成为 LLM 架构的关键属性,市场对高效快速的 LLM 需求不断增长。 其中,采用 Transformer 架构的模型虽然占据了主流,但在输入序列长度增加时,计算量会呈二次方增长。
3/19/2025 5:40:00 PM
机器之心
  • 1