适配器
谷歌出品:大模型生成 RPG 游戏,情节角色全自定义
现在,大模型能生成 RPG 角色扮演游戏了。 根据初始用户输入,它能设置游戏模拟环境,并在环境中生成角色动作。 来自谷歌,北卡罗来纳大学教堂山分校新研究,他们尝试的第一款游戏叫作 Unbounded,灵感来自《模拟人生》。
S-LoRA:一个GPU运行数千大模型成为可能
一般来说,大语言模型的部署都会采用「预训练 — 然后微调」的模式。但是,当针对众多任务(如个性化助手)对 base 模型进行微调时,训练和服务成本会变得非常高昂。低秩适配(LowRank Adaptation,LoRA)是一种参数效率高的微调方法,通常用于将 base 模型适配到多种任务中,从而产生了大量从一个 base 模型衍生出来的 LoRA 适配程序。这种模式为服务过程中的批量推理提供了大量机会。LoRA 的研究表明了一点,只对适配器权重进行微调,就能获得与全权重微调相当的性能。虽然这种方法可以实现单个适配器
- 1