论文《Generative AI for Self-Adaptive Systems: State of the Art and Research Roadmap》的作者包括来自早稻田大学博士及研究助理 李家隆、西南大学讲师 张明悦、中关村国家实验室助理研究员 李念语(通讯作者)、鲁汶大学教授 Danny Weyns、北京大学教授 金芝以及东京工业大学长聘副教授 Kenji Tei。
论文地址:https://dl.acm.org/doi/10.1145/3686803GenAI4SAS 论文列表:https://github.com/545659928/GenAI4SAS自适应系统在动态和不确定的环境中具有关键作用,广泛应用于自动驾驶、智能制造、网络安全和智能医疗等领域。例如,无人驾驶系统需要实时感知环境变化并调整策略以确保安全与效率;智能制造生产线根据需求变化或设备故障自动调整;网络安全系统则通过自动检测和适应新威胁来应对不断变化的攻击方式。这些系统通过自我调整机制,实现自我管理和优化。
图 具有 MAPE-K 反馈循环的自适应系统
自适应系统依赖反馈回路,无需人为干预即可实现自动调整,核心功能包括:监控环境和系统状态、分析情况、制定调整计划并执行。其优势在于根据外部环境和内部状态的变化,维持系统稳定和高效运行。
生成式人工智能(GenAI)通过 AI 技术从数据中学习模式,生成与原始数据相似的新数据。Transformer 技术的突破使得 GenAI 在多个领域广泛应用,尤其是大型语言模型(LLMs)在语言理解和逻辑推理方面表现突出,为自适应系统提供了新的可能性。
GenAI 与自适应系统的核心功能相结合,能够显著增强系统的自适应能力。例如,GenAI 可以分析并规划系统策略,自动调整配置以应对环境变化。尽管已有一些研究探索了 GenAI 在自适应系统中的应用,但该领域尚缺乏系统性和深入的研究。因此,本论文旨在为研究人员和从业者提供生成式人工智能(GenAI)在自适应系统中的应用潜力及面临挑战的全面概览。
GenAI 在自适应系统中的应用潜力
我们从 2017 年至 2024 年 6 月的顶级会议中筛选出 5874 篇文献,最终筛选出 219 篇与 GenAI 和自适应系统相关的研究。筛选后的文献从两种视角展开分析:第一个视角聚焦于 GenAI 在增强自适应系统功能和自主性方面的潜力,探讨其在监控、分析、规划、执行等核心模块中的应用及知识共享。第二个视角探讨了在 “人类监督自适应系统”(HOTL)中,GenAI 如何改善人与系统的互动。虽然自适应系统原本希望减少人为干预,但引入人类决策可以提高系统的可信度和效率。重点关注用户偏好获取、系统透明度和人机协作,以提升用户满意度、系统解释性和效率。
图:GenAI 在自适应系统中的应用潜力概览
监控功能:GenAI,特别是 LLMs,在上下文理解和预测方面显著增强了自适应系统的监控能力。LLMs 可将监控收集的非结构化数据进行结构化处理,辅助异常检测;在上下文预测方面,基于 LLM 和扩散模型的时间序列和事件序列预测可识别潜在的目标违规风险。
分析和规划功能:GenAI 在自适应系统的分析和规划中有巨大潜力。LLMs 支持架构和需求驱动的适应,扩展了系统处理自然语言和非结构化数据的能力。LLMs 和 Diffusion 模型还能生成先验知识,提升模型性能并降低成本。新兴的规划方法包括:基于 Transformer 的规划适合离线学习和大规模系统;集体智能模式促进多智能体协作;经验积累模式支持自我反思和进化;扩散模型支持复杂约束的高维规划。
执行功能:虽然自适应系统的执行通常较简单,但 LLMs 在复杂情况下的执行转换中仍有潜力,尤其是在机器人领域中,LLMs 展现了在不确定环境下成功执行规划的能力。
知识管理:LLMs 有两个主要优势:一是利用其广泛的知识构建模型,尽管这些模型可能需要通过反馈调整以贴近现实;二是通过 LLMs 的翻译能力将自然语言转化为专用领域建模语言(DSML),大幅减少手动建模成本。
偏好获取:LLMs 通过其常识和语言理解能力,能够从用户反馈或行为历史中推断出硬性约束、效用函数或个性化需求。然而,如何处理多目标环境下的偏好冲突(如成本与效率的平衡)仍需进一步探索。
透明性:LLMs 具有解释代码、决策模型和系统日志的潜力,并能生成更直观的可视化展示。目前代码动态行为的解释较为有限,改进方向包括为不同类型的决策模型提供适当上下文信息,并利用运行结果提高解释的准确性。LLMs 还可用于模型解释性研究,如使用决策树作为代理模型解释复杂的深度学习模型,辅助特征选择和重要性分析。
协作:LLMs 初步应用于任务分配、协作行为和用户纠正,推断用户意图并规划协作模式。未来的研究可以深入探索高级意图推断、多模态输入输出,以及分析用户参与的影响,以优化人机协作的自适应能力。
图:路线图展示了自适应系统中的软件工程关键点(左侧)与 LLMs 在自适应系统中的应用挑战(中间)之间的对应关系,以及这些挑战与自适应系统关键功能(右侧)的映射关系。
当前研究的不足和未来的发展方向:
设计时方法应用于运行时:设计时方法侧重初始设计,依赖历史数据和专家知识;运行时则需实时调整在线数据,并要求 GenAI 做出自主决策。改进提示工程、明确任务与上下文、验证模型稳健性是解决方案。
LLM 即服务(LLMaaS):LLMaaS 将 LLMs 作为按需提供针对特定领域的云服务。自适应系统需要将 LLMs 作为系统组件进行集成和管理,类似于 API 和微服务。其次,由于 LLMs 的输出具有概率性,可能对相同输入产生不同结果,如何在适应过程中管理这些不确定性成为关键问题。
观察和表示:自适应系统通过监控收集数据,并进行概念化、存储和利用。多模态 LLMs 处理多种数据,但其复杂性增加了设计难度。不同格式(如 HTML、XML、JSON)的表示效果差异,需要在语境质量与推理成本之间找到平衡。
LLM 增强的分散控制:LLMs 在多代理系统(LLM-MAS)中可提升集体智能,但代理间的经验共享不足影响效率,且随代理数量增加,通信成本升高。未来需开发高效的通信协议和多代理协作技术。
自适应与个性化交互:LLMs 可帮助定制化交互界面,深入理解用户偏好,增强人类在回路(HOTL)的应用,但仍需解决用户知识差异和互动能力不足的问题。
伦理与责任:随着 GenAI 自主性增强,责任归属变得模糊,特别是在自适应系统和自动决策中,如何界定 GenAI 与人类责任是未来的研究重点。
评估工件:评估工件(如数据集、基准和示例)对自适应系统研究至关重要,但现有示例(如 DeltaIoT、DARTSim)在评估 LLM 时面临两大挑战:观察空间与 LLM 需求不匹配,且缺乏知识模块。未来示例应保留 LLM 所需的观察空间并模块化知识组件。虽然 LLM 可作为端到端模型使用,但通常作为模块集成,评估面临提示鲁棒性和输出质量等问题,需专门的评估工具。
自我测试:自我测试在自适应系统中面临两个挑战:复杂的配置和无法预见的运行时变化。虽然传统离线测试部分缓解问题,但在线、运行时和现场测试正逐步探索。LLMs 已用于故障定位、漏洞检测、生成测试用例和模糊测试,但应用于自适应系统仍有限。Ceprot 是唯一相关研究,自动更新过时测试用例。自我测试可视为 MAPE-K 循环的一部分,LLMs 的能力有望推动其进一步发展。
自我进化:软件进化指持续更新软件以修复问题或提升性能。现有研究多利用 LLMs 进行漏洞修复和自动化程序修复,但自适应系统中的自动化进化研究有限。LLMs 可以通过集体智能(如 metaGPT 自动化开发流程)以及自主学习(学习新技能以应对运行时的变化)实现自我进化。同时,系统的自我进化可能会伴随专用领域建模语言(DSML)的演进,以便更有效地描述系统的新特性。未来的研究应重点关注这种系统进化与 DSML 进化的协同关系。