编辑丨coisini
尽管大型语言模型(LLM)擅长复杂推理,但在适应特定领域时仍面临挑战,尤其是在需要空间推理和解决结构化问题的领域。半导体布局设计就是一个典型例子,AI 工具必须理解几何约束并确保组件的精确布局。
基于此,来自 IBM TJ 沃森研究中心和 MIT-IBM 沃森人工智能实验室的研究人员提出了一种受神经启发的 LLM 推理网络 ——SOLOMON,旨在增强领域特定的适应性。与传统方法不同,SOLOMON 采用多智能体推理系统,动态处理空间约束和几何关系。
论文地址:https://arxiv.org/pdf/2502.04384
SOLOMON 框架集成了思维评估机制,通过迭代优化输出,提高解决问题的准确性。SOLOMON 利用提示工程(prompt engineering)来引导 LLM 生成解决方案,使其能够以最少的重新训练适应半导体布局任务。
如下图所示,SOLOMON 架构受到两种理论的启发:类脑通用人工智能(Brain-like AGI)和自由能原理(Free Energy Principle, FEP)。
类脑通用人工智能启发研究团队利用多个大型语言模型(LLM)的思维池来发现最佳推理计划。研究团队还应用了自由能原理的核心观点,即人类注意力集中于最小化目标与感知之间的差异,从而选择相关信息并避免常见陷阱。
SOLOMON 的关键组件包括:
思维生成器(Thought Generators):由一组多样化的大型语言模型(LLMs)组成,负责为目标任务生成多种思维。思维生成器通过「思维树(Tree-of-Thoughts)」构建了一个高效的并行搜索引擎,并作为思维评估器(Thought Assessor)的自适应检索增强生成(RAG)系统。
思维评估器(Thought Assessor):一个基于 LLM 的系统,用于分析提出的「思维」以生成精炼的输出。它对思维生成器的输出进行上下文学习,并遵循自由能原理。
导向子系统(Steering Subsystem):一个由人工操作的组件,用于控制思维生成器和思维评估器的注意力。
与微调不同,SOLOMON 架构无需持续重新训练,在专业应用中更为高效。
为了评估 SOLOMON 的有效性,研究团队在 25 个半导体布局任务上进行了实验,采用五个基线 LLM 进行了比较,包括 GPT-4o、Claude-3.5-Sonnet 和 Llama-3 等,旨在评估模型在生成几何结构时保持空间准确性的能力。SOLOMON 在减少运行时错误和扩展不准确性方面表现出改进,展示了更好的空间推理能力,提高了布局精度并减少了生成设计中的错误。
总的来说,SOLOMON 的一个关键优势在于其能够纠正几何设计中的逻辑不一致和算术错误。SOLOMON 为将 AI 应用于特定领域问题解决(尤其是半导体布局设计)提供了一种结构化且高效的方法。
感兴趣的读者可以阅读论文原文,了解更多研究内容。
相关报道:https://www.marktechpost.com/2025/02/16/this-ai-paper-from-ibm-and-mit-introduces-solomon-a-neuro-inspired-reasoning-network-for-enhancing-llm-adaptability-in-semiconductor-layout-design/