文章核心总结与创新点
主要内容
本文提出开源多智能体强化学习(MARL)环境套件IMP-MARL,专为大规模基础设施管理规划(IMP)设计,支持测试协作式MARL方法的可扩展性与性能。IMP场景中,多组件工程系统(如海上风电场)存在故障风险,每个智能体负责一个组件的检测与维修决策,需在最小化维护成本的同时降低系统故障风险。通过三类环境(k-out-of-n系统、相关k-out-of-n系统、海上风电场)和两种奖励模型,作者对7种MARL方法(含集中式、去中心化、CTDE三类)与专家启发式策略进行基准测试,结果表明集中式训练-去中心化执行(CTDE)方法在智能体数量(最高100个)和性能上均优于其他方法,且多数场景下超越专家策略,但在高智能体数量、组件相关性等场景仍面临协作与稳定性挑战。
创新点
- 提出首个针对大规模IMP的开源MARL环境套件,支持最多100个智能体,且可灵活扩展新环境(如桥梁、运输网络)。
- 构建贴近工程实际的环境模型,包含组件劣化、检测、维修的物理机制,以及相关性、战役成本等现实约束。
- 开展大规模基准测试,系统对比不同MARL方法在高维IMP场景的表现,为机器学习与可靠性工程领域提供关键洞察。
- 提供完整可复现的代码、数据与文档,促进跨研究对比与MARL方法在实际基础设施管理中的应用。
翻译部分(Markdown格式)
Abstract
我们引

订阅专栏 解锁全文
1420

被折叠的 条评论
为什么被折叠?



