2025_NIPS_IMP-MARL: a Suite of Environments for Large-scale Infrastructure Management Planning vi...

文章核心总结与创新点

主要内容

本文提出开源多智能体强化学习(MARL)环境套件IMP-MARL,专为大规模基础设施管理规划(IMP)设计,支持测试协作式MARL方法的可扩展性与性能。IMP场景中,多组件工程系统(如海上风电场)存在故障风险,每个智能体负责一个组件的检测与维修决策,需在最小化维护成本的同时降低系统故障风险。通过三类环境(k-out-of-n系统、相关k-out-of-n系统、海上风电场)和两种奖励模型,作者对7种MARL方法(含集中式、去中心化、CTDE三类)与专家启发式策略进行基准测试,结果表明集中式训练-去中心化执行(CTDE)方法在智能体数量(最高100个)和性能上均优于其他方法,且多数场景下超越专家策略,但在高智能体数量、组件相关性等场景仍面临协作与稳定性挑战。

创新点

  1. 提出首个针对大规模IMP的开源MARL环境套件,支持最多100个智能体,且可灵活扩展新环境(如桥梁、运输网络)。
  2. 构建贴近工程实际的环境模型,包含组件劣化、检测、维修的物理机制,以及相关性、战役成本等现实约束。
  3. 开展大规模基准测试,系统对比不同MARL方法在高维IMP场景的表现,为机器学习与可靠性工程领域提供关键洞察。
  4. 提供完整可复现的代码、数据与文档,促进跨研究对比与MARL方法在实际基础设施管理中的应用。

翻译部分(Markdown格式)

Abstract

我们引

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

UnknownBody

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值