2025_NIPS_IMP-MARL: a Suite of Environments for Large-scale Infrastructure Management Planning vi...

最新推荐文章于 2026-06-22 20:56:42 发布

原创最新推荐文章于 2026-06-22 20:56:42 发布 · 143 阅读

·

6

·

标签

#语言模型 #人工智能

LLM Daily 同时被 2 个专栏收录

2852 篇文章 ¥99.90 ¥299.90

订阅专栏

超级会员免费看

915 篇文章

订阅专栏

文章核心总结与创新点

主要内容

本文提出开源多智能体强化学习（MARL）环境套件IMP-MARL，专为大规模基础设施管理规划（IMP）设计，支持测试协作式MARL方法的可扩展性与性能。IMP场景中，多组件工程系统（如海上风电场）存在故障风险，每个智能体负责一个组件的检测与维修决策，需在最小化维护成本的同时降低系统故障风险。通过三类环境（k-out-of-n系统、相关k-out-of-n系统、海上风电场）和两种奖励模型，作者对7种MARL方法（含集中式、去中心化、CTDE三类）与专家启发式策略进行基准测试，结果表明集中式训练-去中心化执行（CTDE）方法在智能体数量（最高100个）和性能上均优于其他方法，且多数场景下超越专家策略，但在高智能体数量、组件相关性等场景仍面临协作与稳定性挑战。

创新点

提出首个针对大规模IMP的开源MARL环境套件，支持最多100个智能体，且可灵活扩展新环境（如桥梁、运输网络）。
构建贴近工程实际的环境模型，包含组件劣化、检测、维修的物理机制，以及相关性、战役成本等现实约束。
开展大规模基准测试，系统对比不同MARL方法在高维IMP场景的表现，为机器学习与可靠性工程领域提供关键洞察。
提供完整可复现的代码、数据与文档，促进跨研究对比与MARL方法在实际基础设施管理中的应用。

翻译部分（Markdown格式）

Abstract

我们引

了解本专栏

超级会员免费看

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

UnknownBody 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。