文章主要内容与创新点总结 核心内容 文章聚焦 Wasserstein 模糊集下的分布鲁棒马尔可夫决策过程(DRMDPs),针对传统解法计算复杂度高、难以适配大规模问题的痛点,提出了高效的 Bellman 更新求解框架。通过拆解分布鲁棒 Bellman 更新的优化问题,将其转化为可快速求解的子问题,最终在 L1L_1L1