Crossmark

Multi-agent robust policy evaluation for reinforcement learning via primal-dual online time-averaging

Published Online: 2025-10-23

Published Print: 2025-12

Authors

Chen, Gang

Pu, Changli

Zhou, Yaoyao

Li, Xiumin

Chen, Huimiao
License Information

Text and Data Mining valid from 2025-10-23

Version of Record valid from 2025-10-23
More Information

Article History

Received: 16 May 2024

Revised: 26 August 2024

Accepted: 14 July 2025

First Online: 23 October 2025

Document is current