团队竞争游戏中广义虚拟交叉博弈的全局纳什均衡学习

Wed, 10 Sep 2025 11:28:21 +0800

学习团队竞争游戏中广义虚拟交叉博弈的全局纳什均衡

摘要

自我博弈(SP)是竞争性游戏中流行的多智能体强化学习框架。尽管在实证中取得成功，但SP的理论特性仅限于双玩家设置。对于两个合作智能体团队相互竞争的团队竞争游戏，研究展示了一个反例：SP无法以高概率收敛到全局纳什均衡(NE)。