非凸极小极大优化的双时间尺度梯度下降上升算法

本文系统分析了双时间尺度梯度下降上升算法(TTGDA)在非凸极小极大优化问题中的应用,涵盖平滑与非平滑场景的理论复杂度分析,为生成对抗网络等实际应用提供理论基础。

非凸极小极大优化的双时间尺度梯度下降上升算法

摘要

针对结构化非凸极小极大优化问题minₓmaxᵧ∈Y f(x,y),其中目标函数f(x,y)在x上非凸、在y上凹,且约束集Y⊆ℝⁿ为凸有界集,本文对双时间尺度梯度下降上升(TTGDA)算法进行了统一分析。在凸-凹设置中,单时间尺度梯度下降上升(GDA)算法被广泛应用并已证明具有强收敛性保证。但在更一般的设置中,该算法可能无法收敛。主要贡献在于设计了超越凸-凹设置的有效TTGDA算法,能高效找到函数Φ(·):=maxᵧ∈Y f(·,y)的稳定点。同时建立了平滑与非平滑非凸-凹极小极大优化问题求解复杂度的理论边界。据所知,这是首次对非凸极小极大优化的TTGDA进行系统分析,揭示了其在训练生成对抗网络(GANs)和其他实际应用问题中的优越性能。

comments powered by Disqus
使用 Hugo 构建
主题 StackJimmy 设计