离散时间非线性控制的迭代线性二次优化算法全局与局部收敛性分析

本文深入分析了离散时间非线性控制中迭代线性二次优化算法的全局与局部收敛特性。研究证明了在无控制变量成本的情况下,只要线性化动态满足满射条件且状态变量成本梯度占优,就能确保全局收敛至最小值。同时揭示了自协调成本下的二次局部收敛性质,并通过广义高斯-牛顿方法框架提供了算法复杂度边界。

离散时间非线性控制的迭代线性二次优化算法全局与局部收敛性分析

摘要

解决有限时域离散时间非线性控制问题的经典方法,涉及围绕当前候选解反复最小化原问题的线性二次近似。尽管该方法在多领域广泛应用,但其分析主要局限于局部范围。研究为迭代线性二次调节器(ILQR)算法及其微分动态规划(DDP)变体提供了详细的驻点收敛保证和局部线性收敛速率。

对于控制变量无成本的问题,研究观察到:只要线性化离散时间动态满足满射条件,且状态变量成本梯度占优,即可确保全局收敛至最小值。进一步详细说明了成本自协调时的二次局部收敛特性。研究证明,给定反馈线性化方案的存在,通过适当的离散化方案可保持线性化动态的满射性。通过广义高斯-牛顿方法的视角,提出了基于线性二次近似的算法复杂度边界。分析揭示了正则化广义高斯-牛顿算法的多个收敛阶段。

关键词:非线性控制,优化算法,收敛分析,离散时间系统,线性二次近似

comments powered by Disqus
使用 Hugo 构建
主题 StackJimmy 设计