流形噪声数据局部几何结构估计算法

本文研究高维噪声数据在低维流形上的投影估计问题,提出一种能够同时估计投影点和切空间的算法,并证明其收敛性和渐近收敛速率达到函数导数估计的最优速率。

流形噪声数据局部几何结构估计

摘要

数据驱动应用中的一个常见观察是,高维数据具有低内在维度,至少局部如此。本研究考虑流形值数据的点估计问题:给定流形 (M)((R^D) 中的 (d) 维子流形)的噪声样本有限集,以及靠近流形的点 (r),我们的目标是将 (r) 投影到流形上。

假设数据是从无边界紧致 (k) 次光滑流形的管状邻域中均匀采样,我们提出一种算法:输入该邻域中的点 (r),输出 (p^n \in R^D) 和 (T_{p^n}\hat{M})(Grassmannian流形 (Gr(d,D)) 中的一个元素)。我们证明当样本数量 (n \to \infty) 时,点 (p^n) 以高概率收敛到 (r) 在 (M) 上的投影点 (p),且 (T_{p^n}\hat{M}) 收敛到 (T_pM)(该点处的切空间)。

进一步表明,(p^n) 以 (n^{-\frac{k}{2k+d}}) 的渐近速率逼近流形,而 (p^n) 和 (T_{p^n}\hat{M}) 分别以 (n^{-\frac{k-1}{2k+d}}) 的速率逼近 (p) 和 (T_pM)。这些速率与函数导数估计的最优速率一致。

[abs][pdf][bib] [code]

comments powered by Disqus
使用 Hugo 构建
主题 StackJimmy 设计