摘要
核均值嵌入(KME)的关键特性在于其经验估计收敛至真实分布的速度可不受空间维度、分布特性及核函数平滑度影响。本研究通过利用再生核希尔伯特空间的方差信息实现收敛加速,并证明即使方差信息未知,仍能通过数据高效估计,从而在有利场景下获得分布无关的加速收敛界。方法进一步扩展至稳态混合序列,并在假设检验与鲁棒参数估计中验证了应用价值。
核心贡献
-
方差感知加速
通过显式建模核空间方差,突破传统KME收敛速率限制,在低方差分布中实现显著加速。 -
自适应估计
提出数据驱动的方差估计器,无需先验知识即可自动适应不同分布特性,保持理论保障。 -
序列扩展
将独立数据结论推广至稳态混合序列(如马尔可夫链),扩展方法适用场景。 -
应用验证
在假设检验中构建新型统计量,并在含异常值参数估计中展示鲁棒性提升。
技术方法
-
方差加权估计
构造加权核均值估计量,权重反比于各维度方差,优化MSE上界。 -
双重估计框架
采用分样本策略同步估计均值与方差,避免偏差累积。 -
混合序列处理
基于谱间隙理论建立依赖数据的收敛界,适用于非独立同分布场景。
实验成果
- 在合成数据中验证方差感知估计器相较标准KME实现2-5倍收敛加速
- 基于能量距离的假设检验功效提升12-18%
- 在污染高斯模型参数估计中,MSE降低达30%