摘要
基于Matérn协方差函数的高斯过程统计模型在推断和预测时的计算成本随观测数量呈立方级增长,这限制了其在大规模数据集中的应用。虽然在特定特殊情况下可降低计算成本,但目前尚无普遍适用的线性成本精确方法。现有多种近似方法旨在降低成本,但大多缺乏准确性的理论保证。
本文针对有限区间上的Matérn协方差高斯过程,首次提出了一种具有线性计算成本且协方差误差随近似阶数m呈指数级快速下降的通用方法。该方法基于谱密度的最优有理逼近,生成的近似可表示为m个独立高斯马尔可夫过程之和,便于在通用统计推断软件中使用。
除理论论证外,通过精心设计的模拟研究实证验证了方法的准确性。研究表明,在高斯过程回归等任务中,在固定计算成本下,该方法在准确性上优于现有最先进方案。
关键特性
- 线性计算复杂度:突破传统立方级计算限制
- 指数级收敛:协方差误差随近似阶数m呈指数下降
- 通用适用性:首次提供普遍适用的精确逼近方法
- 软件兼容性:近似结果可表示为独立高斯马尔可夫过程和
技术实现
方法核心采用最优有理逼近技术处理谱密度函数,通过构建m阶近似将复杂的高斯过程分解为多个可独立处理的马尔可夫过程,大幅降低计算复杂度同时保证理论收敛性。
应用价值
为大规模空间统计建模、机器学习中的高斯过程回归等场景提供了高效计算解决方案,显著提升了处理海量数据时的计算效率与精度平衡。