连续空间条件分布学习技术解析

本文研究多维单位盒上条件分布的样本学习方法,提出基于固定半径球和最近邻的两种聚类方案,建立收敛速率上界并推导最优参数配置,通过神经网络整合近似最近邻搜索和Sinkhorn算法实现高效训练。

学习连续空间上的条件分布

Cyril Benezet, Ziteng Cheng, Sebastian Jaimungal; 26(105):1−64, 2025.

摘要

研究多维单位盒上条件分布的样本学习方法,允许特征空间和目标空间具有不同维度。方法涉及在特征空间中的不同查询点附近聚类数据,以在目标空间中创建经验测度。采用两种不同的聚类方案:一种基于固定半径球,另一种基于最近邻。建立了两种方法收敛速率的上界,并从这些界限推导出半径和邻居数量的最优配置。建议将最近邻方法纳入神经网络训练,因为实证分析表明其在实践中具有更好的性能。为提高效率,训练过程使用随机二进制空间分割的近似最近邻搜索。此外,采用Sinkhorn算法和稀疏性增强的传输方案。实证结果表明,通过适当设计的结构,神经网络能够局部适应合适的Lipschitz连续性水平。

[摘要][PDF][Bib] [代码]

comments powered by Disqus
使用 Hugo 构建
主题 StackJimmy 设计