隐变量极值图建模的凸优化方法
极值图模型能够编码多元极值的条件独立结构,为量化罕见事件风险提供强大工具。以往关于从数据学习这些图模型的研究主要关注所有相关变量可观测的情况。针对流行的Hüsler-Reiss模型,提出eglatent方法——一种在存在隐变量情况下学习极值图模型的可处理凸规划方案。
该方法将Hüsler-Reiss精度矩阵分解为两个部分:
- 稀疏分量:编码在给定隐变量条件下观测变量间的图结构
- 低秩分量:编码少量隐变量对观测变量的影响
研究提供了eglatent方法的有限样本保证,证明该方法能够一致地恢复条件图结构以及隐变量数量。通过合成数据和真实数据的实验,凸显了该方法性能的显著提升。
关键词:极值理论、图模型、隐变量、凸优化、高维统计
本文发表于Journal of Machine Learning Research, 26(42):1-68, 2025