通过学习分位数函数改进预测技术

通过学习分位数函数改进预测技术

本文介绍了一种创新方法，通过直接学习完整分位数函数而非单独建模各分位点，解决了传统预测中的分位数交叉问题。该方法采用神经网络架构确保单调性，支持单变量和多变量场景，在资源优化和需求预测领域具有重要应用价值。

分位数函数学习在预测中的创新应用

技术背景

分位数函数作为概率分布的核心表征工具，能够将概率值映射为变量取值。传统方法需为每个分位点单独建立回归模型（包括神经网络重新训练），效率低下且可能产生分位数交叉问题——即高概率对应的预测值反而低于低概率预测值，违反分位数函数单调递增的基本性质。

核心方法

单变量分位数学习

架构设计：提出增量分位数函数（IQF）估计器，通过神经网络强制实现单调性。每个分位点的预测值表示为前一个分位点的增量增加
锚点机制：在[0,1]区间均匀设置多个锚点（knots），通过线性插值（数据密集区）和非线性外推（尾部）构建完整函数
分布无关性：不假设数据分布形态（高斯/均匀等），仅依赖单调性约束，在三峰测试分布上验证有效性

多变量扩展

凸函数导数法：将多变量分位数函数定义为凸函数的导数，自然保证单调性
神经网络实现：通过架构强制凸性，利用导数作为训练信号学习跨变量相关性
时序预测验证：在多时间范围预测任务中，相比单变量方法更好捕获连续时间步的相关性

实际应用

该方法支持动态查询不同分位点以优化资源权衡，例如：

调整24小时交付保证率（95%→94%）可能大幅降低库存需求
微小库存增加即可提升客户满意度阈值

技术演进

继承某机构2017年MQ-CNN模型思想，扩展后支撑需求预测系统
与样条分位数函数RNN（原为实习生项目）技术关联
代码已开源至GluonTS概率时间序列库

实验验证

单变量：5个和20个锚点对比显示密度增加提升近似精度
多变量：在多变量高斯数据集上，自相关图证明能更好捕获连续时间步关联

comments powered by Disqus