分位数函数学习在预测中的创新应用
技术背景
分位数函数作为概率分布的核心表征工具,能够将概率值映射为变量取值。传统方法需为每个分位点单独建立回归模型(包括神经网络重新训练),效率低下且可能产生分位数交叉问题——即高概率对应的预测值反而低于低概率预测值,违反分位数函数单调递增的基本性质。
核心方法
单变量分位数学习
- 架构设计:提出增量分位数函数(IQF)估计器,通过神经网络强制实现单调性。每个分位点的预测值表示为前一个分位点的增量增加
- 锚点机制:在[0,1]区间均匀设置多个锚点(knots),通过线性插值(数据密集区)和非线性外推(尾部)构建完整函数
- 分布无关性:不假设数据分布形态(高斯/均匀等),仅依赖单调性约束,在三峰测试分布上验证有效性
多变量扩展
- 凸函数导数法:将多变量分位数函数定义为凸函数的导数,自然保证单调性
- 神经网络实现:通过架构强制凸性,利用导数作为训练信号学习跨变量相关性
- 时序预测验证:在多时间范围预测任务中,相比单变量方法更好捕获连续时间步的相关性
实际应用
该方法支持动态查询不同分位点以优化资源权衡,例如:
- 调整24小时交付保证率(95%→94%)可能大幅降低库存需求
- 微小库存增加即可提升客户满意度阈值
技术演进
- 继承某机构2017年MQ-CNN模型思想,扩展后支撑需求预测系统
- 与样条分位数函数RNN(原为实习生项目)技术关联
- 代码已开源至GluonTS概率时间序列库
实验验证
- 单变量:5个和20个锚点对比显示密度增加提升近似精度
- 多变量:在多变量高斯数据集上,自相关图证明能更好捕获连续时间步关联