分层时间序列预测新方法提升准确率

本文介绍了一种端到端的层次时间序列预测方法,通过神经概率模型和投影技术确保层次一致性,在多个数据集上实现6%-44%的准确率提升,解决了传统方法无法跨层次共享信息和处理概率预测的问题。

分层时间序列预测新方法提升准确率

时间序列预测通常具有层次结构:例如某机构可能需要预测区域、州和国家级别的能源消耗;零售商可能需要按颜色、型号、品牌、产品类别等逐级汇总的销售预测。传统方法为层次结构中每个时间序列单独建立局部模型,然后通过后处理协调不同层级(确保相机品牌销售额等于该品牌下各型号销售额之和)。这种方法存在两个主要缺陷:无法实现跨层级预测共享(低层级数据的稀疏性等特征在高层级可能被聚合消除),且面向平均情况的协调过程会削弱特定情况下高度预测性的非线性特征。

在机器学习国际会议(ICML)上发表的研究提出了一种新方法,使用端到端训练的单一机器学习模型,同时预测层次结构所有层级的输出并实现协调。与文献中除一种方法外的所有方法不同,该方法支持概率预测(而非单值点预测),这对智能下游决策至关重要。

在五个数据集上与九种现有模型的对比测试显示:

  • 四个数据集上新模型均优于所有基线,误差率较第二名降低6%-19%
  • 一个数据集上某基线模型误差率低8%,但该基线在另一数据集完全失效
  • 其余三个数据集上新模型优势达13%-44%

技术实现架构

模型包含两个核心组件:

  1. 神经概率预测网络:接收分层时间序列输入,输出各层级的概率分布预测(如高斯分布的均值和方差)
  2. 一致性保障模块:从分布中采样并确保层次一致性(各级数值为下级数值之和)

关键技术突破

  • 重参数化技巧:将采样过程移出神经网络,通过从标准分布(如均值0方差1的高斯分布)采样,通过可微函数转换为学习分布的样本:$x = m + S^{1/2}z$(其中$z$为标准分布样本,$m$和$S$为学习分布的参数)
  • 矩阵化层次约束:将层次关系表示为矩阵,定义满足约束的样本子空间
  • 投影优化:将协调步骤转化为优化问题,通过投影变换将样本映射到层次矩阵定义的子空间(见动画演示)

实际效果与优势

一致性约束不仅未降低精度,反而通过跨层级信息共享提升了预测准确性。高层级预测通常更容易,这种共享使最底层级精度持续改善。实验采用DeepVAR网络进行时间序列预测,并以闭式解解决协调问题。该方法具有通用性,可适配多种神经预测网络、概率分布、投影方法和损失函数。

端到端分层时间序列预测完整架构

comments powered by Disqus
使用 Hugo 构建
主题 StackJimmy 设计