图神经网络提升电商需求预测准确率

本文介绍基于图神经网络的多维需求预测方法,通过构建产品-卖家关联图,将替代关系和需求关系纳入模型,相比传统方法预测准确率提升16%,在冷启动产品和多卖家场景下提升效果尤为显著。

数据关联提升需求预测:图神经网络在电商中的应用

预测客户产品需求是电商平台的核心任务,直接影响准时交付、仓储效率和卖家运输计划。传统预测模型虽基于多卖家多产品数据,但通常进行单维预测:仅依据特定卖家特定产品的历史需求。这种方法可能遗漏关键信息,如竞争对手缺货或新品发布对整体需求的影响。

在2021年欧洲机器学习会议(ECML)上,提出了一种新的需求预测方法,在预测时和训练时均考虑其他卖家与产品的关联性。该方法使用图结构表示这些关联,并通过图神经网络处理图形信息。实验表明,相比标准单维分析,预测准确率提升16%。在多卖家销售相同产品的情况下提升近30%,在历史数据不足三个月的冷启动产品上提升近25%。

图模型构建

在电子商务中,产品常通过类别关联,需求模式存在相关性。基于神经网络的需求预测模型在包含关联产品的数据集上训练时,可学习提取隐含部分相关性的高阶特征。本研究开发了更系统的方法,使用时序图神经网络建模不同实体间的相关性。

图由节点(通常用圆圈表示)和边(连接节点的线段)组成,边可携带表示节点间关系的值。我们使用包含两类节点(产品和卖家)和两类边(需求关系和替代关系)的图表示数据关联。需求边连接卖家与产品,替代边连接产品之间。

每个节点关联特征向量,表示该产品或卖家的特定属性。产品特征包括品牌、类别、销量、浏览量等;卖家特征包括评分、评论、总订单量、产品总浏览量等。每个需求边关联的特征向量表示卖家与产品间的关系,如该卖家特定产品的浏览量、订单量、缺货状态等。每个替代边关联二元值,表示产品是否可相互替代(基于客户选择证据)。在时间序列的每个时间步构建此类图,表示该时间步的特征集。

神经网络模型

每个时间步的图通过图神经网络处理,生成图中每个节点的定长向量表示(嵌入)。该表示考虑了节点邻居特征及连接边。图神经网络的输出与每个时间步的静态特征(如距下一个主要假期的天数、银行特殊融资优惠等)拼接。

拼接后的表示按顺序传递到编码器-解码器架构网络。编码器包含时序卷积网络(TCN)或长短期记忆(LSTM)网络,捕获历史需求数据特征。编码器输出表示整个时间序列,考虑连续时间步间的依赖关系。该表示传递到解码器模块生成最终预测。

整个模型端到端训练,使图神经网络和编码器学习生成对最终预测有用的表示(以静态特征为条件)。

实验结果

测试了四种图神经网络:

  • 同质图卷积网络:标准化节点特征,所有节点同等处理
  • GraphSAGE网络:通过对节点邻居采样减少密集连接图的计算负担
  • 异质GraphSAGE网络:处理不同类型节点
  • 异质图注意力网络:为给定节点的邻居分配不同权重

每种网络测试不同输入:仅节点;节点和需求边;节点及需求和替代边。所有模型中,添加更多边数据显著提升性能,表明模型利用了数据的图形表示。图注意力网络表现最佳,最佳模型为包含两类边信息的图注意力网络。

研究领域:运筹学与优化
标签:需求预测、图神经网络(GNNs)
会议:ECML-PKDD 2021
相关论文:《在线市场需求预测的时空多图网络》

comments powered by Disqus
使用 Hugo 构建
主题 StackJimmy 设计