图神经网络在相关商品推荐中的创新应用
在电子商务平台上,推荐相关商品(例如为手机推荐手机壳)是一项核心功能,既能节省客户时间又能提升购物体验。在欧洲机器学习会议(ECML)上,研究人员提出了一种基于有向图神经网络的相关商品推荐新方法。实验数据显示,该方法在命中率和平均倒数排名指标上比现有最优基准提升30%至160%,目前已在生产环境中部署。
技术挑战与解决方案
使用图神经网络进行商品推荐的主要难点在于商品间关系的不对称性。例如推荐手机壳给手机买家是合理的,但反向推荐则不符合逻辑。有向图能通过单向边捕捉这种不对称关系,但传统图神经网络嵌入难以有效表征方向性。
创新性地为每个图节点生成双重嵌入:
- 源嵌入:表征节点作为推荐源的角色
- 目标嵌入:表征节点作为推荐目标的角色
同时提出新型损失函数,鼓励模型沿出边选择推荐商品,抑制沿入边推荐的行为。
图构建与数据处理
产品图中节点代表商品,节点数据包含商品名称、类型、描述等元数据。通过共购数据添加方向边,这些边可能是单向(配件关系)或双向(互补商品)。为减少选择偏差,同时引入共视图数据生成的双向边来标识相似商品,最终形成包含共购边和相似边的混合图结构。
嵌入生成机制
图神经网络为每个节点生成捕获邻域信息的嵌入,采用两跳嵌入同时考虑直接邻居和次级邻居信息。关键创新在于源/目标嵌入的生成逻辑:
- 源嵌入整合所有相似关系+出向共购关系
- 目标嵌入整合所有相似关系+入向共购关系
多层GNN中,首层嵌入仅基于商品元数据,从第二层开始源/目标嵌入开始分化。源嵌入聚合目标节点的出边邻居信息,目标嵌入聚合源节点的入边邻居信息。
模型训练与评估
采用自监督对比学习进行训练,通过损失函数项强制实现嵌入不对称性。模型训练完成后,只需在嵌入空间寻找最接近的k个节点即可生成推荐。在两组数据集上进行的12项实验表明,该方法在Top5/10/20推荐指标上全面超越基准模型。
该方法通过结合商品元数据输入,还能有效解决新品冷启动问题。相关技术细节已在研究论文中完整阐述。