时间序列预测提升趋势商品识别准确率

本文介绍了一种结合时间序列预测和两阶段训练的新型推荐系统方法,通过产品特征嵌入和加速度预测,有效识别即将流行的商品趋势,相比基准模型准确率提升15-16%。

确保顾客不错过趋势商品

推荐系统通常倾向于推荐长期受欢迎的商品,无论是大众流行还是特定用户群体偏好的产品。但基于流行度的推荐可能错过趋势商品——那些尚未达到高销量但正快速提升热度的产品。顾客在执行查询时,若错过两三天后可能改变市场格局的新产品,可能会感到失望。

为解决这一问题,采用时间序列预测来预测近期可能流行的商品。该方法在今年的ACM推荐系统会议(RecSys)上发表。

趋势定义与模型架构

首先从速度(每个时间步顾客与商品页面的交互次数)和加速度(速度随时间步的变化率)两个维度严格定义趋势。随后提出一种新颖的机器学习方案:

  1. 预训练阶段:模型基于下一项推荐任务进行预训练,学习产品特征及其与交互模式的关联
  2. 微调阶段:模型针对趋势预测(加速度率)任务进行微调

该模型名为TrendRec,通过与三种基线模型比较进行评估:

  • 简单马尔可夫模型(假设恒定加速度)
  • 指数移动平均模型(基于过去八个时间步的加权加速度预测)
  • 基于加速度率时间序列训练的神经网络

表示学习与训练过程

预训练过程的目标是让模型学习对趋势预测任务有用的产品表示。假设同一顾客群体交互的产品会随时间呈现相似的流行趋势。

预训练任务是根据顾客的交互历史预测其下一个可能交互的产品。模型学习生成两个向量表示(嵌入):

  • 顾客偏好嵌入
  • 产品特征嵌入

微调阶段使用产品特征嵌入,但不使用顾客偏好嵌入,因为假设偏好嵌入已经影响了产品特征嵌入。

时间间隔选择的关键作用

在训练过程中,预测加速度率的时间间隔选择至关重要:

  • 间隔过短:数据噪声过大
  • 间隔过长:流行高峰可能已消退

实验发现,最简单的恒定加速度启发式方法能够有效估计可行性-时间间隔曲线的形状,从而帮助选择合适的时间间隔。

实验结果与评估

在五个数据集上使用两种指标评估:

  1. 归一化累计加速度
  2. 趋势归一化折损累计收益(TNDCG)

两种神经网络模型显著优于启发式基线,但TrendRec在所有测试中表现最佳,在某个数据集上相比基线神经网络模型提升15-16%。

结果表明加速度率的变化遵循数据中可识别的非线性模式,而结合产品特征知识的模型能够更好地捕捉这些模式。

相关研究领域:搜索与信息检索 标签:推荐系统、时间序列、统计预测

comments powered by Disqus
使用 Hugo 构建
主题 StackJimmy 设计