确保顾客不错过趋势商品
推荐系统通常倾向于推荐长期受欢迎的商品,无论是大众流行还是特定用户群体偏好的产品。但基于流行度的推荐可能错过趋势商品——那些尚未达到高销量但正快速提升热度的产品。顾客在执行查询时,若错过两三天后可能改变市场格局的新产品,可能会感到失望。
为解决这一问题,采用时间序列预测来预测近期可能流行的商品。该方法在今年的ACM推荐系统会议(RecSys)上发表。
趋势定义与模型架构
首先从速度(每个时间步顾客与商品页面的交互次数)和加速度(速度随时间步的变化率)两个维度严格定义趋势。随后提出一种新颖的机器学习方案:
- 预训练阶段:模型基于下一项推荐任务进行预训练,学习产品特征及其与交互模式的关联
- 微调阶段:模型针对趋势预测(加速度率)任务进行微调
该模型名为TrendRec,通过与三种基线模型比较进行评估:
- 简单马尔可夫模型(假设恒定加速度)
- 指数移动平均模型(基于过去八个时间步的加权加速度预测)
- 基于加速度率时间序列训练的神经网络
表示学习与训练过程
预训练过程的目标是让模型学习对趋势预测任务有用的产品表示。假设同一顾客群体交互的产品会随时间呈现相似的流行趋势。
预训练任务是根据顾客的交互历史预测其下一个可能交互的产品。模型学习生成两个向量表示(嵌入):
- 顾客偏好嵌入
- 产品特征嵌入
微调阶段使用产品特征嵌入,但不使用顾客偏好嵌入,因为假设偏好嵌入已经影响了产品特征嵌入。
时间间隔选择的关键作用
在训练过程中,预测加速度率的时间间隔选择至关重要:
- 间隔过短:数据噪声过大
- 间隔过长:流行高峰可能已消退
实验发现,最简单的恒定加速度启发式方法能够有效估计可行性-时间间隔曲线的形状,从而帮助选择合适的时间间隔。
实验结果与评估
在五个数据集上使用两种指标评估:
- 归一化累计加速度
- 趋势归一化折损累计收益(TNDCG)
两种神经网络模型显著优于启发式基线,但TrendRec在所有测试中表现最佳,在某个数据集上相比基线神经网络模型提升15-16%。
结果表明加速度率的变化遵循数据中可识别的非线性模式,而结合产品特征知识的模型能够更好地捕捉这些模式。
相关研究领域:搜索与信息检索 标签:推荐系统、时间序列、统计预测