有偏图采样优化关联商品推荐技术
研究背景
电子商务平台经常需要向用户推荐与查询商品相关的产品,例如为购买手机的用户推荐手机壳。产品关系通常用有向边图表示,其中边关系具有单向性:向购买手机的用户推荐手机壳合理,但反向推荐则不合适。
技术方案
在去年欧洲机器学习会议(ECML)发表的论文中,研究团队展示了图神经网络(GNN)可以通过为每个图节点使用双重嵌入(向量表示)来捕捉产品相似性图的方向性:一个嵌入表示节点作为推荐源,另一个表示作为推荐目标。
在今年ACM网络搜索与数据挖掘会议(WSDM)上,团队进一步提出了一种新的有向图节点嵌入方法。该方法根据图节点的度(与其他节点的连接数)定制嵌入过程,从而利用高度连接节点的中心性,同时扩大范围收集稀疏连接节点的信息。
关键技术特点
-
动态邻域调整:BLADE方法根据被嵌入节点的入度(入向边的度)动态调整嵌入范围。通过考虑节点入度和图中所有节点最小入度的幂律分布来计算邻域大小。
-
智能采样机制:在嵌入过程中,通过综合考虑节点的入度和出度来加权采样相邻节点的概率,避免均匀采样导致的信息损失。
-
双重嵌入框架:延续先前工作的框架,为每个节点生成源嵌入和目标嵌入。
实验结果
在六个不同公共数据集上,使用三种不同推荐数量(5/10/20)进行实验比较。新模型在所有情况下均优于三个最先进的先前模型,以命中率和平均倒数排名衡量,其优势范围从4%到230%。
在两个大型内部数据集上的测试同样显示显著改进,与次优性能模型相比提升幅度达40%至214%。
技术价值
该方法解决了传统GNN的两个局限性:固定邻域大小无法适应不同连接度节点的需求,以及均匀采样无法充分利用高度连接节点的信息丰富性。通过自适应调整采样策略,显著提升了推荐系统的准确性和效率。
相关研究成果详见WSDM 2023会议论文《BLADE: Biased neighborhood sampling based graph neural network for directed graphs》。