基于多数投票LLM重排增强的图推荐系统
摘要
推荐系统常常因有限的用户-物品交互而遭受数据稀疏性问题,这会导致性能下降并在现实场景中放大流行度偏差。本文提出了一种新颖的数据增强框架,利用大语言模型(LLMs)和物品文本描述来丰富交互数据。通过多次少样本提示LLM重排物品并采用多数投票聚合结果,生成具有理论保证的高置信度合成用户-物品交互。为了在图推荐系统中有效利用增强数据,将其整合到图对比学习框架中以缓解分布偏移和减轻流行度偏差。大量实验表明,该方法提高了准确性并减少了流行度偏差,优于强基线模型。
方法框架
数据增强流程
采用大语言模型对物品进行多次少样本提示重排,通过多数投票机制聚合重排结果,生成高质量的合成用户-物品交互数据。该方法基于度量集中理论提供理论保证。
图对比学习集成
将增强后的数据整合到图推荐系统中,采用图对比学习框架来处理分布偏移问题,同时有效缓解推荐系统中的流行度偏差。
实验结果
大量实验验证表明,所提出的方法在推荐准确性方面显著提升,同时有效降低了流行度偏差,在多个基准测试中均优于现有强基线模型。
技术贡献
- 提出基于LLM重排和多数投票的数据增强框架
- 开发理论保证的合成交互生成方法
- 设计图对比学习集成方案解决分布偏移问题
- 实证验证方法在准确性和偏差缓解方面的有效性