Meta为Instagram实施了一个新的机器学习框架,该框架应用多样性算法来减少重复内容,同时保持用户参与度。这种多样性感知排名系统通过向现有参与模型引入乘法惩罚,解决了对相似内容创作者和产品类型的过度曝光问题。
该框架主要解决两个问题:来自同一内容创作者的过多消息,以及过度强调单一产品界面(如Stories)而忽视Feed或Reels内容。Instagram的机器学习模型之前主要针对点击率和参与度指标进行优化,这导致用户收到重复消息,感觉像垃圾信息并可能促使他们关闭通知。
根据Instagram工程师的说法:
真正的挑战在于找到合适的平衡点:我们如何在不大幅牺牲Instagram个性化体验和相关性的情况下,为通知体验引入有意义的多样性?
新系统作为现有参与模型之上的多样性层运行。通知候选会从多个维度进行评估,包括内容类型、作者身份、通知类别和产品界面。对于被认为与最近通知过于相似的候选,该框架应用经过校准的乘法惩罚来降低其相关性得分。一个范围在0到1之间的降级乘数会调整基础得分,并降低冗余通知的排名。工程师可以为每个维度配置权重,以微调相关性和多样性之间的平衡,为不同团队提供灵活性以适应其产品需求。
数学实现使用基础相关性得分乘以范围在零到一之间的多样性降级因子。对于每个语义维度,系统使用最大边际相关性方法计算通知候选与历史通知之间的相似性信号。二进制相似性指示器确定候选是否超过每个维度的预定义阈值。
Instagram工程师报告称,该框架显著减少了每日通知量,同时提高了点击率。该系统提供了可扩展性,可在不同维度中纳入自定义惩罚逻辑,并通过可配置权重调整降级强度的灵活性。该方法旨在平衡个性化和多样性,确保通知保持相关性的同时引入多样性。
根据Instagram团队的说法,未来的方向包括探索动态降级策略,其中惩罚强度会根据上下文(如通知时间或频率)进行调整。工程团队计划研究大型语言模型如何测量语义相似性以增强通知多样性。
正如Instagram和Meta工程师所提到的,该公司的方法反映了机器学习应用中的更广泛趋势,即调整排名系统以管理个性化和多样性。类似技术可以应用于推荐系统、搜索引擎和排名平台,以在保持相关性的同时减少冗余。