Instagram通知质量提升:Meta推出基于机器学习的多样性排序框架

Meta工程师团队分享了Instagram通知排序系统的创新框架,通过引入多样性感知算法和机器学习模型,在保持用户参与度的同时减少重复内容。该技术方案包含多维相似度计算、惩罚因子设计和动态降权机制,显著提升了通知质量和用户体验。

Instagram通知质量提升:Meta推出基于机器学习的多样性排序框架

我们正在分享Meta如何应用机器学习(ML)和多样性算法来提升通知质量和用户体验。我们引入了多样性感知的通知排序框架,以减少同质化现象,并提供更多样化、更具吸引力的通知组合。这一新框架在降低通知总量的同时,通过更广泛的触达实现了更高的参与率。

通知是将用户重新吸引回Instagram并提升参与度的最有效工具之一。无论是朋友点赞您的照片、亲密好友发布动态,还是推荐您可能感兴趣的短视频,通知都有助于实时呈现重要时刻。Instagram利用机器学习模型来决定应向谁发送通知、何时发送以及包含什么内容。这些模型经过训练,以优化用户正向参与指标,如点击率(CTR)——用户点击通知的概率——以及停留时间等其他指标。

然而,尽管以参与度优化的模型在推动互动方面很有效,但它们可能会过度优先推荐用户之前互动过的产品类型和作者。这可能导致用户过度接触相同的创作者或相同类型的产品,同时错过其他有价值且多样化的体验。这意味着用户可能会错过那些能带来更平衡、更满意和更丰富体验的内容。长此以往,这会使通知显得像垃圾信息,并增加用户完全关闭通知的可能性。

真正的挑战在于找到恰当的平衡点:我们如何在保持Instagram用户所期望的个性化和相关性的同时,为通知体验引入有意义的多样性?

为了解决这个问题,我们引入了多样性感知的通知排序框架,帮助传递更多样化、更精心策划且更少重复的通知。该框架显著减少了每日通知量,同时提高了点击率。它还带来了以下优势:

  • 支持为每个维度集成定制化软惩罚(降权)逻辑的扩展性,实现更自适应和复杂的多样性策略
  • 通过可调节权重跨维度(如内容、作者、产品类型)调整降权强度的灵活性
  • 平衡个性化和多样性的集成,确保通知既保持相关性又具有多样性

缺乏多样性的通知风险

通知中的过度曝光问题通常以两种主要方式显现:

同一作者的过度曝光:用户可能收到主要关于同一好友的通知。例如,如果某人经常与特定好友的内容互动,系统可能会持续仅推荐该用户的动态通知——忽略他们同样互动的其他好友。这会让人感到重复和单一,降低通知的整体价值。

同一产品表面的过度曝光:用户可能主要收到来自同一产品表面(如动态)的通知,即使动态消息或短视频可能提供价值。例如,某人可能对短视频和动态通知都感兴趣,但最近更频繁地与动态互动。由于系统高度优先考虑历史互动,它仅发送动态通知,忽略了用户更广泛的兴趣。

介绍Instagram的多样性感知通知排序框架

Instagram的多样性感知通知排序框架旨在通过平衡用户参与度的预测潜力与内容多样性需求来提升通知体验。该框架在现有参与度机器学习模型之上引入了一个多样性层,对这些模型生成的候选分数应用乘法惩罚,如下图所示。

多样性层评估每个通知候选与最近发送的通知在多个维度(如内容、作者、通知类型和产品表面)上的相似性。然后应用精心校准的惩罚——表示为乘法降权因子——对过于相似或重复的候选进行降级排序。调整后的分数用于重新排序候选,使系统能够选择在保持高参与潜力的同时引入有意义多样性的通知。最终,质量门槛会选择通过排序和多样性标准的最高排名候选。

图1:Instagram的多样性感知排序框架,其中多样性层位于现有建模层之上,惩罚与最近发送通知过于相似的候选。

数学公式

在多样性层中,我们对每个候选的基础相关性分数应用乘法降权因子。给定通知候选𝑐,我们将其最终分数计算为其基础排序分数与多样性降权乘数的乘积:

1
最终分数 = R(c) × D(c)

其中R(c)代表候选的基础相关性分数,D(c) ∈ [0,1]是基于与最近发送通知相似度的惩罚因子。我们定义了一组语义维度(例如作者、产品类型),希望在这些维度上促进多样性。对于每个维度i,我们使用最大边际相关性(MMR)方法计算候选c与历史通知集合H之间的相似性信号pi(c):

1
pi(c) = max_{h∈H} simi(c,h)

其中simi(·,·)是维度i的预定义相似性函数。在我们的基线实现中,pi(c)是二元的:如果相似性超过阈值𝜏i,则等于1,否则为0。

最终降权乘数定义为:

1
D(c) = ∏_{i} [1 - wi × pi(c)]

其中每个wi ∈ [0,1]控制其各自维度的降权强度。该公式确保沿一个或多个维度与先前发送通知相似的候选被按比例降权,减少冗余并促进内容变化。使用乘法惩罚允许跨多个维度的灵活控制,同时仍保留高相关性候选。

多样性感知排序的未来

随着我们持续演进通知多样性感知排序系统,下一步是引入更自适应、动态的降权策略。我们计划使降权强度响应通知量和发送时间,而不是依赖静态规则。例如,随着用户收到更多通知——尤其是相似类型或快速连续的通知——系统逐步对新的通知候选应用更强的惩罚,有效缓解因高通知量或密集发送带来的压倒性体验。

长期来看,我们看到将大型语言模型(LLMs)引入多样性管道的机遇。LLMs可以通过理解消息间的语义相似性并以更多样化、用户友好的方式重新表述内容,帮助我们超越表面规则。这将使我们能够用更丰富的语言和改进的相关性来个性化通知体验,同时在主题、语气和时间上保持多样性。

comments powered by Disqus
使用 Hugo 构建
主题 StackJimmy 设计