电商平台价格实验的科学方法

本文探讨了在电商平台进行价格实验的科学方法,包括时间绑定实验、触发干预实验、随机天数实验和交叉实验等设计,以及如何应对溢出效应和残留效应,使用机器学习模型提高实验精度。

电商平台价格实验的科学方法

电商平台中产品的价格反映了需求、季节性和总体经济趋势等一系列因素。定价策略通常涉及考虑这些因素的公式;较新的定价策略通常依赖机器学习模型。

通过某中心的定价实验室,可以进行一系列在线A/B实验来评估新的定价策略。由于采用非歧视性定价原则——所有访客在同一时间看到所有产品的相同价格——需要随时间对产品价格应用实验处理,而不是同时在不同客户上测试不同价格点。这使实验设计变得复杂。

在一篇发表于《商业经济学杂志》并在美国经济学会年会上展示的论文中,描述了一些可以进行的实验,以防止溢出效应、提高精度,并在评估新定价策略时控制需求趋势和处理组差异。

实验类型

时间绑定实验

可以执行的最简单实验类型是时间绑定实验,其中对特定类别中的某些产品应用处理,而将其他产品作为对照组保持不变。

触发干预实验

这类实验中的一个潜在噪声源是外部事件——例如,不同商店对同一产品的临时折扣——可能影响处理效果。如果可以提前定义这些类型的事件,可以进行触发干预,将处理和对照期的开始时间与事件发生时间同步。这可能导致不同产品实验的开始时间错开。

随机天数实验

如果产品的需求曲线足够相似,且处理组和对照组结果差异足够显著,时间绑定和触发实验可能足够。但对于更精确的定价策略评估,可能需要在同一产品上运行处理和对照实验,如典型的A/B测试。这需要切换实验。

最直接的切换实验是随机天数实验,其中每天每个产品随机分配到对照组或处理组。分析表明,随机天数可以将实验结果的标准误差降低60%。

交叉实验

任何切换实验的一个缺点是残留效应的风险,即处理效果从实验的处理阶段延续到对照阶段。例如,如果处理增加了产品的销量,推荐算法可能更频繁地推荐该产品。这可能在对照期间人为地提高产品销量。

可以通过在过渡到处理和对照阶段时设立黑屏期来对抗残留效应。例如,在交叉实验中,可能对组中的某些产品应用处理,将其他产品作为对照,但丢弃第一周的数据。然后,在收集足够数据后,从先前的处理组中移除处理,并将其应用于先前的对照组。再次丢弃第一周的数据,让残留效应消退。

交叉实验可以将结果测量的标准误差降低40%至50%。虽然不如随机天数好,但残留效应得到了缓解。

异质面板处理效果

某中心定价实验室还提供了两种更复杂的评估定价策略的方法。第一种是异质面板处理效果(HPTE)。

HPTE是一个四步过程:

  1. 从去趋势数据估计产品级第一差异。
  2. 过滤异常值。
  3. 使用因果森林从分组产品估计第二差异。
  4. 通过自助法数据估计噪声。

溢出效应

在某中心定价实验室,还研究了衡量溢出效应的方法,即一个产品的处理导致另一个类似产品需求变化的情况。这可能会影响处理效果的测量。

为了纠正溢出效应,需要对其进行测量。该过程的第一步是构建具有相关需求的产品图。

从根据某中心商店目录中的细粒度分类等标准相互关联的产品列表开始。对于每对相关项目,查看一年的数据以确定一个价格的变化是否影响另一个的需求。如果这些连接足够强,通过在可替代项目图中用边连接产品。

从图中计算任何给定对可替代产品被包含在同一实验中的概率,以及它们将被分配到处理组还是对照组。从这些概率中,可以使用逆概率加权方案来估计溢出对观察结果的影响。

然而,估计溢出效应不如消除它好。一种方法是将可替代产品视为单个产品类别,并将它们整体分配到处理组或对照组。这确实降低了实验的效力,但使业务合作伙伴相信结果没有被溢出效应污染。

为了确定每个产品类别中包括哪些产品,使用一种聚类算法,该算法在可替代产品图中搜索密集互连区域,并切断这些区域与图中其余部分的连接。在迭代过程中,这将图划分为密切相关的产品簇。

在模拟中,发现这种聚类过程可以将溢出偏差减少37%。

comments powered by Disqus
使用 Hugo 构建
主题 StackJimmy 设计