简化书籍发现的机器学习视觉自动补全建议
每天有数百万客户在某中心和其旗下音频平台搜索各种格式的书籍(有声书、电子书和纸质书)。传统的关键字自动补全建议虽然有用,但通常需要多个步骤才能让客户找到所需内容。某中心旗下音频平台接受了让书籍发现更直观和个性化的挑战,同时减少购买步骤。
开发了一种即时视觉自动补全系统,可增强某中心和其旗下音频平台的搜索体验。当用户开始输入查询时,该解决方案会提供带有书籍封面的视觉预览,使用户能够直接导航到相关着陆页,而不是搜索结果页。它还提供实时个性化格式推荐,并包含多个可搜索实体,例如书籍页面、作者页面和系列页面。
系统需要仅通过几次击键就能理解用户意图,并确定要显示的最相关书籍,同时还要为数百万次查询保持低延迟。使用历史搜索数据,将击键与产品匹配,将部分输入转换为有意义的搜索建议。为确保质量,实施了基于置信度的过滤机制,这对于区分"悬疑"等一般查询和特定标题搜索尤为重要。为反映客户最近的兴趣,系统对长期历史用户交互数据应用时间衰减函数。
为满足每个用例的独特需求,开发了两种不同的技术方法。在某中心旗下音频平台部署了深度配对学习排序模型。该模型考虑书籍对,并学习为更匹配客户查询的书籍分配更高分数。
深度配对学习排序模型的架构包含三个专用塔。左塔使用长短期记忆模型考虑上下文特征和最近的搜索模式,该模型顺序处理数据并在序列中发出新术语时考虑其先前的决策。中塔处理关键字和项目参与历史。右塔考虑客户品味偏好和产品描述以实现个性化。模型从配对示例中学习,但在运行时,它依赖书籍的绝对分数来组装排名列表。
对于某中心,实施了一种两阶段建模方法,涉及概率信息检索模型来确定最匹配每个关键字的书籍标题,以及第二个模型来个性化书籍格式(有声书、电子书和纸质书)。这种双策略方法在保持低延迟的同时仍能实现个性化。
在实践中,在搜索栏中输入"dungeon craw"的客户现在会看到《Dungeon Crawler Carl》书籍的视觉推荐,包括书籍封面,通过绕过搜索结果页面并将客户直接发送到产品详细信息页面来减少摩擦。在某中心旗下音频平台,系统还个性化自动补全结果,并通过相关连接丰富发现体验。这些包括指向作者完整作品的链接(如Matt Dinniman的作者页面),以及对于属于系列的标题,指向完整系列的链接(如Dungeon Crawler Carl系列)。
在某中心,当客户点击标题时,模型个性化正确的书籍格式(有声书、电子书、纸质书)推荐,并将客户引导至正确的产品详细信息页面。在这两种情况下,在客户输入一定数量的击键后,系统采用模型来检测客户意图(例如某中心的书籍标题意图或某中心旗下音频平台的作者意图),并确定应显示哪个视觉小部件。
某中心及其旗下音频平台的视觉自动补全比传统自动补全更快地向客户提供更相关的内容,其直接导航减少了查找和访问所需书籍的步骤——所有这些都在低延迟下处理数百万次查询。这项技术不仅使书籍发现更容易,而且为某中心生态系统未来搜索个性化和视觉发现的改进奠定了基础。