基于相似产品的问答预测方法
社区产品问答(PQA)是电子商务网站的重要功能。顾客会提出诸如"这条牛仔裤洗后会缩水吗?“或"这个盘子能放进微波炉吗?“等问题,其他顾客则根据自身经验进行回答。
许多电商平台还提供自动问答工具,旨在社区回复前即时解答问题。这些工具通常通过检索已解决问题档案中的潜在答案来工作。然而,由于产品新颖、罕见或未获得足够社区关注,往往无法找到相关的问答记录。
创新方法
研究人员提出了一种新颖方法,通过识别相似产品提出的相似问题来预测未解答问题的答案。该方法包含四个关键步骤:
步骤1:初步检索
针对特定产品的新问题,算法从其他产品的问答记录中检索数百条记录。每条记录包含问答对及相关产品数据。通过预训练嵌入的最近邻搜索进行快速相似度估算。
步骤2:语义筛选
使用经过训练的神经网络问题相似度模型,重新计算检索问题与新问题的语义相似度。仅保留高相似度记录。
步骤3:上下文产品相似度评估
通过创新的上下文产品相似度(CPS)模型,评估当前产品与保留产品在特定问题背景下的相似度。例如,两条牛仔裤在"能否放入烘干机"问题上可能相似,但在"是否有弹性"问题上可能不同。
步骤4:答案预测
利用CPS模型评分,在混合专家模型中对答案进行加权投票,最终预测客户问题的答案。
技术特点
CPS模型采用可扩展的无监督训练流程,利用大量已解决的产品问答数据(特别是是否型问题)进行离线训练。训练过程的关键是定位来自同一产品类别、且具有高度相似是否问题的产品对。
通过自动无监督程序生成大规模标注数据集,用于训练CPS模型。即使预测准确率尚未完美,通过返回用于预测的相关问答记录,客户可自行判断预测可靠性。这种辅助AI方法下的客户互动,可反馈至持续学习方法中进一步改进预测效果。
在针对多个产品类别的是否问题实验中,该方法预测准确率达到75%-80%,具体取决于可用相似产品的数量。除了预测答案外,系统还提供作为预测依据的相似问题和答案,帮助客户形成自己的判断。