语音搜索技术优化背后的科学原理

语音搜索的挑战与创新解决方案

使用电视遥控器输入想看的节目名称体验欠佳——需要在屏幕上移动光标逐个选择字母，还容易选错字符。语音搜索虽更方便，但也存在识别误差问题。例如当用户搜索节目《Hunted》时，系统可能误听为"haunted"而返回错误结果。

2022年11月推出的新搜索系统通过整合多个机器学习模型，生成发音相似的备选查询词来扩大搜索范围。该系统包含三个核心组件：

当用户说出"Find Encanto"时，自动语音识别(ASR)系统可能误转为"Find Encounter"。传统搜索算法会直接执行错误查询，而PBR系统会同时搜索发音相似的"Encanto"和"Encounter"。

系统为每个备选查询生成置信度评分，预测用户点击可能性。例如搜索"Enchanted"时：

该系统已建立数百万个查询映射关系，在模糊搜索场景中将用户点击率提升10%以上。当前处理约2000万唯一搜索词中，80%使用PBR技术增强。

研发团队正在构建反馈学习系统，未来将实现：自动生成新搜索候选词、淘汰无效映射、持续优化置信度评分精度，通过深度理解多样化语音和内容特征，持续提升首次搜索成功率。