语音搜索的挑战与创新解决方案
使用电视遥控器输入想看的节目名称体验欠佳——需要在屏幕上移动光标逐个选择字母,还容易选错字符。语音搜索虽更方便,但也存在识别误差问题。例如当用户搜索节目《Hunted》时,系统可能误听为"haunted"而返回错误结果。
语音混合结果(PBR)技术架构
2022年11月推出的新搜索系统通过整合多个机器学习模型,生成发音相似的备选查询词来扩大搜索范围。该系统包含三个核心组件:
- Alex教师模型:基于海量互联网数据训练的大语言模型,持续使用电视语音流量和用户自我校正数据进行微调
- 用户行为学习模型:通过分析约40%用户在语音搜索失败后改用文本搜索的成功查询词,建立搜索词映射关系
- 语音变体识别模型:专门针对流行内容标题的发音变体进行识别
技术实现机制
当用户说出"Find Encanto"时,自动语音识别(ASR)系统可能误转为"Find Encounter"。传统搜索算法会直接执行错误查询,而PBR系统会同时搜索发音相似的"Encanto"和"Encounter"。
系统为每个备选查询生成置信度评分,预测用户点击可能性。例如搜索"Enchanted"时:
- 主查询点击率:60%
- 备选查询"Encanto"点击率:20%
- 备选查询"Disenchanted"点击率:5%
性能提升与未来方向
该系统已建立数百万个查询映射关系,在模糊搜索场景中将用户点击率提升10%以上。当前处理约2000万唯一搜索词中,80%使用PBR技术增强。
研发团队正在构建反馈学习系统,未来将实现:自动生成新搜索候选词、淘汰无效映射、持续优化置信度评分精度,通过深度理解多样化语音和内容特征,持续提升首次搜索成功率。