伪标签与负样本优化语音技能匹配技术

本文介绍某中心研究人员通过伪标签生成、负反馈学习和自蒸馏技术,提升语音助手在多标签分类中的技能匹配准确率,使动态仲裁系统的F1分数提升1.25%,有效解决超10万技能场景下的标注难题。

动态仲裁与多技能匹配挑战

某语音助手目前已拥有超过10万项技能。为提升用户体验,某机构采用动态仲裁技术,使用户无需记忆特定技能名称即可通过自然请求调用功能。例如"播放大象声音"的请求可能同时被AnimalSounds、AnimalNoises等多个技能处理。

传统标注方法的局限性

传统单标签标注方式(每个语句仅标注一个技能)难以应对多技能匹配场景。而人工进行多标签标注面临两大挑战:

  1. 需要标注人员熟悉全部10万+技能的详细功能
  2. 技能库持续更新导致标注数据快速过期

三重技术解决方案

在ICASSP 2020会议上提出的方法包含三个核心技术:

1. 伪标签生成

  • 使用训练后的动态仲裁系统为语句分配技能
  • 将高置信度的技能分配作为附加标签(伪标签)
  • 实验显示设置p=2( top2标签)和r=4(连续4个周期)时效果最佳

2. 负反馈学习

  • 将错误分类实例(如技能返回"我不知道"的情况)作为负样本
  • 在微调过程中对高置信度选择负样本标签的行为进行惩罚

3. 自蒸馏技术

  • 收集系统对训练集所有样本的分类统计信息
  • 将这些统计信息与训练样本一起输入到下一训练周期
  • 防止系统对少数强相关样本过度拟合

系统架构与性能提升

动态仲裁系统包含两个核心组件:

  • Shortlister:生成候选技能短列表
  • 假设重排序器(HypRank):基于用户账户设置和对话上下文精确排序候选技能

实验表明,三重技术组合使动态仲裁系统的F1分数提升1.25%。值得注意的是,伪标签对HypRank的性能提升效果优于Shortlister,因为多标签训练增加了Shortlister输出中包含至少一个正确标签的概率,从而为HypRank提供更多有效训练样本。

未来研究方向

未来将探索:

  • 自蒸馏与伪标签技术的深层关系
  • 将伪标签、负反馈学习和自蒸馏与标准半监督学习相结合
  • 使用训练网络自动标注未标注样本并重新训练网络的闭环优化方案

相关论文:《Pseudo Labeling and Negative Feedback Learning for Large-scale Multi-label Domain Classification》

comments powered by Disqus
使用 Hugo 构建
主题 StackJimmy 设计