潜在目标推断能力
某中心对语音助手的目标是让用户感觉像与人类交流一样自然。为实现这一目标,研究人员开发了能够推断用户潜在目标的新功能——即用户请求中隐含但未直接表达的目标。例如当用户询问"泡茶需要多长时间"时,潜在目标可能是设置泡茶计时器。
新系统会先回答"五分钟是个不错的起点",随后追问"需要我设置五分钟的计时器吗?"
技术架构解析
触发模型
首先通过基于深度学习的触发模型判断是否适合进行潜在目标预测。该模型综合分析对话上下文的多方面特征,包括当前会话文本历史以及用户过去与多技能建议的互动记录。
潜在目标发现模型
该模型分析用户语句的多个特征,包括点间互信息(衡量特定上下文中交互模式相对于整体流量的出现概率)。基于深度学习的子模块还评估以下特征:
- 用户是否在重新表述先前指令
- 直接目标与潜在目标是否共享实体(如泡茶所需的时间值)
通过主动学习机制,模型能识别对后续微调具有重要价值的样本交互,持续优化预测精度。
语义角色标注与上下文传递
语义角色标注模型从当前对话中提取命名实体等参数,上下文传递模型将这些实体转换为结构化格式,确保后续技能(即使是使用自有本体的第三方技能)能够直接调用。
带宽学习优化
通过带宽学习机制跟踪推荐效果,自动抑制表现不佳的交互体验。
部署与影响
该功能已在美国英语版本中上线,技能开发者无需额外配置即可激活。开发者可通过使用无名称交互工具包提升技能在发现模型中的可见度。初期指标显示,潜在目标发现功能显著提升了用户与开发者技能的互动频率。
这项创新技术既帮助用户发现语音助手的技能生态,也切实提升了产品的实用价值。