智能语音助手预测用户潜在目标的技术突破

本文介绍某中心研发的新型机器学习系统,通过潜在目标预测、触发模型和语义角色标注等技术,使语音助手能自动推断用户隐含需求并实现跨技能服务调用,显著提升对话自然度和用户参与度。

潜在目标推断能力

某中心致力于让用户与语音助手的交互如同人际对话般自然。最新研发的能力使语音助手能够推断用户的潜在目标——即用户请求中隐含但未直接表达的需求。例如当用户询问"泡茶需要多久?",潜在目标可能是设置泡茶计时器。系统在回答"建议浸泡五分钟"后,会主动追问"是否需要设置五分钟计时器?"

技术架构详解

触发模型

首先通过基于深度学习的触发模型判断是否需要进行潜在目标预测。该模型综合分析对话上下文的多维度特征,包括当前会话文本历史及用户过往与多技能建议的互动记录。早期实验表明,并非所有对话场景都适合进行潜在目标发现,该模型能有效避免错误推断(如将"鸡肉食谱"查询误关联到"播放鸡叫声")。

潜在目标发现模型

该模型通过分析用户语句的多种特征实现预测:

  • 采用点间互信息衡量特定交互模式在给定上下文中的出现概率
  • 深度学习子模块评估语句重构意图或新指令发布倾向
  • 识别直接目标与潜在目标间的实体关联性(如泡茶时间值)

模型通过主动学习持续优化预测精度,自动识别对模型微调具有高信息量的样本交互。

语义处理与执行

语义角色标注模型从当前对话(包括助手响应)中提取命名实体和参数,上下文传递模型将这些实体转换为结构化格式,确保第三方技能即使使用自有本体系统也能无缝消费这些数据。通过Bandit学习算法自动追踪推荐效果,对表现不佳的体验进行动态抑制。

实施效果

该技术已在美国英语版语音助手部署,无需技能开发者额外适配。开发者可通过无名称交互工具包提升技能在发现模型中的可见度。初期指标显示,潜在目标发现功能显著提升了部分开发者技能的用户参与度。


comments powered by Disqus
使用 Hugo 构建
主题 StackJimmy 设计