潜在目标推断能力
某中心致力于让用户与语音助手的交互如同人际对话般自然。最新研发的能力使语音助手能够推断用户的潜在目标——即用户请求中隐含但未直接表达的需求。例如当用户询问"泡茶需要多久?",潜在目标可能是设置泡茶计时器。系统在回答"建议浸泡五分钟"后,会主动追问"是否需要设置五分钟计时器?"
技术架构详解
触发模型
首先通过基于深度学习的触发模型判断是否需要进行潜在目标预测。该模型综合分析对话上下文的多维度特征,包括当前会话文本历史及用户过往与多技能建议的互动记录。早期实验表明,并非所有对话场景都适合进行潜在目标发现,该模型能有效避免错误推断(如将"鸡肉食谱"查询误关联到"播放鸡叫声")。
潜在目标发现模型
该模型通过分析用户语句的多种特征实现预测:
- 采用点间互信息衡量特定交互模式在给定上下文中的出现概率
- 深度学习子模块评估语句重构意图或新指令发布倾向
- 识别直接目标与潜在目标间的实体关联性(如泡茶时间值)
模型通过主动学习持续优化预测精度,自动识别对模型微调具有高信息量的样本交互。
语义处理与执行
语义角色标注模型从当前对话(包括助手响应)中提取命名实体和参数,上下文传递模型将这些实体转换为结构化格式,确保第三方技能即使使用自有本体系统也能无缝消费这些数据。通过Bandit学习算法自动追踪推荐效果,对表现不佳的体验进行动态抑制。
实施效果
该技术已在美国英语版语音助手部署,无需技能开发者额外适配。开发者可通过无名称交互工具包提升技能在发现模型中的可见度。初期指标显示,潜在目标发现功能显著提升了部分开发者技能的用户参与度。