智能车载环境中的非流畅对话数据生成框架

本文介绍了一种针对智能车辆环境设计的非流畅对话数据生成框架DRIVE,能够合成包含犹豫、重复和自我修正等自然语言现象的对话数据,显著提升对话AI在车载场景中的性能表现。

DRIVE:面向智能车辆环境的非流畅性丰富合成对话数据生成框架

摘要

车载对话AI正随着自动驾驶汽车和智能助手的广泛采用而变得日益重要。然而,现有数据集未能捕捉真实驾驶员与AI对话中特有的自发非流畅现象,如犹豫、错误起始、重复和自我修正。为解决这一问题,我们推出了DiscoDrive——一个包含3500个多轮对话的合成语料库,覆盖七个汽车领域,采用两阶段提示驱动流程动态整合非流畅性。实验表明,DiscoDrive既可作为训练资源使DialoGPT-Medium和T5-Base模型在MultiWOZ 2.2和Schema-Guided Dialogue相关测试集上达到或超越KVRET训练模型的表现(BLEU-4提升0.26至0.61;METEOR提升2.10;ROUGE-L提升3.48;BERTScore F1提升1.35至3.48),也可作为低资源场景下的数据增强资源,与10%的KVRET数据结合时可带来额外增益(BLEU-4提升0.38,METEOR提升1.95,ROUGE-L提升2.87,BERTScore F1提升4.00)。人工评估进一步证实,从DiscoDrive采样的对话在自然度(3.8 vs 3.6)和连贯性(4.1 vs 4.0)上均优于KVRET人工收集的对话,且在不影响清晰度的前提下,比领先的后处理方法(如LARD)更具上下文适应性。DiscoDrive填补了现有资源的关键空白,成为训练和增强对话AI的多功能语料库,能够稳健处理真实世界中的非流畅车载交互。

主题分类

计算与语言(cs.CL)

技术核心

  • 两阶段提示驱动流程:动态整合非流畅性 during synthesis
  • 多领域覆盖:涵盖导航、娱乐、气候控制等七个汽车领域
  • 性能验证:在MultiWOZ 2.2和Schema-Guided Dialogue数据集上验证有效性
  • 数据增强应用:在低资源场景下显著提升模型性能

实验指标

  • 自动评估:BLEU-4、METEOR、ROUGE-L、BERTScore F1
  • 人工评估:自然度、连贯性、上下文适应性
  • 对比基线:KVRET、LARD等现有方法

贡献价值

  1. 填补车载对话数据中非流畅性表征的空白
  2. 提供兼具训练和增强功能的合成语料库
  3. 显著提升对话AI在真实车载环境中的鲁棒性
comments powered by Disqus
使用 Hugo 构建
主题 StackJimmy 设计