DRIVE：面向智能车辆环境的非流畅性丰富合成对话数据生成框架

摘要

车载对话AI正随着自动驾驶汽车和智能助手的广泛采用而变得日益重要。然而，现有数据集未能捕捉真实驾驶员与AI对话中特有的自发非流畅现象，如犹豫、错误起始、重复和自我修正。为解决这一问题，我们推出了DiscoDrive——一个包含3500个多轮对话的合成语料库，覆盖七个汽车领域，采用两阶段提示驱动流程动态整合非流畅性。实验表明，DiscoDrive既可作为训练资源使DialoGPT-Medium和T5-Base模型在MultiWOZ 2.2和Schema-Guided Dialogue相关测试集上达到或超越KVRET训练模型的表现（BLEU-4提升0.26至0.61；METEOR提升2.10；ROUGE-L提升3.48；BERTScore F1提升1.35至3.48），也可作为低资源场景下的数据增强资源，与10%的KVRET数据结合时可带来额外增益（BLEU-4提升0.38，METEOR提升1.95，ROUGE-L提升2.87，BERTScore F1提升4.00）。人工评估进一步证实，从DiscoDrive采样的对话在自然度（3.8 vs 3.6）和连贯性（4.1 vs 4.0）上均优于KVRET人工收集的对话，且在不影响清晰度的前提下，比领先的后处理方法（如LARD）更具上下文适应性。DiscoDrive填补了现有资源的关键空白，成为训练和增强对话AI的多功能语料库，能够稳健处理真实世界中的非流畅车载交互。

主题分类

计算与语言（cs.CL）

技术核心

两阶段提示驱动流程：动态整合非流畅性 during synthesis
多领域覆盖：涵盖导航、娱乐、气候控制等七个汽车领域
性能验证：在MultiWOZ 2.2和Schema-Guided Dialogue数据集上验证有效性
数据增强应用：在低资源场景下显著提升模型性能

实验指标

自动评估：BLEU-4、METEOR、ROUGE-L、BERTScore F1
人工评估：自然度、连贯性、上下文适应性
对比基线：KVRET、LARD等现有方法

贡献价值

填补车载对话数据中非流畅性表征的空白
提供兼具训练和增强功能的合成语料库
显著提升对话AI在真实车载环境中的鲁棒性

智能车载环境中的非流畅对话数据生成框架

本文介绍了一种针对智能车辆环境设计的非流畅对话数据生成框架DRIVE，能够合成包含犹豫、重复和自我修正等自然语言现象的对话数据，显著提升对话AI在车载场景中的性能表现。

DRIVE：面向智能车辆环境的非流畅性丰富合成对话数据生成框架

摘要

主题分类

技术核心

实验指标

贡献价值