DRIVE:面向智能车辆环境的非流畅性丰富合成对话数据生成框架
摘要
车载对话AI正随着自动驾驶汽车和智能助手的广泛采用而变得日益重要。然而,现有数据集未能捕捉真实驾驶员与AI对话中特有的自发非流畅现象,如犹豫、错误起始、重复和自我修正。为解决这一问题,我们推出了DiscoDrive——一个包含3500个多轮对话的合成语料库,覆盖七个汽车领域,采用两阶段提示驱动流程动态整合非流畅性。实验表明,DiscoDrive既可作为训练资源使DialoGPT-Medium和T5-Base模型在MultiWOZ 2.2和Schema-Guided Dialogue相关测试集上达到或超越KVRET训练模型的表现(BLEU-4提升0.26至0.61;METEOR提升2.10;ROUGE-L提升3.48;BERTScore F1提升1.35至3.48),也可作为低资源场景下的数据增强资源,与10%的KVRET数据结合时可带来额外增益(BLEU-4提升0.38,METEOR提升1.95,ROUGE-L提升2.87,BERTScore F1提升4.00)。人工评估进一步证实,从DiscoDrive采样的对话在自然度(3.8 vs 3.6)和连贯性(4.1 vs 4.0)上均优于KVRET人工收集的对话,且在不影响清晰度的前提下,比领先的后处理方法(如LARD)更具上下文适应性。DiscoDrive填补了现有资源的关键空白,成为训练和增强对话AI的多功能语料库,能够稳健处理真实世界中的非流畅车载交互。
主题分类
计算与语言(cs.CL)
技术核心
- 两阶段提示驱动流程:动态整合非流畅性 during synthesis
- 多领域覆盖:涵盖导航、娱乐、气候控制等七个汽车领域
- 性能验证:在MultiWOZ 2.2和Schema-Guided Dialogue数据集上验证有效性
- 数据增强应用:在低资源场景下显著提升模型性能
实验指标
- 自动评估:BLEU-4、METEOR、ROUGE-L、BERTScore F1
- 人工评估:自然度、连贯性、上下文适应性
- 对比基线:KVRET、LARD等现有方法
贡献价值
- 填补车载对话数据中非流畅性表征的空白
- 提供兼具训练和增强功能的合成语料库
- 显著提升对话AI在真实车载环境中的鲁棒性