机器翻译正式性控制竞赛获胜方案
在国际口语翻译会议(IWSLT)举办的"机器翻译正式性控制"竞赛中,某机构开发的正式性控制翻译系统获得第一名。在英日翻译任务中,经人工评估,其绝对准确率比第二名高出9.8个百分点。在英印地语翻译中,系统实现了近乎完美的准确率(正式99.6%,非正式99.8%)。
正式性控制的意义
传统机器翻译模型通常为每个输入返回单一翻译结果,不考虑使用场景或目标受众。这种无条件翻译虽然适用于多数情况,但无法适应不同地区的语言使用差异。若让模型自行选择表达方式,可能导致翻译结果使用不恰当的正式程度,在客服聊天等特定场景中可能显得失礼。
两阶段微调策略
研究团队采用两阶段微调策略训练正式性控制机器翻译模型:
- 在大规模平行翻译语料上微调mBART多语言模型,训练通用神经机器翻译模型
- 使用带有正式性标注的数据进一步微调模型,每个训练样本都标注有
<formal>
或<informal>
标签
在推理阶段,操作者可通过在输入文本后附加选择的正式性标签来控制翻译的正式程度。
解决数据稀疏问题
IWSLT竞赛的独特挑战在于数据稀疏:仅能获得数百个正式性标注样本用于微调。为此团队开发了数据增强方法:
- 利用语言线索自动标注目标文本(日语和印地语)的正式性标签
- 使用种子集训练多语言BERT作为文本正式性分类器
- 利用该分类器从大规模平行语料库中挖掘额外标注数据
后编辑策略
系统的关键性能提升来自后编辑技术:
- T-V形式转换:识别并调整传达正式程度的代词使用
- 动词变位:通过动词变化表达不同正式程度(如日语添加"-ます"后缀)
- 序列到序列指针生成器网络:基于指针网络的语言无关后编辑策略,仅修改文本中的特定元素
实验结果
使用IWSLT测试集的离线实验表明:
- 通过正式性分类器的数据增强使英日翻译准确率提升2.3个百分点
- 后编辑策略显著提升性能:日语正式准确率从93.9%升至95.5%,非正式准确率从98.1%达到100%
- 印地语翻译实现100%正式准确率,非正式准确率从84.4%提升至97.8%