机器学习模型调试新方法解析

本文介绍了一种名为Defuse的创新方法,通过生成合成数据识别机器学习模型的错误分类模式,并利用变分自编码器进行数据增强和潜在空间分析,有效提升模型鲁棒性和分类准确性,适用于图像分类任务的错误诊断与修正。

机器学习模型调试新方法解析

某中心提出了一种名为Defuse的新方法,用于自动发现机器学习模型在特定输入类型上的错误并提供修正方案。该方法在NeurIPS 2021可解释AI调试与诊断研讨会上发布。

方法概述

Defuse针对训练好的图像分类模型,生成与测试集输入相似但经过扰动的新图像,这些图像会被分类器错误处理。随后,Defuse将错误分类的图像归类为高级“模型错误”——即 consistently 导致错误的相似图像组。用户可据此识别模型失败场景并训练更鲁棒的模型。

在重新训练过程中,人工生成的错误数据与原始训练数据按参数λ控制的比例混合。实验表明,在三个样本数据集中,存在λ值能使Defuse识别的输入类保持高性能,同时基本保留原始数据性能。

技术细节

数据增强

Defuse使用变分自编码器(VAE)在分类器训练数据上生成合成图像。VAE通过潜在空间中的向量表示捕获输入数据的显著属性,生成具有语义差异的新图像。

三阶段流程

  1. 识别:使用训练好的VAE编码所有训练图像,通过添加少量噪声扰动潜在代码,生成与原始实例有语义差异的解码实例,保存分类器错误分类的实例。
  2. 蒸馏:使用聚类模型(高斯混合模型与狄利克雷过程先验)将上一步图像的潜在代码分组,诊断错误分类区域。
  3. 修正:使用标注者标记的聚类数据与原始训练数据按λ比例混合进行修正训练。

实验结果

在三个公共基准数据集上的实验表明,Defuse能有效修正识别和蒸馏阶段发现的错误。与仅基于标注错误图像进行微调的基线相比,Defuse的修正步骤表现更优。

错误新颖性验证

Defuse生成的错误分类实例展现出训练集中未见过的新错误类型。通过比较错误分类区域数据与错误训练数据的最近邻,证实了该方法能揭示新的模型错误源。

代码与资源

Defuse代码已在GitHub上公开,以促进进一步研究。

研究领域

  • 计算机视觉
  • 机器学习

标签

  • 合成数据生成
  • NeurIPS

相关会议:NeurIPS 2021可解释AI调试与诊断研讨会
相关出版物:《Defuse: 通过创建和修正新模型错误训练更鲁棒模型》

comments powered by Disqus
使用 Hugo 构建
主题 StackJimmy 设计