音频异常检测的神经网络方法突破
在机器状态监测领域,某中心团队在音频异常检测挑战赛中包揽前三名,并荣获最佳论文奖。该技术基于两种不同的神经网络方法,可提前检测机器故障声音。
技术背景
工业环境中的听觉机器状态监测已有数十年历史。经验丰富的维护专家通过听觉就能识别机器异常。但人耳可察觉异常时,问题往往已相当严重。随着机器学习和大数据技术的发展,早期异常检测成为可能。
数据挑战
异常检测面临三大训练方式:
- 全监督:使用标注的正常和异常数据
- 半监督:仅使用正常数据
- 无监督:无标签数据的自动异常分类
工业场景中,关键设备通常维护良好,故障数据稀缺且收集困难。机器运行模式多样,特性随时间变化,这些因素都增加了异常检测的难度。
神经网络解决方案
方法一:Group MADE
基于自回归神经密度估计技术,创新性地提出分组掩码自编码器。传统MADE模型对输入特征的每个维度单独预测,而Group MADE基于频率带分组进行预测,更好地捕捉音频信号的复合特征。
方法二:自监督学习
首次将自监督表示学习应用于音频异常检测。在训练数据缺乏异常的情况下,训练网络区分同类型机器的不同实例。通过学习到的特征敏感检测细微异常,采用频谱扭曲和随机混合技术模拟新机器实例。
实验成果
在DCASE挑战赛中,使用六类机器数据(风扇、泵、滑轨、阀门、玩具车、玩具传送带)进行测试。采用ROC曲线下面积(AUC)和部分AUC作为评估指标。经过机器特定调优后,检测精度显著提升。
技术意义
随着工业机器数据的不断积累,基于机器学习的方法将在机器监测和维护领域发挥重要作用。该方法为工业设备预防性维护提供了有效的技术解决方案。
表:异常检测精度对比
| 机器类型 | 挑战赛成绩 | 调优后成绩 |
|---|---|---|
| 风扇 | 0.92 | 0.95 |
| 泵 | 0.88 | 0.91 |
| 阀门 | 0.85 | 0.89 |
正常样本(蓝色)与异常样本(红色)在原始频谱图(左)和自监督学习特征(右)中的分布对比