使自动化视觉检测系统实用化
基于计算机视觉的自动化产品检测在制造业、零售业等众多领域至关重要。发货损坏商品会损害客户信任并产生额外退换货成本。目前业界日益关注通过自动化检测流程来提高吞吐量、降低成本并加速反馈循环。
异常检测是预测产品是否偏离正常状态的技术,而异常定位则是通过像素级异常评分来突出异常区域的更复杂任务。尽管计算机视觉技术不断进步,但异常定位方法的研究与实际生产环境部署之间仍存在差距。现有模型大多针对特定产品缺陷设计,对处理不同产品的制造商适用性有限。
在《制造系统杂志》发表的论文中,提出了首个面向实际应用的异常定位基准测试框架——包含新标注的产品无关数据集和推荐的评估方案。通过重新标注现有数据集中的异常样本,捕获更高级的人类可理解描述,创建了可用于通用产品无关模型评估的新数据集。
同时确定了最优建模方法,开发了高效的训练和推理方案,并对多种图像异常/正常区域分割的最优像素强度阈值估计技术进行了消融研究。不同行业的用户均可利用此基准测试框架在生产流水线中部署自动化视觉检测。
基准测试框架
使用监督学习训练异常定位模型存在主要缺陷:与无缺陷产品图像相比,缺陷产品图像稀缺且标注成本高昂。因此,该框架在训练阶段不需要任何异常图像,模型仅从无缺陷样本中学习典型图像特征分布。
在验证阶段,仅需少量异常图像即可确定正常与异常像素的分数边界。推理时,训练模型生成异常分数图来突出输入图像中的异常区域,随后使用最优像素强度阈值计算分割图并屏蔽正常像素。
该框架包含三大核心组件:产品无关数据集、模型集合和评估方法集。根据异常分数图生成方式,将建模方法分为四大类:重建法、归因图法、块相似度法和标准化流法。框架包含了每类中最先进的代表性模型。
实用化评估流程
异常定位应采用双重评估程序:验证指标无需阈值,而推理指标需要阈值。重点强调阈值值的有效确定,弥补了以往研究的空白。不同指标在实际用例中各具优势:基准测试提供了推理(阈值依赖)指标的详细分析,比较了四种建模方法与五种阈值估计技术。
产品无关数据集构建
通过重新分类现有数据集(MVTec和BTAD)中的异常图像,按照更高级别的通用类别创建产品无关数据集。两个数据集的异常图像均包含精确到像素的异常分割图,突出缺陷并屏蔽无缺陷区域。
- 结构缺陷:物体部件变形/缺失或产品结构严重损坏(如孔洞、弯曲、缺失部件)
- 表面缺陷:主要限于产品表面较小区域,修复需求较低(如划痕、凹痕、铁锈)
- 污染缺陷:存在异物材料(如胶水残留、灰尘、污垢)
- 复合缺陷:结合以上多种类型,在真实分割图中具有多个连通组件
标注团队通过定制化用户界面,通过对比异常图像与无缺陷产品图像,参考真实分割图进行缺陷分类。这些产品无关标签已在论文补充材料中公开,供研究人员开展新实验并开发产品无关基准。
新产品基准测试实践
该框架为建模方法选择、阈值估计方法和评估流程提供了宝贵指导。针对新产品的制造商,建议使用基于块相似度的Patch分布模型(PaDiM),并通过IoU(交并比)曲线估计阈值。若表面缺陷更易出现,基于标准化流的条件标准化流(CFLOW)模型可能优于PaDiM。
以MVTec数据集中的瓶子产品为例:数据集包含209张正常和63张异常图像。首先按照产品无关分类标注异常图像,得到41张结构缺陷、21张污染缺陷和1张复合缺陷图像。根据缺陷比例,PaDiM应为合适的建模方法,最优阈值通过IoU曲线确定。后续步骤包括在正常图像上训练PaDiM、使用验证集估计阈值、为测试集图像生成分割图,以及通过视觉确认缺陷区域以深化领域理解。
该基准测试的发布旨在推动更多研究人员扩展相关工作,帮助弥合异常定位研究进展与实际应用挑战之间的差距。