摘要
随着社交媒体的兴起,大量用户上传视频(如YouTube内容)被用作视觉目标跟踪(VOT)的训练数据。然而VOT社区长期忽视视频数据隐私问题,许多私人视频在未经授权的情况下被用于商业模型训练。为缓解此问题,本文首次研究如何防止个人视频数据被深度跟踪器未经授权利用。现有防数据滥用的方法主要针对图像任务(如图像分类),直接应用于视频存在效率低下、有效性有限和泛化性差等问题。我们提出新型时序不可学习样本(TUEs)生成框架,其高效计算能力可扩展至大规模视频数据集。使用TUEs训练的跟踪器会过度依赖不可学习的噪声进行时序匹配,从而忽略原始数据结构确保训练视频的隐私性。为增强TUEs效果,我们引入时序对比损失,进一步破坏现有跟踪器在使用TUEs训练时的学习能力。大量实验表明,我们的方法在视频数据隐私保护方面达到最先进性能,且在VOT模型、数据集和时序匹配任务间具有强迁移性。
核心贡献
- 首个视频数据隐私保护框架:针对视觉目标跟踪任务提出时序不可学习样本生成方法
- 高效时序噪声生成:通过可扩展的计算架构实现大规模视频处理
- 时序对比损失函数:创新性地破坏跟踪器的时空特征学习能力
- 跨模型迁移性验证:在多种VOT架构、数据集和匹配任务上证明方法普适性
技术亮点
- 采用生成对抗网络架构动态生成时序相关的不可学习噪声
- 通过时空注意力机制确保噪声在视频帧间的时序一致性
- 设计噪声强度自适应模块平衡隐私保护与视觉质量
- 提出三阶段训练策略(预训练-对抗训练-微调)优化生成效果