深度伪造取证远不止深度伪造检测!
深度伪造检测无处不在,但这只是解决方案的一部分。本文重点探讨更广泛的深度伪造取证学科:一种分层、可解释的方法,超越黑盒AI工具,揭示媒体文件被操纵的方式、位置和原因。您将了解为什么仅靠检测往往不够,以及Amped Authenticate如何为对抗合成媒体带来真正的取证严谨性。
全球深度伪造检测市场正在爆发式增长。不同市场研究估计复合年增长率约为35-50%,预计未来十年市场规模将达到50亿至130亿美元。在谷歌上搜索,您会发现无数深度伪造检测工具页面,其中许多都获得了显著投资支持。然而,事实证明它们远非无懈可击。
我们经常被问及是否也进行深度伪造检测。我们确实进行检测,但这只是我称之为"深度伪造取证"的一小部分。让我们一起来深入探讨这个话题!
什么是深度伪造?
让我们从这个问题开始:什么是深度伪造?
定义因法律、目的和司法管辖区而异,但通常指"旨在误导的AI生成或修改的媒体"。在美国,没有单一、官方的全国法律定义。在欧盟,《人工智能法案》将其定义如下:"‘深度伪造’是指AI生成或操纵的图像、音频或视频内容,这些内容类似于现有的人物、物体、地点、实体或事件,并且会错误地让人认为是真实或真实的。"
这些定义表明,用于创建深度伪造的技术不是唯一的决定因素;创建者的意图或对观看者的影响甚至更为重要。
深度伪造只是一张图像
我们不应忘记,深度伪造只是一张图像、视频或音频文件。对于这些类型的媒体,在深度伪造出现之前,我们已经开发了无数工具。另一方面,大多数专门为深度伪造检测设计的工具都基于AI。因此,它们利用了这项技术的力量,但也继承了其偏见和可解释性差的缺点。
传统的多媒体取证算法依靠数学模型分析图像中的痕迹,确定其原始性、操纵或合成生成。尽管可能很复杂,但专家可以在法庭上解释这些算法。当有足够数据可用时,分析人员可以对其发现充满信心,特别是在存在篡改证据时。
相比之下,基于数据的算法,如那些用于基于AI的深度伪造检测的算法,是在大量图像数据集上进行分类训练的。训练过程本身带有将偏见引入结果的风险。尽管AI可解释性和可理解性是活跃的研究领域,但当今表现最佳的模型通常如此庞大和复杂,以至于它们作为"黑盒"运行。
另一个问题是,当AI深度伪造检测工具遇到在训练阶段未见过的数据类型时,可能会遇到困难。
此外,当它们给出分数时,它们不提供结果的"概率"(或者如果提供,通常不是概率的取证解释),而是对结果的"置信度"。因此,它们可能很自信(甚至达到100%),但仍然可能是错误的。
幸运的是,传统的基于模型的算法通常对深度伪造仍然有效,就像它们对传统数字照片一样。以阴影分析为例。最初设计用于检测使用照片编辑工具进行的手动图像更改,它在由AI修改或生成的图像上表现良好,并且基于清晰、可解释的物理原理。
仅靠深度伪造检测可能不足以用于司法用途。很难上法庭说:“这张图片是假的,因为AI告诉我的。“然而,对于了解其潜力和局限性的专家来说,这是一个极好的工具。他们可以将其用于分类和决策支持资源,与其他允许以不同方式证实结果的工具一起使用。这就是深度伪造取证的作用。
如何解释深度伪造取证的概念?
作为测试,我向几个不同的LLM提出了同样的问题:ChatGPT、Claude、Gemini和Mistral。
大多数回答都还不错,但不够出色。不过,ChatGPT的回答相当准确。也许我可以改变一些词语,但它太好了,我决定逐字复制。
深度伪造取证是致力于检测、分析和理解合成媒体的领域,特别是使用人工智能技术(如GAN或扩散模型)被操纵或完全生成的图像、视频和音频。
与通常基于AI分类器提供黑盒是/否答案的通用深度伪造检测工具不同,深度伪造取证侧重于收集和解释多种类型的取证证据,以评估媒体的真实性和来源。这是一个取证过程,而不仅仅是分类任务。
深度伪造取证的关键方面:
多层分析:
- 基于AI的检测:使用深度学习发现已知深度伪造生成方法的典型不一致性
- 基于信号的取证工具:检查压缩伪影、光照不一致性、阴影、焦点、传感器噪声或编码
- 格式和元数据检查:查找EXIF数据、文件结构或容器格式中的不一致性或篡改
- 场景和物理分析:研究不可能的反射、奇怪的肢体位置或不一致的运动动力学
- 上下文调查:考虑谁创建了内容、何时何地发布以及如何传播
没有单一方法是足够的: 基于AI的检测器可能被对抗性技术或新的生成方法所欺骗。深度伪造取证将人类专业知识与多种工具结合起来,建立更强大的证据基础。
法律和伦理框架: 目标不仅仅是检测,而是支持法庭或调查中的决策。因此,可重复性、可解释性和监管链至关重要。
动态和对抗性领域: 随着深度伪造技术的发展,规避策略也在发展。取证必须快速适应,并且通常需要在这场深度伪造生成的军备竞赛中保持领先。
简而言之,深度伪造取证对于合成媒体,就像文件取证对于伪造文书一样——不仅仅是检测器,而是一个全面的调查学科。
Amped Authenticate中的深度伪造取证
Amped Authenticate自2013年就已上市,远在"深度伪造"一词出现之前。我们拥有50多种不同的滤镜和工具,专门用于照片和视频取证,其中许多已经过多年实战检验。其中两个滤镜基于AI,专门用于深度伪造检测:扩散模型深度伪造和面部GAN深度伪造。
使用Amped Authenticate,我们可以分析图像和视频的所有方面,包括元数据和文件结构。该软件允许我们通过注释突出显示关键视觉伪影,发现阴影和反射的不一致性(我们最近在一个科学会议上发表了关于这个主题的研究)。此外,我们可以执行反向图像搜索,在频域中发现AI伪影,等等。我们在这篇博客文章中展示了这些以及更多内容。
让我们看一个例子。我们使用了一张有两个人的自拍。在右侧的对象上,我们叠加了由thispersondoesnotexist.com生成的面部,并使其适应照片。作为过程的一部分,我们必须调整大小、旋转并稍微处理面部和原始颈部,使其在视觉上更可信。Amped Authenticate的面部GAN检测滤镜准确地将右侧的面部识别为AI生成,置信度为84%。
然而,这一单一证据不足以在法庭上自信地作证该面部不是真实的。不过,我可以将这个初步发现作为进一步分析的起点。
幸运的是,在Amped Authenticate中,我们有许多滤镜可以帮助我们验证分析。在这种情况下,ADJPEG(对齐双JPEG)滤镜清楚地突出显示右侧的面部具有与图像其余部分完全不同的压缩历史,证实了先前滤镜的结果。ADJPEG使用文献中发表的一个很好理解的算法。除非我们能够找到其他技术原因解释为什么右侧的面部与左侧的面部如此不同,否则我们可以自信地上法庭就此作证。
让我们看看图像的元数据。我们可以找到用于处理图像的软件GIMP的痕迹和其他技术特征(如非标准JPEG哈夫曼表)。这些在直接从数码相机出来的照片中不太可能出现。
DCT绘图滤镜也显示了图像已被重新保存的典型迹象,进一步证实了其缺乏原创性。
这是一个快速示例,说明对图像或视频执行完整分析的重要性。在其他情况下,我们可以进行反向图像搜索、频谱分析或阴影和反射分析。
警醒呼吁
在过去的几年里,我致力于为政策制定者和所有刑事司法利益相关者提供视频证据素养的基础知识。现在,随着深度伪造的爆炸式增长、AI在案件工作中日益广泛的使用以及广泛传播的错误信息,重申我们的明确承诺非常重要:我们致力于取证。我们的发现具有法律效力,直接影响人们的生活和自由。在我们的领域中,仅依赖深度伪造检测是一个危险的幻觉。我们和司法真正需要的是深度伪造取证。