深度伪造检测测验结果 – 你能仅凭肉眼发现深度伪造吗？

我们进行了一项深度伪造检测测验，邀请了普通用户和法证专家参与，评估他们仅凭肉眼区分真实图像与虚假图像的能力。结果如下。

AI生成的图像正变得令人不安地逼真，使得仅凭肉眼分辨真实照片与虚假照片变得越来越困难。为此，我们创建了一个包含20张图像的测验，其中有些是真实的，有些是合成生成的，然后请普通用户和法证专家猜测哪些是假的。只有一条规则：仅用你的眼睛！测验在用户的智能手机上进行，以模拟一个常见场景：在社交网络上滚动浏览图像。一年后，我们收集了800多份回复！现在是时候看看结果了。

结果概览

测验很简单：对于每张图像，参与者猜测是“真实”还是“虚假”。每个正确答案得一分，总分范围从0到20。以下为收集到的回复的直方图，显示了达到每个分数的用户数量。

看到平均分数约为11分（满分20分），平均准确率约为55%，这并不十分令人惊讶。不幸的是，这个结果并不鼓舞人心。这样的表现几乎可以通过简单抛硬币，每次反面都猜“虚假”来达到！这些结果表明，我们并不特别擅长仅凭肉眼发现AI生成的图像。这些合成视觉效果中的某些东西显然欺骗了我们的感知。

另一个有趣的发现是，超过一半的参与者的得分在9到12分之间，对应大约45%到60%的准确率。换句话说，很大一部分用户的表现并不比随机猜测更好。

值得注意的是，有些图像大多数用户都猜错了。以下是其中最具挑战性的两张：

在左侧，使用了“散景模式”拍摄了一个放在破损长椅上的包。结果无疑是怪异的：模糊的背景搭配意想不到的内容。只有18%的用户正确识别了它。也许这是因为在现实生活中很少见到这样的长椅。在这种情况下，不真实的场景导致用户相信这张照片是AI生成的。在右侧，我们看到一张两只游泳海豚的合成图像。只有20%的参与者认出它是人造的，而其余人可能被一个假设所欺骗，即AI生成的图像总是看起来高度细致且逼真。

结论

一个严峻的事实是，我们真的不能仅仅依靠眼睛来检测深度伪造。800多名拥有不同技术背景的参与者在识别AI生成图像方面，其表现并不比抛硬币猜结果更好。同样值得注意的是，该测验使用的是一年多前创建的图像。自那以后，合成图像的质量有了显著提高，使得今天的挑战更加困难。我们还观察到用户行为中的一些一致模式。许多参与者似乎认为AI只能生成高质量、精美的图像，而忽视了现代工具现在也可以生成低分辨率的闭路电视录像或复古风格图像。同样，用户倾向于将任何在现实生活中看起来不寻常或不太可能的图像标记为虚假，这表明内容预期在他们的判断中起着重要作用。

想了解更多关于深度伪造留下的痕迹吗？你当然可以从我们的博客文章开始：“10种检测深度伪造的方法”。一旦你掌握了这些方法，你可以通过探索《深度伪造取证》中的深入分析来获得更科学的方法。