深度伪造检测挑战赛结果:仅凭肉眼,你能识破AI生成的图像吗?

本文介绍了一项深度伪造检测挑战赛的结果,超过800名参与者在仅凭肉眼判断20张图像真伪的测试中,平均准确率仅为55%,表现近乎随机猜测,揭示了肉眼识别AI生成图像的局限性及其背后有趣的误判模式。

深度伪造检测挑战赛结果——你能用肉眼识破深度伪造吗?

我们举办了一场深度伪造检测挑战赛,邀请普通用户和取证专家参与,评估他们仅凭肉眼区分真实图像与伪造图像的能力。以下为挑战结果。

AI生成的图像正变得令人不安地逼真,使得仅凭肉眼区分真实照片与伪造品变得越来越困难。 因此,我们创建了一个包含20张图像的测试,其中部分真实、部分由AI生成,并要求普通用户和取证专家猜测哪些是伪造的。 测试只有一个规则:仅凭肉眼判断! 测试在用户的智能手机上进行,以模拟一个常见场景:在社交网络上浏览图片。一年后,我们收集了超过800份有效回复!现在,是时候看看结果了。

结果概览

测试很简单:针对每张图像,参与者猜测“真实”或“伪造”。每个正确答案得1分,总分范围为0到20分。 下图是收集到的回复直方图,显示了获得每个分数的用户数量。

结果并不十分令人惊讶:平均得分约为11分(总分20分),平均准确率约为55%。遗憾的是,这个结果并不乐观。这样的表现几乎等同于抛硬币猜正反面(例如,每次硬币反面朝上就猜“伪造”)! 这些结果表明,我们并不特别擅长用肉眼识别AI生成的图像。这些合成视觉内容中的某些东西显然欺骗了我们的感知。

另一个有趣的发现是,超过一半的参与者得分在9到12分之间,对应的准确率大约在45%到60%。换言之,大部分用户的表现并不比随机猜测更好。

值得注意的是,有几张图像大多数用户都猜错了。以下是其中最具挑战性的两张:

左侧图像使用“背景虚化模式”拍摄了一个放在破损长椅上的包。结果无疑是怪异的:模糊的背景搭配了意想不到的内容。只有18%的用户正确识别了它(为真实照片)。也许这是因为在现实生活中很少看到这样的长椅。在这种情况下,不真实的场景导致用户认为照片是AI生成的。 右侧图像是两只游泳海豚的合成图像。只有20%的参与者认出它是人工制作的,其余人可能被一种假设所欺骗,即认为AI生成的图像总是呈现出高度细节和逼真感。

结论

残酷的真相是,我们确实无法依赖肉眼来检测深度伪造。超过800名拥有不同技术背景的参与者在识别AI生成图像方面,表现并不比抛硬币猜正反更好。 还需要注意的是,测试使用的图像创建于一年多以前。自那时起,合成图像的质量已显著提高,使得今天的挑战变得更加困难。

我们还观察到用户行为中一些一致的模式。许多参与者似乎认为AI只能产生高质量、精美的图像,而忽略了现代工具现在也能生成低分辨率的监控录像画面或复古风格的图像。 同样,用户倾向于将任何在现实生活中看起来不寻常或不太可能出现的图像标记为伪造,这表明内容预期在他们的判断中起着重要作用。

想了解更多关于深度伪造留下的痕迹吗?你可以从我们的博客文章《10种检测深度伪造的方法》开始。一旦掌握了这些,你可以通过探索“深度伪造取证”中的深入分析,获得更科学的方法。

comments powered by Disqus
使用 Hugo 构建
主题 StackJimmy 设计