逼真说话头像视频中的生物特征验证场景探索
逼真说话头像在虚拟会议、游戏和社交平台中日益普及。这些虚拟化身虽然能够提供更加沉浸式的交流体验,但也带来了严重的安全风险。其中一个新兴威胁是身份冒充:攻击者可以窃取用户的虚拟化身,保留其外观和声音特征,使得仅凭视觉或听觉几乎无法检测到欺诈行为。
本文深入探讨了在此类虚拟化身媒介场景中的生物特征验证挑战。核心研究问题是:当虚拟化身的视觉外观与其所有者完全相同时,个体的面部运动模式是否能够作为可靠的行为生物特征来验证其身份。
为了解决这个问题,我们引入了一个新的逼真虚拟化身视频数据集,该数据集使用最先进的一次性虚拟化身生成模型GAGAvatar创建,包含真实和冒充者的虚拟化身视频。我们还提出了一种轻量级、可解释的时空图卷积网络架构,该架构采用时间注意力池化机制,仅使用面部关键点来建模动态面部姿态。
实验结果表明,面部运动线索能够实现有意义的身份验证,AUC值接近80%。所提出的基准测试和生物特征系统已向研究社区开放,旨在引起对虚拟化身通信系统中需要更先进行为生物特征防御机制的迫切关注。