FedP3E:跨孤岛联邦学习中非独立同分布物联网恶意软件检测的隐私保护原型交换

本文提出FedP3E框架,通过高斯混合模型构建类原型并添加高斯噪声扰动,在保护隐私的同时实现跨客户端表示共享,有效解决非独立同分布数据下的物联网恶意软件检测问题,显著降低通信开销并提升对少数恶意软件类的检测能力。

FedP3E:跨孤岛联邦学习中非独立同分布物联网恶意软件检测的隐私保护原型交换

摘要:随着物联网生态系统在关键领域的持续扩展,它们已成为日益复杂和大规模恶意软件攻击的主要目标。不断演变的威胁态势,结合物联网生成数据的敏感性,要求检测框架既保护隐私又能适应数据异构性。联邦学习(FL)通过实现去中心化模型训练而不暴露原始数据,提供了一个有前景的解决方案。然而,标准FL算法如FedAvg和FedProx在现实部署中往往表现不佳,这些部署以类别不平衡和非独立同分布(non-IID)数据分布为特征——尤其是在存在罕见或不相交恶意软件类别的情况下。

为解决这些挑战,我们提出了FedP3E(隐私保护原型交换),这是一种新颖的FL框架,支持间接跨客户端表示共享,同时保持数据隐私。每个客户端使用高斯混合模型(GMMs)构建类原型,用高斯噪声扰动它们,并仅将这些紧凑摘要传输到服务器。聚合后的原型随后分发回客户端,并集成到本地训练中,辅以基于SMOTE的增强以提升少数恶意软件类的表示。

与仅依赖参数平均不同,我们的原型驱动机制使客户端能够利用联邦中观察到的互补结构模式来丰富其本地模型——而无需交换原始数据或梯度。这种针对性策略以最小通信开销减少统计异构性的不利影响。我们在N-BaIoT数据集上评估FedP3E,在具有不同程度数据不平衡的现实跨孤岛场景中进行测试。

comments powered by Disqus
使用 Hugo 构建
主题 StackJimmy 设计