去中心化联邦学习模型的众包感知入侵检测数据集

本文介绍了一个用于去中心化联邦学习(DFL)的物联网众包感知恶意软件检测数据集,包含超过2158万条系统行为记录,聚合为34万多个特征,并在不同节点数、拓扑结构和数据分布下比较了传统机器学习、集中式联邦学习和DFL的性能。

去中心化联邦学习模型的众包感知入侵检测数据集

摘要

本文介绍了一个数据集和实验研究,用于将去中心化联邦学习(DFL)应用于物联网众包感知恶意软件检测。该数据集包含良性样本和八个恶意软件家族的行为记录。总共从系统调用、文件系统活动、资源使用、内核事件、输入/输出事件和网络记录中收集了21,582,484条原始记录。这些记录被聚合为30秒的时间窗口,产生了342,106个特征用于模型训练和评估。在DFL平台上进行的实验比较了传统机器学习(ML)、集中式联邦学习(CFL)和DFL在不同节点数量、拓扑结构和数据分布下的性能。结果显示,DFL在保持数据局部性的同时保持了竞争性能,在大多数设置中优于CFL。该数据集为研究物联网众包感知环境的安全性提供了坚实基础。

主题分类

密码学与安全(cs.CR)

引用信息

arXiv:2507.13313 [cs.CR]

提交历史

提交日期:2025年7月17日 提交作者:Chao Feng

comments powered by Disqus
使用 Hugo 构建
主题 StackJimmy 设计