基于大语言模型的可解释性网络攻击检测框架在自动发电控制系统中的应用
智能电网日益数字化提高了运营效率,但也引入了新的网络安全漏洞,例如针对自动发电控制(AGC)系统的虚假数据注入攻击(FDIAs)。虽然机器学习(ML)和深度学习(DL)模型在检测此类攻击方面显示出潜力,但其不透明的决策过程限制了操作员的信任和实际应用。
本文提出了一种混合框架,将基于轻量级机器学习的攻击检测与大语言模型(LLMs)生成的自然语言解释相结合。分类器如LightGBM实现了高达95.13%的攻击检测准确率,推理延迟仅为0.004秒。在检测到网络攻击后,系统调用LLMs,包括GPT-3.5 Turbo、GPT-4 Turbo和GPT-4o mini,生成人类可读的事件解释。
在100个测试样本上评估,GPT-4o mini采用20-shot提示,在识别攻击目标方面达到93%的准确率,攻击幅度估计的平均绝对误差为0.075 pu,攻击开始时间估计的平均绝对误差(MAE)为2.19秒。这些结果表明,所提出的框架有效平衡了实时检测与可解释的高保真解释,满足了智能电网网络安全中对可操作人工智能的关键需求。
评论: 已接受发表。
主题: 密码学与安全(cs.CR);人工智能(cs.AI);系统与控制(eess.SY)。
引用为: arXiv:2507.22239 [cs.CR](或此版本的arXiv:2507.22239v1 [cs.CR])。
DOI: https://doi.org/10.48550/arXiv.2507.22239
提交历史: 2025年7月29日星期二21:23:08 UTC(1,962 KB)。