钓鱼检测在生成式AI时代:量化大语言模型 vs 传统模型

本文比较了传统机器学习、深度学习与量化小参数大语言模型在钓鱼检测中的性能。研究发现,虽然大语言模型在原始准确率上略逊,但在识别基于上下文的钓鱼线索方面潜力巨大。研究还探讨了零样本和少样本提示策略的影响,并评估了模型的对抗鲁棒性和成本效益权衡。

钓鱼检测在生成式AI时代:量化大语言模型 vs 传统模型

钓鱼攻击正变得越来越复杂,这凸显了检测系统在高准确性和计算效率之间取得平衡的需求。本文对传统机器学习(ML)、深度学习(DL)以及量化小参数大语言模型(LLMs)在钓鱼检测中的应用进行了比较评估。

通过在精选数据集上的实验,我们发现虽然LLMs目前在原始准确率上不如ML和DL方法,但它们在识别细微的、基于上下文的钓鱼线索方面表现出强大潜力。我们还研究了零样本和少样本提示策略的影响,揭示出LLM重写的电子邮件会显著降低基于ML和LLM的检测器的性能。

我们的基准测试强调,像DeepSeek R1 Distill Qwen 14B(Q8_0)这样的模型仅使用17GB的VRAM就能实现超过80%的竞争性准确率,支持其在成本效益部署中的可行性。我们进一步评估了模型的对抗鲁棒性和成本性能权衡,并展示了轻量级LLMs如何提供简洁、可解释的解释以支持实时决策。

这些发现将优化的LLMs定位为钓鱼防御系统中有前景的组成部分,并为将可解释、高效的人工智能集成到现代网络安全框架中提供了一条前进之路。

comments powered by Disqus
使用 Hugo 构建
主题 StackJimmy 设计