Pipal 邮件检查器:利用 Levenshtein 距离匹配技术分析 Netflix 数据泄露

本文介绍了 Pipal 邮件检查器如何通过精确匹配和 Levenshtein 距离算法分析 Netflix 泄露数据中的邮箱与密码关联性,揭示了用户常用姓名作为密码基础的安全风险。

Pipal 邮件检查器

2014年6月13日 星期五

鉴于近期 Netflix 数据泄露事件包含了大量邮箱地址和密码,我认为有必要为 Pipal 添加邮箱地址检查功能。该检查器会分析完整邮箱地址以及仅用户名部分(考虑到域名匹配命中率较低,未纳入检查范围)。检查器支持两种匹配模式:精确匹配和短 Levenshtein 距离匹配。

以下是从 Netflix 数据中提取的示例输出,结果显示末尾的近似匹配尤为有趣——许多用户直接使用邮箱用户名部分作为密码基础。

邮箱检查器

精确匹配

完整邮箱地址
无精确匹配

仅用户名
gog1873 来自 gog1873@hotmail.com
ziggy1962 来自 ziggy1962@sympatico.ca

Levenshtein 结果

邮箱平均距离:17.87
用户名平均距离:8.83

近似匹配

完整邮箱地址
在容差范围内无匹配

仅用户名
距离: 1 用户: yashinl (yashinl@discovery.co.za) 密码: yashin1
距离: 2 用户: unni79 (unni79@gmail.com) 密码: unni12
距离: 2 用户: stuart (stuart@moabretreat.com) 密码: stuart53
距离: 3 用户: jason_215 (jason_215@hotmail.com) 密码: jasonf14
距离: 3 用户: tutug60 (tutug60@hotmail.com) 密码: tutuye2
距离: 3 用户: xraychen73 (xraychen73@gmail.com) 密码: Xraychen2
距离: 3 用户: Rick (Rick@Havu.us) 密码: rick59
距离: 3 用户: zuzujar (zuzujar@msn.com) 密码: zuzu02

匹配过程区分大小写,例如 robin@test.com 与密码 Robin 的 Levenshtein 距离为1。

您可以通过 GitHub 获取最新代码来使用这个新检查器。

如有任何建议或希望开发其他检查器,请随时与我联系。

comments powered by Disqus
使用 Hugo 构建
主题 StackJimmy 设计