Pipal邮箱检查器:利用Levenshtein距离匹配技术分析密码泄露数据

本文介绍了Pipal邮箱检查器的新功能,通过精确匹配和Levenshtein距离算法分析Netflix泄露数据中的邮箱与密码关联性,揭示了用户使用邮箱名作为密码基础的安全风险。

Pipal邮箱检查器

2014年6月13日 星期五

最近出现了一批Netflix数据泄露,其中包含邮箱地址和密码,我认为是时候为Pipal添加一个邮箱地址检查器了。该检查器会同时检查完整的邮箱地址和仅用户名部分。我还考虑过检查域名,但认为命中率会相当低,不值得额外的计算周期。对于这两部分,它会查找精确匹配和短Levenshtein距离匹配。

以下是Netflix数据的输出示例,我认为输出结果相当不错,特别是末尾的近似匹配非常有趣,显示许多人基于其邮箱地址中的名称部分设置密码。

邮箱检查器

精确匹配

完整邮箱地址 无精确匹配

仅用户名 gog1873 来自 gog1873@hotmail.com ziggy1962 来自 ziggy1962@sympatico.ca

Levenshtein结果

平均距离(邮箱)17.87 平均距离(名称)8.83

近似匹配

完整邮箱地址 在提供的容差范围内无匹配

仅用户名 D: 1 U: yashinl (yashinl@discovery.co.za) P: yashin1 D: 2 U: unni79 (unni79@gmail.com) P: unni12 D: 2 U: stuart (stuart@moabretreat.com) P: stuart53 D: 3 U: jason_215 (jason_215@hotmail.com) P: jasonf14 D: 3 U: tutug60 (tutug60@hotmail.com) P: tutuye2 D: 3 U: xraychen73 (xraychen73@gmail.com) P: Xraychen2 D: 3 U: Rick (Rick@Havu.us) P: rick59 D: 3 U: zuzujar (zuzujar@msn.com) P: zuzu02

匹配是区分大小写的,因此地址robin@test.com与密码Robin的Levenshtein距离为1时会匹配。

您只需从Github检出最新代码即可获得这个新检查器。

如果您有任何意见或希望创建其他检查器,请告诉我。

comments powered by Disqus
使用 Hugo 构建
主题 StackJimmy 设计