密码中的星座元素:西方与生肖密码使用分析

本文通过分析百万级密码数据集,探讨西方星座与中文生肖在密码中的使用频率,发现龙、猴等生肖词出现较高,并介绍了Pipal工具新增的星座检测功能及其优化计划。

密码中的星座是否被用作密码?

星期二,7月13日,12点

我一直好奇为什么在Pipal对密码列表的分析中,“dragon”和“monkey”如此频繁出现,这让我怀疑是否与中国生肖有关。因此,作为一个实验,我刚刚在Pipal中添加了对西方和中文生肖的检查。我针对拥有的100万个eHarmony密码运行了分析,结果显示它们确实在部分人的密码中扮演了一个小角色:

西方星座

星座 计数 百分比
aries 141 0.01
taurus 42 0.0
gemini 63 0.01
cancer 57 0.01
leo 1502 0.14
virgo 55 0.01
libra 85 0.01
scorpius 2 0.0
sagittarius 6 0.0
capricorn 10 0.0
aquarius 7 0.0
pisces 30 0.0

中文生肖

生肖 计数 百分比
rat 2185 0.2
ox 3439 0.32
tiger 581 0.05
rabbit 136 0.01
dragon 341 0.03
snake 116 0.01
horse 370 0.03
goat 398 0.04
monkey 507 0.05
rooster 28 0.0
dog 4522 0.42
pig 649 0.06

诚然,一些单词是其他更流行单词的基础词,而且我使用了scorpius而不是scorpio(从维基百科复制粘贴),但可能确实存在某种关联。我预计在像eHarmony和Facebook这样的网站上,这种情况会比在更商业化的网站上更常见。显然,中文生肖在从亚洲网站转储的列表中预计会更普遍。

我还没有将这个功能提交到主git分支,仅仅因为它会大大减慢Pipal的运行速度,所以我将进行一些调整,看看如何加速,并添加一些命令行标志来禁用这些额外功能,以便那些只想要原始数据的人使用。期待很快更新。

comments powered by Disqus
使用 Hugo 构建
主题 StackJimmy 设计