密码中的星座是否被用作密码?
星期二,7月13日,12点
我一直好奇为什么在Pipal对密码列表的分析中,“dragon”和“monkey”如此频繁出现,这让我怀疑是否与中国生肖有关。因此,作为一个实验,我刚刚在Pipal中添加了对西方和中文生肖的检查。我针对拥有的100万个eHarmony密码运行了分析,结果显示它们确实在部分人的密码中扮演了一个小角色:
西方星座
星座 | 计数 | 百分比 |
---|---|---|
aries | 141 | 0.01 |
taurus | 42 | 0.0 |
gemini | 63 | 0.01 |
cancer | 57 | 0.01 |
leo | 1502 | 0.14 |
virgo | 55 | 0.01 |
libra | 85 | 0.01 |
scorpius | 2 | 0.0 |
sagittarius | 6 | 0.0 |
capricorn | 10 | 0.0 |
aquarius | 7 | 0.0 |
pisces | 30 | 0.0 |
中文生肖
生肖 | 计数 | 百分比 |
---|---|---|
rat | 2185 | 0.2 |
ox | 3439 | 0.32 |
tiger | 581 | 0.05 |
rabbit | 136 | 0.01 |
dragon | 341 | 0.03 |
snake | 116 | 0.01 |
horse | 370 | 0.03 |
goat | 398 | 0.04 |
monkey | 507 | 0.05 |
rooster | 28 | 0.0 |
dog | 4522 | 0.42 |
pig | 649 | 0.06 |
诚然,一些单词是其他更流行单词的基础词,而且我使用了scorpius而不是scorpio(从维基百科复制粘贴),但可能确实存在某种关联。我预计在像eHarmony和Facebook这样的网站上,这种情况会比在更商业化的网站上更常见。显然,中文生肖在从亚洲网站转储的列表中预计会更普遍。
我还没有将这个功能提交到主git分支,仅仅因为它会大大减慢Pipal的运行速度,所以我将进行一些调整,看看如何加速,并添加一些命令行标志来禁用这些额外功能,以便那些只想要原始数据的人使用。期待很快更新。