Lukáš Mešťan

Software engineer with a background in full-stack Web development & Open Source Enthusiast.


1 400 553 869 prihlasovacích mien a hesiel inak

- 3 mins

Firma 4iQ počas skenovania darkweb-u za účelom hľadania ukradnutých alebo stratených údajov, objavila jediný súbor s databázou 1,4 miliárd prihlasovacích údajov v čitateľnej podobe. Je to doposiaľ najväčšia agregovaná databáza, ktorá sa doteraz našla v darkweb-e.

Unikátne záznamy podľa: Počet:
Prihlasovacie mená a heslá 1 400 553 869
Prihlasovacie mená 1 163 976 485
Heslá 463 619 984

Získať zdroj databázy nebolo až tak jednoduché, ako sa na prvý pohľad zdalo, ale za pomoci tor-u a p2p sa to nakoniec z verejne dostupného zdroja podarilo. Získaná databáza o veľkosti 41GB obsahovala zoznam súborov aktualizovaných naposledy v novembri 2017. Databáza bola rozdelená do podadresárov podľa začiatočných písmen prihlasovacieho mena. Takéto rozdelenie umožnilo pomerne rýchle vyhľadávanie.

Rozhodol som sa preto spraviť pomerne jednoduchú analýzu, ktorá by sa zameriavala na zistenie početnosti výskytov všeobecne známych slov so zoznamu mien, vulgarizmov, najčastejšie používaných slov a pod.

Top heslá

# Počet: Heslo:
1 9218720 123456
2 3103503 123458789
3 1651385 qwerty
4 1313464 password
5 1273179 111111
6 1126222 12345678
7 1085144 abc123
8 969909 1234587
9 952446 password1
10 879924 1234587890
11 866640 123123
12 834468 12345
13 621078 homelesspa
14 564344 iloveyou
15 527158 1g2w3e4r5t
16 470562 qwertyuiop
17 468554 1234
18 417878 123456a
19 398114 123321
20 371627 654321

Email domény

Zoznam najčastejších emailových domén a ich použitie v prihlasovacích menách (vo forme emailu) a heslách.

Slovenské mená

Ako prvý zoznam som si zvolil slovenské kalendárne mená, ktoré sa nachádzajú v prihlasovacích menách alebo heslách. V zozname slov sú zahrnuté aj slová ktoré sú zhodné s inými slovnými zásobami iných krajín.

Top 100 slovenských mien

Slovenské mená (čiastočná zhoda)

Slovenské mená (presná zhoda)

Slovenské vulgarizmy

Pri druhom zozname ma zaujímal počet vulgárnych slov, ktoré sa nachádzajú v prihlasovacích menách alebo heslách. Ako vstupný zoznam vulgárnych slov som pouzil existujúci repozitár rostacik/slovenske-nadavky na githube. V zozname slov sú zahrnuté aj slová ktoré sú zhodné s inými slovnými zásobami iných krajín.

Top 100 slov

Slovenské vulgarizmy (čiastočná zhoda)

Slovenské vulgarizmy (presná zhoda)

Ochrana a prevencia

Aby ste sa ochránili, odporúča sa, nepoužívať rovnaké heslá na viacerých webových stránkach a službách. Vždy vytvárajte dostatočne silné a zložité heslá pre rôzne online účty. Ak je pre vás ťažké si pamätať a vytvárať zložité heslá pre rôzne služby, môžete používať správcu hesiel.

TL&DR

Spôsob vyhľadávania

Pre vyhľadávanie som zvolil cestu prehľadávania zdrojových súborov čo bolo omnoho rýchlejšie ako použitie externej sql alebo no-sql databázy. Pre tento účel som pripravil bash skript, ktorý má možnosť navoliť si pomocou prvého parametra hľadaný text, druhého parametra začiatočný regex a tretieho parametra koncový regex. S týchto troch parametrov sa vyskladá regulárny výraz pre grep príkaz.

Skript na prehľadávanie podľa zvoleného textu a regex-ov

Príklad použitia vyhľadávania presnej zhody: