Práce se zabývá možností aplikace metod kvantitativní lingvistiky a zpracování přirozeného jazyka na poli kybernetické bezpečnosti. Vedle teorie spojené s hesly (jako je jejich tvorba a síla, způsoby uložení a ochrana v databázích a typologie útoků na soubory kryptograficky chráněných hesel) se věnuje analýzám čtyř vybraných souborů hesel z reálného prostředí. V první řadě shrnuje jejich základní kvantitativní vlastnosti s cílem získat obecný náhled na dané soubory. Dále se věnuje sémantické analýze, pomocí které identifikuje tematickou povahu nejčastějších hesel. Vedle sledování obecných vlastností se tato práce také orientuje na otázku toho, co činí hesla unikátními. V neposlední řadě je provedena jazykově motivovaná analýza struktur hesel, v rámci které jsou popsány typické struktury rozložení konsonantů a vokálů v heslech. Na základě této analýzy je v závěru práce prozkoumána možnost využití těchto struktur při získávání hesel z jejich kryptograficky chráněné podoby.
Anotace v angličtině
The work deals with the possibility of applying the methods of quantitative linguistics and natural language processing in the field of cybersecurity. Apart from the theory concerning passwords (such as their creation and strength, methods of storage and protection in databases, and the typology of attacks on cryptographically protected passwords), an analysis of four selected leaked password datasets is conducted. First of all, their basic quantitative properties are summarised in order to obtain an overview of the datasets. Next, a semantic analysis is conducted so as to identify the thematic nature of the most common passwords. In addition to describing the general properties of the datasets and passwords, this work also focuses on the question of what makes passwords unique. Last but not least, a linguistically motivated analysis of password structures is performed, within which typical structures of the distribution of consonants and vowels are described. Based on this analysis, the possibility of using such structures in obtaining passwords from their cryptographically protected form is investigated.
cybersecurity, corpus linguistics, natural language processing, hash functions, hashcat, phonotactics
Rozsah průvodní práce
80 s.
Jazyk
CZ
Anotace
Práce se zabývá možností aplikace metod kvantitativní lingvistiky a zpracování přirozeného jazyka na poli kybernetické bezpečnosti. Vedle teorie spojené s hesly (jako je jejich tvorba a síla, způsoby uložení a ochrana v databázích a typologie útoků na soubory kryptograficky chráněných hesel) se věnuje analýzám čtyř vybraných souborů hesel z reálného prostředí. V první řadě shrnuje jejich základní kvantitativní vlastnosti s cílem získat obecný náhled na dané soubory. Dále se věnuje sémantické analýze, pomocí které identifikuje tematickou povahu nejčastějších hesel. Vedle sledování obecných vlastností se tato práce také orientuje na otázku toho, co činí hesla unikátními. V neposlední řadě je provedena jazykově motivovaná analýza struktur hesel, v rámci které jsou popsány typické struktury rozložení konsonantů a vokálů v heslech. Na základě této analýzy je v závěru práce prozkoumána možnost využití těchto struktur při získávání hesel z jejich kryptograficky chráněné podoby.
Anotace v angličtině
The work deals with the possibility of applying the methods of quantitative linguistics and natural language processing in the field of cybersecurity. Apart from the theory concerning passwords (such as their creation and strength, methods of storage and protection in databases, and the typology of attacks on cryptographically protected passwords), an analysis of four selected leaked password datasets is conducted. First of all, their basic quantitative properties are summarised in order to obtain an overview of the datasets. Next, a semantic analysis is conducted so as to identify the thematic nature of the most common passwords. In addition to describing the general properties of the datasets and passwords, this work also focuses on the question of what makes passwords unique. Last but not least, a linguistically motivated analysis of password structures is performed, within which typical structures of the distribution of consonants and vowels are described. Based on this analysis, the possibility of using such structures in obtaining passwords from their cryptographically protected form is investigated.
cybersecurity, corpus linguistics, natural language processing, hash functions, hashcat, phonotactics
Zásady pro vypracování
Tato práce se zaměřuje na aplikace metod korpusové a kvantitativní lingvistiky a zpracování přirozeného jazyka na poli kybernetické bezpečnosti. Práce sestává jak z teorie, tak z praxe. Teoretická část shrne aktuální situace útoků na online aplikace, sítě a databáze, které mají za cíl získat hesla (či hashe hesel) uživatele/uživatelů, a dále popíše způsoby ochrany těchto hesel v databázích a v síťovém provozu. Kromě toho se zabývá uživatelskou pragmatikou při jejich tvorbě a problematikou jejich komplexity. Dále se práce věnuje přímo heslům z hlediska kvantitativní a korpusové lingvistiky. Praktická část se zaměřuje na kvantifikaci různých aspektů hesel, a to nejen na jejich délky, četnosti konkrétních znaků a znakových sad, ale i na kupříkladu nejčastější sylabické struktury a fonotaktiku \textemdash na základě těch se pokusí vyvodit možnosti tvorby typických hesel. Dále se tato práce věnuje možnostem sémantické analýzy a v neposlední řadě ověří vybrané hypotézy vyplývající z psychologických aspektů, které do tvorby hesla vstupují (jako je otázka paměti aj.).
Zásady pro vypracování
Tato práce se zaměřuje na aplikace metod korpusové a kvantitativní lingvistiky a zpracování přirozeného jazyka na poli kybernetické bezpečnosti. Práce sestává jak z teorie, tak z praxe. Teoretická část shrne aktuální situace útoků na online aplikace, sítě a databáze, které mají za cíl získat hesla (či hashe hesel) uživatele/uživatelů, a dále popíše způsoby ochrany těchto hesel v databázích a v síťovém provozu. Kromě toho se zabývá uživatelskou pragmatikou při jejich tvorbě a problematikou jejich komplexity. Dále se práce věnuje přímo heslům z hlediska kvantitativní a korpusové lingvistiky. Praktická část se zaměřuje na kvantifikaci různých aspektů hesel, a to nejen na jejich délky, četnosti konkrétních znaků a znakových sad, ale i na kupříkladu nejčastější sylabické struktury a fonotaktiku \textemdash na základě těch se pokusí vyvodit možnosti tvorby typických hesel. Dále se tato práce věnuje možnostem sémantické analýzy a v neposlední řadě ověří vybrané hypotézy vyplývající z psychologických aspektů, které do tvorby hesla vstupují (jako je otázka paměti aj.).
Seznam doporučené literatury
Aumasson, Jean-Philippe. Serious cryptography: a practical introduction to modern encryption. No Starch Press, 2017.
Thorsteinson, Peter, and G. Gnana Arun Ganesh. NET security and cryptography. Prentice Hall Professional, 2004.
Coisel, Iwen, Ignacio Sanchez, and Javier Galbally. "Divide, recombine and conquer: Syntactic patterns-reassembly algorithm applied to password guessing process." 2017 International Carnahan Conference on Security Technology (ICCST). IEEE, 2017.
Deng, Gelei, Xingjie Yu, and Huaqun Guo. "Efficient Password Guessing Based on a Password Segmentation Approach." 2019 IEEE Global Communications Conference (GLOBECOM). IEEE, 2019.
Hitaj, Briland, et al. "Passgan: A deep learning approach for password guessing." International Conference on Applied Cryptography and Network Security. Springer, Cham, 2019.
Ur, Blase, et al. "Measuring real-world accuracies and biases in modeling password guessability." 24th {USENIX} Security Symposium ({USENIX} Security 15). 2015.
Sahin, Cem S., Robert Lychev, and Neal Wagner. "General framework for evaluating password complexity and strength." arXiv preprint arXiv:1512.05814 (2015).
Liu, Enze, et al. "Reasoning Analytically About Password-Cracking Software." 2019 IEEE Symposium on Security and Privacy (SP). IEEE, 2019.
Tatlı, Emin Islam. "Cracking more password hashes with patterns." IEEE Transactions on Information Forensics and Security 10.8 (2015): 1656-1665.
Seznam doporučené literatury
Aumasson, Jean-Philippe. Serious cryptography: a practical introduction to modern encryption. No Starch Press, 2017.
Thorsteinson, Peter, and G. Gnana Arun Ganesh. NET security and cryptography. Prentice Hall Professional, 2004.
Coisel, Iwen, Ignacio Sanchez, and Javier Galbally. "Divide, recombine and conquer: Syntactic patterns-reassembly algorithm applied to password guessing process." 2017 International Carnahan Conference on Security Technology (ICCST). IEEE, 2017.
Deng, Gelei, Xingjie Yu, and Huaqun Guo. "Efficient Password Guessing Based on a Password Segmentation Approach." 2019 IEEE Global Communications Conference (GLOBECOM). IEEE, 2019.
Hitaj, Briland, et al. "Passgan: A deep learning approach for password guessing." International Conference on Applied Cryptography and Network Security. Springer, Cham, 2019.
Ur, Blase, et al. "Measuring real-world accuracies and biases in modeling password guessability." 24th {USENIX} Security Symposium ({USENIX} Security 15). 2015.
Sahin, Cem S., Robert Lychev, and Neal Wagner. "General framework for evaluating password complexity and strength." arXiv preprint arXiv:1512.05814 (2015).
Liu, Enze, et al. "Reasoning Analytically About Password-Cracking Software." 2019 IEEE Symposium on Security and Privacy (SP). IEEE, 2019.
Tatlı, Emin Islam. "Cracking more password hashes with patterns." IEEE Transactions on Information Forensics and Security 10.8 (2015): 1656-1665.