Analiza razširjenosti protokola HTTPS

Abstract

While using the World Wide Web there are a lot of security risks that threaten users’ privacy, one of the many mechanisms to prevent any security risks is by using the HTTPS protocol. This diploma thesis focuses on the analysis of the HTTPS prevalence among the most used websites in Slovenia and in Spain. It is divided into theoretical and practical parts, the theoretical containing research about SSL/TLS protocol with a chronological review, and its vulnerabilities and development over time. In the practical part we analysed the most used websites in both countries with implementation of a simple web crawler and gathered information whether the website was using a TLS protocol implementation and whether it was HTTPS or not. We then compared the results with the research about the SSL/TLS protocol and its vulnerabilities.Diplomsko delo se navezuje na preučevanje literature, ki opisuje delovanje SSL/TLS protokola ter analizo spletnih strani, ki so zavarovane s HTTPS protokolom, s pomočjo razvitega spletnega pajka. Razdeljena je na teoretični in praktični del. Teoretični del vsebuje opis glavnih značilnosti SSL/TLS protokola, ki z določenim šifriranjem omogoča varno komunikacijo na spletu in ga je za omogočanje HTTPS protokola potrebno nujno implementirati. Prav tako so podrobno opisane vse obstoječe verzije, ter različne metode rokovanja v posameznih verzijah med katerimi sta trenutno varni samo zadnji dve verziji in sicer TLS 1.2 z določeno uporabo dodatnih mehanizmov ter TLS 1.3. Ker je bil protokol v preteklosti zelo izpostavljen, smo opisali tudi veliko različnih napadov, kot so npr. MITM, POODLE, CRIME, TIME itd., ki so se v zgodovini pojavili in ta protokol varnostno izpostavili, ter tudi posledice, ki so jih te izpostavitve prinesle. Opisali smo tudi različne ponudnike certifikatov, ki so trenutno najpogostejši na trgu. V praktičnem delu je bil implementiran spletni pajek (angl. web crawler) v programskem jeziku Python v razvojnem okolju JetBrains PyCharm, skupaj z različnimi Python knjižnicami z namenom, da se analizira spletne strani na področju Slovenije in Španije. S pomočjo spletne strani domaintyper.com, kjer hranijo podatke o imenih najbolj uporabljenih spletnih strani z določeno domeno smo pridobili 687 slovenskih in 7707 španskih spletnih strani, ki so bile vključene v seznam milijon najbolj uporabljenih spletnih strani na svetu. Prav tako smo tudi analizirali verzijo protokola, ki ga spletna stran nudi. Ločeno smo analizirali spletne strani v Sloveniji in Španiji. Testiranje je potekalo v obeh državah. Spletni pajek nam je omogočil, da smo s spletne strani domaintyper.com pridobili naslove spletnih strani, ki smo jih potrebovali za našo analizo. V analizi smo uporabili določene knjižnice, ki so nam poenostavile komunikacijo z gostujočim strežnikom, poenostavile pridobivanje podatkov iz HTML značk na spletni strani ter knjižnice, ki so poenostavile delo za določeno shranjevanje teh podatkov. V zaključku smo ugotovili, da je procent spletnih strani, ki uporablja HTTPS, v obeh državah več kot 65% in da ta delež pomeni, da je procent pri teh spletnih straneh veliko večji v primerjavi z deležem vseh spletnih strani na seznamu milijon najbolj uporabljenih spletnih strani na svetu, prav tako smo ugotovili, katero verzijo protokola strežnik uporablja, zaradi varnosti, smo upoštevali pri rokovanju uporabili samo verziji TLS 1.2 in TLS 1.3 in ugotovili, da je bila uporaba verzije protokola TLS 1.3 približno 20%

    Similar works