Classıfıcatıon Of Encrypted Internet Traffıc Usıng Machıne Learnıng Approach

Abstract

İnternet kullanım oranı dünya genelinde %62’inin üzerindedir ve bu oran günden güne artmaktadır. Bu artış ile birlikte internet üzerinden akan trafikteki bilgilerin gizliliğini sağlamak önem kazanmaktadır. Bunun için şifreleme algoritmaları ve protokoller kullanılmaktadır. Kullanıcılar için faydalı olan bu durum saldırganlar tarafından gizlenmek amaçlı da kullanılmaktadır. Saldırganlar şifrelenmiş trafik ile IDS/IPS ve antivirüs sistemlerini atlatabilme yeteneği kazanmaktadırlar. Şifrelenmiş trafiğin deşifrelenmesi işlemi yapılmadan içerik analizi yapılamadığı için mevcut ticari güvenlik çözümleri bu durum karşısında yetersiz kalmaktadır. Bu çalışmada XGBoost, Karar Ağacı ve Rassal Orman sınıflandırma algoritmaları kullanılarak şifrelenmiş paketler üzerinden giden-gelen veriler analiz edilerek trafiğin sınıflandırılması amaçlanmıştır. Bu sayede deşifreleme yapılmadan sadece akan trafik üzerinde gelen giden paketlerin boyut, süre gibi bazı meta verileri kullanılarak sınıflandırılması ile ağ uzmanları ve siber güvenlik uzmanlarının ağ üzerindeki analiz yetenekleri artırılarak siber saldırıların tespiti ve saldırılara karşı önlem alınması mümkün olmaktadır. Bu çalışmada önerilen modelin test edilmesi için ISCX VPNnonVPN veri seti kullanılmıştır. Oluşturulan yapı ile şifreli paketler yüksek başarı oranı ile sınıflandırılmış ve XGBoost sınıflandırma metodu kullanılarak %94,53 başarı yakalanmıştır.The rate of internet usage in the world is over 62% and this rate is increasing day by day. With this increase, it becomes important to ensure the confidentiality of the information in the traffic flowing over the internet. Encryption algorithms and protocols are used for this purpose. This situation, which is beneficial for normal users, is also used by attackers to hide. Cyber attackers or hackers gain the ability to bypass security precautions such as IDS/IPS and antivirus systems with using encrypted traffic. Since payload analysis cannot be performed without deciphering the encrypted traffic, existing commercial security solutions fall short in this situation. In this study, it is aimed to classify the network traffic by analysing the outgoing and incoming data over the encrypted traffic using Extreme Gradient Boosting (XGBoost), Decision Tree and Random Forest classification methods. In this way, it is possible to detect cyber attacks and take measures against attacks by increasing the analysis capabilities of network experts and cyber security experts on the network by classifying the encrypted traffic using only some metadata such as the size and duration of incoming and outgoing packets on the flowing traffic without deciphering. ISCX VPNNonVPN dataset was used to test the proposed model in this study. With the created framework, encrypted traffic was classified with a high success rate and 94,53% success was achieved by using the XGBoost classification method

Similar works

Full text

thumbnail-image

Gazi University Dspace

redirect
Last time updated on 24/12/2021

This paper was published in Gazi University Dspace.

Having an issue?

Is data on this page outdated, violates copyrights or anything else? Report the problem now and we will take corresponding actions after reviewing your request.