Kri̇pto varlık taksonomi̇ sınıflandirması ve kri̇pto haber duygu anali̇zi̇

Abstract

There are over 1900 cryptocurrencies trading in cryptocurrency exchanges as of June 2020 and the number is rapidly growing. In the current crypto scene, cryptocurrencies are seen as investment vehicles by many, yet every crypto asset is designed to operate in a specific sector within a pre-defined business model. There are many characteristics that differentiate one crypto asset from another and there are numerous internal and external factors that affect each crypto asset differently depending on these characteristics. Crypto investors can leverage these factors and characteristics and use these indicators to create different trading strategies. In this thesis, to guide the investors, we classify the crypto assets under various characteristics and provide sentiment analysis on crypto related news. As our first major task, we focus on automated annotation of the cryptocurrencies in terms of sector, transaction anonymity and asset type through the public information. To this aim, we generated an annotated dataset by collecting information from various sources. The collected dataset includes cryptocurrency descriptions annotated with sector, asset type and transaction anonymity labels. For this task, we utilized a divide-and-conquer supervised learning approach and compared its performance against several supervised learning algorithms for the three aspects. As our second major task, we focus on automated sentiment analysis of crypto asset related news on news title, summary and content. For this, we have generated an annotated news dataset that is collected from various public news sources. We use this dataset to fine-tune a successful neural network model that is trained on financial sentiment analysis task and compared its performance to various dictionary-based methods.Haziran 2020 itibariyle 1900'den fazla kripto para birimi ticareti yapılmakta ve bu sayı hızlıca artmaktadır. Mevcut kripto ticareti senaryosunda, kripto para birimleri birçokları tarafından yatırım araçları olarak görülse de, her kripto varlığı önceden belirlenmiş bir iş modeli içinde belirli bir sektörde çalışmak üzere tasarlanmış durumdadır. Bir kripto varlığını diğerinden ayıran birçok özellik vardır ve bu özelliklere bağlı olarak her bir kripto varlığını farklı şekilde etkileyen çok sayıda iç ve dış faktör bulumaktadır. Kripto para yatırımcıları bu faktörlerden ve özelliklerden yararlanabilir ve bu göstergeleri farklı ticaret stratejileri oluşturmak için kullanabilirler. Biz bu tezde, yatırımcılara rehberlik etmek için kripto varlıklarını çeşitli özellikler altında sınıflandırdık ve kripto paralarla ilgili haberlerde duygu analizi yaptık. İlk büyük görevimiz olarak, açık kaynaklardan topladığımız veriler yoluyla kripto para birimlerinin sektör, işlem anonimliği ve varlık türü açısından otomatik olarak sınıflandırılmasına odaklandık. Bu amaçla, çeşitli kaynaklardan bilgi toplayarak işaretlenmiş bir veri kümesi oluşturduk. Toplanan bu veri kümesi, sektör, varlık türü ve işlem gizliliği etiketleriyle, kripto para birimi hakkındaki yazılı açıklamaları, tanımları içermektedir. Sınıflandırma problemini çözmek için, bölme ve fethetme odaklı bir denetimli öğrenme yaklaşımını kullandık ve modelin performansını bu üç özellik için birkaç denetimli öğrenme algoritmasıyla karşılaştırdık. İkinci büyük görevimiz olarak, kripto varlıklarla ile ilgili haberlerin haber başlığı, özeti ve içeriği üzerine otomatik duygu analizine odaklandık. Bunun için, öncelikle çeşitli açık haber kaynaklarından toplanan işaretlenmiş bir haber veri seti oluşturduk. Bu veri setini, finansal duygu analizi görevinde başarılı olmuş bir sinir ağı modeline ince ayar yapmak ve performansını çeşitli sözlük tabanlı yöntemlerle karşılaştırmak için kullandık.M.S. - Master of Scienc

    Similar works