3 research outputs found

    Machine Learning Approach for Genre Prediction on Spotify Top Ranking Songs

    Get PDF
    This paper analyzed the audio features and genres of top ranking songs on Spotify from January to August in 2017. The dataset consists of daily top ranking songs, their audio features and genres. The data was collected from Kaggle.com, Spotify Web API, and Discogs AIPs. Analysis contains summary statistics, principal component analysis, and machine learning classifier implementation and evaluation. The principal component analysis converted nine audio features into three principal components and they are named as sound, words in lyrics, and rhythm according to the description of audio features they include. The machine learning method takes audio features and genres as input and predicts genres for songs in the test set based on their audio features. The classifier achieved 46.9% accuracy which is not as good as expected. Detailed procedures, results and analysis are provided.Master of Science in Information Scienc

    Information analysis and retrieval in music databases

    No full text
    The aim of the present thesis was the study of the growing research topic of music search engines and consequently potential specifications to follow and challenges to face were presented. Next, a voice separation model was proposed, an algorithm performing well on a large and diverse dataset of songs. A novel algorithm was also presented that discovers musical stream segments in symbolic musical data, making use of a single set of fundamental auditory principles for the concurrent horizontal and vertical segregation of a given musical texture into stream segments. The next goal of the thesis was building tag-aware groups for music high order ranking and topic discovery. For each group the most prominent users, tags, and music objects could be revealed using a generalization of the popular web-ranking concept into the social data domain. Thus, tag-aware groups proved to be crucial in offering ways to add structure in the unstructured nature of tags. Furthermore, the problem of personalized music recommendation based on social tags was also examined. In particular, the modeling of social tagging data with 3-order tensors captures cubic (3-way) correlations between users, tags and music items. The last goal was to efficiently index large music databases using spectral similarity measures. This was achieved in two steps: (a) by embedding audio similarity measures into a reduced space, and then (b) by indexing the reduced data with multidimensional index structures. Thus, for first time scalable efficient audio searching similarity was achieved.Σκοπός της διατριβής ήταν η ανάλυση και η επεξεργασία βασικών ζητημάτων για τη σχεδίαση και ανάπτυξη μουσικών μηχανών αναζήτησης στον παγκόσμιο ιστό. Στο πλαίσιο αυτό πραγματοποιήθηκε μελέτη της τρέχουσας κατάστασης των μουσικών μηχανών αναζήτησης. Πιο συγκεκριμένα, εντοπίσθηκαν οι ιδιαίτερες λειτουργίες και απαιτήσεις για την ανάπτυξη των μουσικών μηχανών αναζήτησης, ενώ παράλληλα προέκυψαν προτάσεις για μελλοντικές βελτιώσεις και επεκτάσεις. Επίσης αναπτύσσεται μέθοδος για διαχωρισμό φωνών (ανθρώπινη φωνή, μουσικά όργανα) σε συμβολικά μουσικά δεδομένα, ακολουθώντας κανόνες της μουσικής θεωρίας και εφαρμόζοντας αλγόριθμους από την εξόρυξη δεδομένων. Στη συνέχεια προτείνεται μέθοδος για την εύρεση μουσικών τεμαχίων, με το μουσικό τεμάχιο να είναι μία μικρή ακολουθία από νότες πολλών φωνών που ακούγονται συγχρόνως. Το επόμενο ερευνητικό θέμα ήταν αυτό των μουσικών ομάδων, αποτελούμενες από ετικέτες, χρήστες, μουσικά κομμάτια, με στόχο α) την αντιμετώπιση προβλημάτων των μεθόδων επεξεργασίας ετικετών, αλλά και συγχρόνως β) την υποστήριξη σύνθετων εκτελέσεων, όπως είναι οι προτάσεις για σχετική μουσική. Ακόμη αναπτύσσεται υβριδικό μέτρο ομοιότητας μουσικού περιεχομένου, προσδίδοντας μια νέα διάσταση στους ποιοτικούς μηχανισμούς λειτουργίας των μουσικών μηχανών αναζήτησης, καθώς αποτελεί μέτρο βασισμένο στο περιεχόμενο αλλά και στα κοινωνικά χαρακτηριστικά που εισάγει ο χρήστης στον παγκόσμιο ιστό. Τέλος προτείνεται η εφαρμογή μη γραμμικών μεθόδων μείωσης διαστάσεων σε μέτρα ομοιότητας φάσματος μουσικών δεδομένων, με στόχο τη γρήγορη δημιουργία και επιστροφή αποτελεσμάτων, ζήτημα που απασχολεί έντονα την κοινότητα ανάκτησης μουσικής πληροφορίας