    Implementation of Data Mining for Churn Prediction in Music Streaming Company Using 2020 Dataset

    Customer is an important asset in a company as it is the lifeline of a company. For a company to get a new customer, it will cost a lot of money for campaigns. On the other hand, maintaining old customer tend to be cheaper than acquiring a new one. Because of that, it is important to be able to prevent the loss of customers from the products we have. Therefore, customer churn prediction is important in retaining customers. This paper discusses data mining techniques using XGBoost, Deep Neural Network, and Logistic Regression to compare the performance generated using data from a company that develops a song streaming application. The company suffers from the churn rate of the customer. Uninstall rate of the customers reaching 90% compared to the customer’s installs. The data will come from Google Analytics, a service from Google that will track the customer’s activity in the music streaming application. After finding out the method that will give the highest accuracy on the churn prediction, the attribute of data that most influence on the churn prediction will be determined

    From Non-Paying to Premium: Predicting User Conversion in Video Games with Ensemble Learning

    Retaining premium players is key to the success of free-to-play games, but most of them do not start purchasing right after joining the game. By exploiting the exceptionally rich datasets recorded by modern video games--which provide information on the individual behavior of each and every player--survival analysis techniques can be used to predict what players are more likely to become paying (or even premium) users and when, both in terms of time and game level, the conversion will take place. Here we show that a traditional semi-parametric model (Cox regression), a random survival forest (RSF) technique and a method based on conditional inference survival ensembles all yield very promising results. However, the last approach has the advantage of being able to correct the inherent bias in RSF models by dividing the procedure into two steps: first selecting the best predictor to perform the splitting and then the best split point for that covariate. The proposed conditional inference survival ensembles method could be readily used in operational environments for early identification of premium players and the parts of the game that may prompt them to become paying users. Such knowledge would allow developers to induce their conversion and, more generally, to better understand the needs of their players and provide them with a personalized experience, thereby increasing their engagement and paving the way to higher monetization.Comment: social games, conversion prediction, ensemble methods, survival analysis, online games, user behavio

    From Theory to Behaviour: Towards a General Model of Engagement

    Engagement is a fuzzy concept. In the present work we operationalize engagement mechanistically by linking it directly to human behaviour and show that the construct of engagement can be used for shaping and interpreting data-driven methods. First we outline a formal framework for engagement modelling. Second we expanded on our previous work on theory-inspired data-driven approaches to better model the engagement process by proposing a new modelling technique, the Melchoir Model. Third, we illustrate how, through model comparison and inspection, we can link machine-learned models and underlying theoretical frameworks. Finally we discuss our results in light of a theory-driven hypothesis and highlight potential application of our work in industry.Comment: In review for being included in the proceedings of "Conference on Games

    MMORPG-pelaajan pelin lopettamisen ennustaminen koneoppimisella

    Massiiviset monen pelaajan verkkoroolipelit eli MMORPG-pelit (eng. Massively Multiplayer Online Role-playing Game) ovat suosittuja verkossa pelattavia pelejä, joiden tunnusmerkkejä ovat fantasiapainotteinen roolipelaaminen sekä jaetussa pelimaailmassa pelaaminen. Verkkopelaamisen harrastajamäärät ovat jatkuvassa kasvussa, ja suosituilla MMORPG-peleillä on miljoonia pelaajia. Peliyhtiöt kilpailevat pelaajien ajasta ja sitoutumisesta, ja ovat valmiita muokkaamaan peliä potentiaalisia pelaajia houkuttelevaksi. Tässä tutkimuksessa ennustetaan koneoppimistekniikoita käyttämällä suositun MMORPG-pelin potentiaalisista pelaajista ne, jotka tulevat lopettamaan pelin pelaamisen tulevaisuudessa. Peliyhtiöille on tärkeää pystyä tunnistamaan pelaajia, joiden kiinnostus peliä kohtaan on laskemassa, jo ennen kuin pelaaja varsinaisesti lopettaa pelaamisen. Näin peliyhtiöt voivat pyrkiä pitämään pelaajaa pelin parissa tarjoamalla pelaajalle esimerkiksi houkuttimia tai helpotusta pelaamiseen. Lopettavien pelaajien tunnistaminen auttaa myös peliyhtiöitä pelin kehittämisessä ja peliyhtiöt voivat yrittää poistaa peleistään sellaisia ominaisuuksia, jotka nostavat pelaajien pelin lopettamisen todennäköisyyttä. Pelkkä tieto siitä, ketkä tulevat lopettamaan pelin pelaamisen, ei siis riitä. Peliyhtiöitä kiinnostaa myös se, millä tavalla pelin lopettavat pelaajat eroavat pelaajista, joiden motivaatio peliä kohtaan on säilynyt. Tutkimuksen data on peräisin IEEE:n 2017 isännöimästä pelindatanlouhintakilpailusta, ja tutkimuksessa tutkitaan kilpailussa menestyneiden joukkueiden kilpailutöitä. Tutkimuksessa pyritään parantamaan Turun yliopiston (UTU) kilpailujoukkueen kilpailutyön ennustustarkkuutta lisäämällä malliin uusia piirteitä. Älykkäät piirteet vähentämät malliin tarvittavien piirteiden määrää. Tutkimuksessa tutkittiinkin yli sataa potentiaalista piirrettä, joista 40 valittiin uuteen malliin sovitettavaksi. Uusien piirteiden, sekä tiimi UTU:n mittaamien piirteiden, toimivuutta mitattiin usealla tekniikalla, joista parhaimman ristiinvalidointitarkkuuden saavuttivat harjanneluokittelija, lineaarinen tukivektorikone ja logistinen regressio. Testidatojen validoinnissa logistinen regressio onnistui parantamaan tiimin kilpailuratkaisua eniten. Parhaiten menestyneessä mallissa oli vain yksitoista piirrettä, joista viisi oli uusia piirteitä ja kuusi sisältyi myös tiimi UTU:n kilpailutyöhön. Sekä tämän tutkimuksen, että varsinaisessa kilpailussa toiseksi päätyneen tiimi UTU:n ratkaisu, poikkeavat merkittävästi kilpailun voittajajoukkueen Yokozuna Data:n mallista. Voittajajoukkue käytti mallissaan jopa 500 piirrettä ja monimutkaisia tekniikoita, kuten syväoppimista ja satunnaistettuja päätöspuita. Koska molemmat lineaarista mallia käyttävät ratkaisut päätyivät melkein samaan tulokseen kuin voittajajoukkueen malli, tutkimuksesta käy ilmi, että juuri älykäs piirteiden valinta on avainasemassa MMORPG-pelin pelaajien lopettamisen ennustamisessa ja että lopettavat pelaajat voi ennustaa hyvin pienellä määrällä piirteitä

    Predicting early user churn in a public digital weight loss intervention

    Digital health interventions (DHIs) offer promising solutions to the rising global challenges of noncommunicable diseases by promoting behavior change, improving health outcomes, and reducing healthcare costs. However, high churn rates are a concern with DHIs, with many users disengaging before achieving desired outcomes. Churn prediction can help DHI providers identify and retain at-risk users, enhancing the efficacy of DHIs. We analyzed churn prediction models for a weight loss app using various machine learning algorithms on data from 1,283 users and 310,845 event logs. The best-performing model, a random forest model that only used daily login counts, achieved an F1 score of 0.87 on day 7 and identified an average of 93% of churned users during the week-long trial. Notably, higher-dimensional models performed better at low false positive rate thresholds. Our findings suggest that user churn can be forecasted using engagement data, aiding in timely personalized strategies and better health results

    Game Data Mining Competition on Churn Prediction and Survival Analysis Using Commercial Game Log Data

