413 research outputs found

    Predicting B2B Customer Churn for Software Maintenance Contracts

    Get PDF
    Customer churn prediction is a well-known application of machine learning and data mining in Customer Relationship Management, which allows a company to predict the probability of its customer churning. In this study, we extended the application of customer churn prediction to the context of software maintenance contract. In addition, we examined the predictive power of economic factors. Random forest, gradient boosting machine, stacking of random forest and gradient boosting machine, XGBoost, and long short-term memory networks were applied. While an ensemble model and XGBoost performed best, macroeconomic variables did not yield statistically significant improvement in any prediction

    Methods and Applications of Data Mining in Business Domains

    Get PDF
    This Special Issue invited researchers to contribute original research in the field of data mining, particularly in its application to diverse domains, like healthcare, software development, logistics, and human resources. We were especially interested in how the data mining method was modified to cater to the specific domain in question. The challenge is that the more complex a domain is the harder it is to make good predictions, as more implicit domain knowledge is required that is not always available [1]. This is especially true in the case of complex domains where there are soft factors, like the interaction of the conflicting and cooperating objectives of the stakeholders [2,3], and system dynamics play a significant role [4]. In a business context, the challenge is that one would like to see (i) how the algorithms can be repeatable in the real world, (ii) how the patterns mined can be utilized by the business, and (iii) how the resulting model can be understood and utilized in the business environment [1]. Furthermore, the idea is to identify the variables that impact the goal variable but to do so with the data, interestingness, deployment, and general domain (business) constraints of the domain [1,5]. One of the methods to analyze a complex domain is using a method called intelligence meta-synthesis [6,7]. Intelligence synthesis is the collection and creation of perceived or understood (i.e., not necessarily objective) information. Meta-synthesis is the collection and creation of knowledge and information from collected intelligences [1]. The goal of this approach is to design and develop predictive models that could eventually be incorporated into a business intelligence dashboard. As a result, one would (i) understand the nature and origin of data that allows the system user to determine the quality of the data to perform the data cleaning; (ii) understand the factors in the domain that influence the predicted variable, leading the developer to determine which variables need to be included in the predictive model; (iii) develop predictive models that are usable and interesting within the domain in terms of predictive power, integrating with existing infrastructure, and integrating with business rules and processes; and finally (iv) use the predicted data to find the optimal business processes in the particular domain. There are also research works that have built on top of intelligence meta-synthesis, such as the study published by the authors of [1]

    FEASIBILITY OF B2C CUSTOMER RELATIONSHIP ANALYTICS IN THE B2B INDUSTRIAL CONTEXT

    Get PDF
    Abstract The purpose of the paper is to evaluate the feasibility of business-to-consumer (B2C) customer relationship analytics in the industrial business-to-business (B2B) context, in particular spare part sales. The contribution of the paper is twofold; the article identifies analytics approaches with value potential for B2B decision-making, and illustrates their value in use. The identified analytics approaches, customer segmentation, market basket analysis and target customer selection, are common in the B2C marketing and e-commerce. However, in the industrial B2B marketing, the application of these approaches is not yet common.. The different kinds of analytics under examination in this paper use machine learning (ML) techniques. The examination takes into account the applicability and usefulness of the techniques as well as implementation challenges. The research suggests that the identified analytics may serve different business purposes and may be relatively straightforward to implement. This requires careful examination of the desired purposes of use in a particular business context. However, the continuous and real-time use of such analyses remains a challenge for further examination also in information systems research. Keywords: Business analytics, B2B decision-making, Machine learning, Data mining, Artificial intelligence, CR

    Asiakaspoistuman tutkiminen koneoppimisen avulla

    Get PDF
    Valtavasti kasvaneet datamäärät, tallennuskapasiteetin kasvu sekä tekoälyn kehitys ovat mahdollistaneet data-analyysin entistä monipuolisemman hyödyntämisen asiakassuhteen laadun tutkimisessa. Yritykset ovat heränneet siihen, että uusien asiakkaiden hankkiminen on huomattavasti kalliimpaa kuin vanhoista kiinnipitäminen. Tämän vuoksi moni yritys on alkanut tutkia asiakaspoistumaa. Kohdeyritys toimii rautakauppa-alalla, ja yrityksellä oli tarve luoda automatisoitu malli asiakaspoistuman tunnistamiseksi. Tutkittavan asiakasryhmän kauppa ei perustu hankintasopimuksiin, joten asiakkailla ei ole velvollisuutta ilmoittaa, mikäli he siirtävät ostonsa muualle. Kohdeyritys haluaa päästä hyvissä ajoin selville hiipuvista asiakkaista, jotta ne voidaan yrittää voittaa takaisin, ennen kuin ostot loppuvat kokonaan. Tarkoituksena on luoda koneoppimiseen perustuva malli, joka tuottaisi helposti tulkittavan poistumisriskiprosentin suoraan kohdeyrityksen CRM-järjestelmään. Työssä keskitytään koneoppimisen mallin muuttujien määrittelyyn sekä mallin toimivuuden validointiin. Yleisimmät muuttujat asiakaspoistuman tutkimisessa ovat niin sanotut RFM-muuttujat, jotka määrittelevät aikaa viimeisestä ostoksesta (recency), ostostiheyttä (frequency) sekä rahallista arvoa (monetary). Aluksi määritettiin tilastollinen asiakaspoistuma. Kohdeyrityksen myyntihistoriadataa tutkimalla määriteltiin varmasti poistuneet asiakkaat. Tilastollisen asiakaspoistuman määrittelyyn käytettävien muuttujien parametrejä säätämällä malli oppi tunnistamaan poistuneet asiakkaat riittävän hyvin, jotta mallia voidaan käyttää varsinaisten poistumaennusteiden tekemiseen. Tilastollisen asiakaspoistuman määrittelyyn muuttujina käytettiin ostostiheyttä sekä painotettua ostostiheyden ja viimeisestä ostoksesta kuluneen ajan avulla laskettua pistelukua (RF- score). Varsinaisessa ennustemallissa aineisto jaettiin opetus-, validointi- ja testiaineistoon, jotka ovat kaikki eri ajanjaksoilta. Malli koulutettiin opetusaineiston avulla, tulokset vahvistettiin validointiaineiston avulla ja ennuste tehtiin testiaineistolla. Testiaineisto on aina uutta, mallille entuudestaan tuntematonta dataa. Mallia testattiin kolmella eri koneoppimisen algoritmilla, ja niiden tuottamat tarkkuusarvot olivat kaikki kahden prosenttiyksikön sisällä toisistaan. Tarkin algoritmi oli XGboost, joka saavutti testiaineistolla ROC-AUC-arvon 0,8998 sekä F1-scoren 0,8218. Kummatkin arvot osoittavat, että mallin suorituskyky on hyvä ei-sopimuspohjaisessa asiakaspoistuman tutkimisessa. Mallin tuottama poistumariskiprosentti näkyy suoraan yrityksen CRM-järjestelmässä, ja mikäli prosentti ylittää ennalta määrätyn kynnysarvon, myyjälle lähtee ilmoitus asiakkaan poistumariskistä. Tämän jälkeen myyjä soittaa asiakkaalle ja yrittää selvittää, onko riski todellinen. Ensisijaisena tarkoituksena on tavoittaa asiakas ennen kuin ostot loppuvat kokonaan. Ensimmäiseen koneoppimisen mallin kehitysversioon ei vielä saatu kaikkia toivottuja muuttujia mukaan. Jatkokehityksenä malliin olisi hyvä saada lisättyä muuttujiksi vastuumyyjän vaihtuminen, aika myyjän viimeisestä yhteydenotosta sekä asiakkaan tuoteryhmäkohtaiset ostokäyttäytymismuutokset. Nämä muuttujat lisäämällä voitaisiin parantaa mallin tarkkuutta ja ennustuskykyä. Laajemmin tarkastellen kohdeyrityksen kannattaa myös tarkastella asiakaskannattavuutta, jotta kannattamattomia asiakkaita ei yritetä houkutella takaisin. Lisäksi yrityksen kannattaa pyrkiä hyödyntämään keräämäänsä dataa esimerkiksi asiakohtaisten kampanjoiden suunnitteluun sekä asiakkaan elinkaaren arvon määrittelyyn. Tekoälyä hyödyntämällä kohdeyrityksen on mahdollista tehostaa asiakassuhteiden hoitoa ja saavuttaa kannattavampi asiakaspohja
    corecore