Data driven modelling of crystalliser particle size distribution

Abstract

Abstract. The aim of the thesis was to gain knowledge of the crystallisation process and to get insight on the process variables controlling it. To reach this aim static models were identified, and their performance was analysed. Measurement data from the crystallisation process was used as inputs to the developed model while the output was the D50 value of the particle size distribution. The measurement data was averaged for every 15 minutes and pre-processed by removing outliers and filtering. Two datasets were collected containing 21 input variables. Training data included measurements from a three-and-a-half-day period and test data from a two- and-a-half-day period. LASSO algorithm was used for input variable selection. The selected variable subsets contained 21, 19, 12 and 3 variables. Neural network models containing 15, 25, 35 or 40 neurons were trained and tested using these input variable subsets. Neural network models did not perform well with test data, as their mean absolute percentage error (MAPE) was over 20%. The models containing 12 input variables and 25 or 35 neurons or 19 input variables and 35 neurons performed the best with test data. MeSO4 and NH3 densities and crystalliser pH were the most important variables for modelling, according to the LASSO algorithm.Kiteyttimen partikkelikokojakauman datapohjainen mallinnus. Tiivistelmä. Työn tavoitteena oli lisätä prosessitietämystä kiteytysprosessista sekä saada lisätietoa reaktioon vaikuttavista muuttujista. Tavoitteeseen päästiin kiteytysprosess ista muodostettua staattista mallia analysoimalla. Prosessin mittainstrumenteista saatu mittausdata toimi mallin tulomuuttujina ja näytteiden analysoinnilla saadun partikkelikokojakauman D50-arvo lähtömuuttujana. Mittausdata keskiarvoistettiin 15 minuutin intervalleihin datan esikäsittelyä varten, jolloin datasta poistettiin poikkeamat sekä data suodatettiin. Prosessista kerättiin kaksi mittausaineistoa, jotka molemmat pitivät sisällään 21 muuttujaa. Opetusdata sisälsi mittausdataa 3,5 päivän tuotantojaksolta ja testidata 2,5 päivän tuotantojaksolta. LASSO- algoritmia käytettiin muuttujien valintaan. Valitut muuttujajoukot sisälsivät 21, 19, 12 ja 3 muuttujaa. Jokaisesta muuttujajoukosta luotiin neljä neuroverkkomallia. Neuroverkkojen neuroneiden määrät olivat 15, 25, 35 ja 40. Neuroverkkomallit suoriutuvat testidatalla kaiken kaikkiaan huonosti ja niiden suhteellinen virhe oli yli 20 %. Parhaiten testidatalla suoriutuvat neuroverkkomallit, joiden käyttämä muuttujajoukko sisälsi 12 muuttujaa ja joiden piilokerrokset sisälsivät 25 ja 35 neuronia sekä neuroverkko, joka käytti muuttujajoukossaan 19 muuttujaa ja jonka piilokerros sisälsi 35 neuronia. LASSO-algoritmin mukaan kolme tärkeintä muuttujaa olivat MeSO4- ja NH3-tiheydet sekä kiteyttimen pH

    Similar works