thesistext
Decision-tree-based differential diagnosis of β-thalassemia and sideropenic anemia in children
Abstract
Mikrocitne anemije najčešći su oblik anemija u dječjoj dobi. Najčešći uzrok mikrocitne anemije jest nedostatak željeza, tj. sideropenična anemija. Značajno rjeđi uzrok mikrocitne anemije jesu talasemije. Dijagnostički model za razlikovanje tih dviju bolesti u djece samo na temelju nalaza kompletne krvne slike, prema dostupnim literaturnim podacima, nije standardiziran. Cilj istraživanja bio je odrediti matematičke indekse koji bi omogućili valjano razlikovanje tih dviju bolesti samo na temelju nalaza kompletne krvne slike, a pritom uvažavajući specifičnosti β-talasemije u naše djece. Logističkom regresijom određene su vrijednosti krvne slike koje su najinformativnije za razlikovanje β-talasemije od sideropenične anemije. Od tih parametara kompletne krvne slike najinformativnijom se pokazao srednji volumen eritrocita (MCV). Druga dva parametra kompletne krvne slike koja najbolje služe za razdvajanje tih dviju bolesti jesu koncentracija hemoglobina (Hb) i prosječna količina hemoglobina u eritrocitu (MCH). Budući da granične vrijednosti izvornih indeksa koji su načinjeni za odraslu populaciju većinom ne zadovoljavaju u djece, uporabom ROC analize učinjena je optimizacija graničnih vrijednosti svih u literaturi objavljenih svjetskih indeksa i formula. Tako dobivene granične vrijednosti bolje razlikuju djecu s β-talasemijom od djece sa sideropeničnom anemijom u usporedbi s graničnim vrijednostima izvornih indeksa. Najbolji prilagođeni (optimizirani) jednostavni indeks za razlikovanje djece s β-talasemijom od djece sa sideropeničnom anemijom u Republici Hrvatskoj jest Matos-Carvalho indeks s točnošću > 90 % (91,51 %) uz uravnoteženu osjetljivost (89,94 %) i specifičnost (93,75 %). Ostali indeksi s točnošću England i Fraser > Pornprasert > Sirachainan > Telmissani MCHD > CRUISE > Alparslan > Hameed > Sargolzaie > Zaghloul II). Složeni indeksi pokazali su također uspješnost u razlikovanju djece s β-talasemijom od djece sa sideropeničnom anemijom u Republici Hrvatskoj s točnošću 80 % (ukupno 11 indeksa i formula) upotrijebljeni su za iznalaženje novoga složenog CroCompDD indeksa (točnost 92,25 %, osjetljivost 92,72 %, specifičnost 91,67 %). Analiza grupa (engl. cluster analysis) matematičkih indeksa kao mjerilo najbolje performanse izdvojila je AUC i Youden indeks. Uporabom metoda strojnog učenja načinjen je dijagnostički postupak s najpovoljnijim odnosom osjetljivosti i specifičnosti za te dvije bolesti. Upotrijebljena su četiri algoritma. Najboljim se pokazao JRIP s točnošću od 94,83 % s postotkom točnosti na unakrsnoj validaciji (engl. leaving one out) od 89,29 %. Sljedeći algoritam, PART, ima postotak 92,25 % s unakrsnom validacijom od 85,60 %. J48 algoritam ima postotak točnosti od 91,88 % (na unakrsnoj validaciji 88,56 %), dok Simple Cart algoritam ima točnost od 91,88 % (na unakrsnoj validaciji 87,45 %). Dobiveni rezultati omogućuju uspostavu smjernica za razlikovnu dijagnostiku mikrocitne hipokromne anemije s praktičnom primjenom u primarnoj, sekundarnoj i tercijarnoj zdravstvenoj zaštiti.Microcytic anemias are the most common form of childhood anemia. The most common cause of microcytic anemia is iron deficiency, i.e., sideropenic anemia. A significantly rarer cause of microcytic anemia is thalassemia. According to available literature data, the diagnostic model for distinguishing these two diseases in children based solely on the findings of a complete blood count is not standardized. The study aimed to determine mathematical indices that would allow a valid distinction between these two diseases only based on the findings of a complete blood count while considering the specifics of β-thalassemia in our children. Logistic regression determined the blood count values that are most informative for distinguishing β-thalassemia from sideropenic anemia. Of these complete blood count parameters, the mean corpuscular volume (MCV) proved to be the most informative. The other two complete blood count parameters that best serve to separate these two diseases are hemoglobin concentration (Hb) and mean corpuscular hemoglobin (MCH). Since the cut-off values of the original indices made for the adult population are mostly unsatisfactory in children, the limit values of all published world indices and formulas published in the literature were optimized using ROC analysis. The cut-off values thus distinguish children with β-thalassemia better than children with sideropenic anemia compared to the cut-off values of the original indices. The best adjusted (optimized) simple index for distinguishing children with β-thalassemia from children with sideropenic anemia in the Republic of Croatia is the Matos-Carvalho index with an accuracy of> 90% (91.51%) with balanced sensitivity (89.94%) and specificity (93.75%). Other indices with an accuracy of England and Fraser> Pornprasert> Sirachainan> Telmissani MCHD> CRUISE> Alparslan> Hameed> Sargolzaie> Zaghloul II). Complex indices also showed success in distinguishing children with β-thalassemia from children with sideropenic anemia in the Republic of Croatia with an accuracy of <90% and ≥ 80%; Index26 with an accuracy of 82.66% with a sensitivity of 84.11% and a specificity of 80.83% (adjusted limit values) and a Janel (11T) index with standard limit values (accuracy 83.39% sensitivity, 93.39%, specificity 75.33%). The CroCompDD index was compiled based on the group analysis, consisting of 6/11 best indices and formulas with adjusted cut-off values (AUC median 0.92). This index best reflects the genetic specificity of children with β- thalassemia in the Republic of Croatia (accuracy 92.25%, sensitivity 92.72%, specificity 91.67%). A diagnostic procedure was made using machine learning methods with the most favorable relationship of susceptibility and specificity for these two diseases. Four algorithms were used. JRIP proved to be the best, with an accuracy of 94.83% with a percentage of accuracy on crossvalidation (leaving one out) of 86.35%. The J48 algorithm has an accuracy percentage of 91.88% (on cross-validation 89.29%). The following algorithm, PART, has an accuracy of 92.25% with a cross-validation score of 85.60%. The J48 algorithm has an accuracy of 91.88% (with a crossvalidation score of 88.56%), while the Simple Cart algorithm has an accuracy of 91.88% with a cross-validation score of 87.45%.The obtained results enable the establishment of guidelines for the differential diagnosis of microcytic hypochromic anemia with practical application in primary, secondary, and tertiary health care- info:eu-repo/semantics/doctoralThesis
- text
- sideropenična anemija
- beta-talasemija
- strojno učenje
- stabla odlučivanja
- iron defficiency anemia
- beta thalassemia
- machine learning
- decision trees
- BIOMEDICINA I ZDRAVSTVO. Kliničke medicinske znanosti. Pedijatrija.
- BIOMEDICINE AND HEALTHCARE. Clinical Medical Sciences. Pediatrics.
- Patologija. Klinička medicina
- Pathology. Clinical medicine
- info:eu-repo/classification/udc/616(043.3)