Estimation of sex in brazilian samples with cross-validation in populations of different regions

Abstract

Orientador: Sergio Roberto Peres LineTese (doutorado) - Universidade Estadual de Campinas, Faculdade de Odontologia de PiracicabaResumo: A estimativa do sexo pode ser influenciada pela ancestralidade e a população brasileira foi miscigenada ao longo dos séculos. Crânios são frequentemente usados para estimar o dimorfismo sexual. O objetivo do presente estudo foi estimar o sexo com base em cinco medidas craniométricas de amostras contemporâneas e identificadas de duas diferentes regiões brasileiras com validação cruzada e validação cruzada K-fold. O grupo étnico foi estimado pelo Índice Nasal e pelo Índice Facial Prosopométrico. A amostra do Sul foi usada para estimar um modelo (treino) e então seu desempenho foi testado na amostra do Sudeste (teste). Em um segundo momento, testamos a hipótese inversa: o subconjunto Sudeste foi usado para estimar um modelo e o subconjunto do Sul foi usado para validar os dados do modelo. As duas amostras (Sudeste - Sul) foram unidas em um grupo, a fim de verificar a influência dessa união na predição do sexo. Todos os testes criaram modelos, com uma, duas, três e quatro variáveis independentes. O melhor resultado de validação cruzada para a amostra do Sudeste, 57% de acerto, pode ser atribuído à heterogeneidade da amostra que atua como uma variável interferente na estimativa de sexo. A estimativa do sexo é mais bem realizada sem a interferência da ancestralidade variável. Amostras unidas, Sudeste - Sul, resultaram em uma boa predição (85%), mas com um valor intermediário entre o Sul (89%) e o Sudeste (81%)Abstract: Sex estimation might be influenced by ancestry and Brazilian population is miscegenated over centuries. Skulls are often used for estimating sex dimorphism. The purpose of the present study was estimate sex based on five craniometric measurements from contemporary and identified samples from two different Brazilian regions with cross-validation and cross validation K-fold. Ethnic group was estimated by Nasal Index and Prosopometric Facial Index. The southern sample was used to estimate a model (train) and then its performance was tested in the southeast sample (test). In a second moment, we tested the inverse hypothesis. The southeast subset was used to estimate a model and the southern subset was used to validate the model data. The two samples (southeast - south) were united in one group, in order to verify the influence of this union in the prediction of sex. All tests created models, with one, two, three, and four independent variables. The best cross-validation result for the southeast sample, 57% accuracy, can be attributed to the heterogeneity of the sample that acts as an interfering variable in the sex estimate. Sex estimation is best performed without the interference of the variable ancestry. United samples, southeast - southern, resulted in a good prediction (85%), but an intermediate value between southern (89%) and southeast (81%)DoutoradoHistologia e EmbriologiaDoutora em Biologia Buco-Dental1592353CAPE

    Similar works