2 research outputs found
Interpretabilidade em modelos de avaliação de risco cardiovascular
Segundo a World Health Organization, as doenças cardiovasculares representam uma
das principais causas de morte a nível mundial. Para tentar contrariar esta tendência,
as medidas passam bastante pela prevenção. Neste campo, a análise de dados
clínicos tendo por base vários modelos Machine learning de previsão de risco tem
vindo a ser implementada, com o objetivo de prever o risco de ocorrência de um
determinado evento (doença, morte, etc.). No entanto, os modelos apresentam
algumas fragilidades, entre as quais é possível destacar a falta de interpretabilidade,
pois alguns são modelos black-box. Estes, apesar dos elevados desempenhos que
apresentam, nem sempre conseguem explicar as suas previsões ao utilizador final.
No entanto, em áreas tão críticas como a da saúde, o aumento da interpretabilidade
é fundamental para criar a confiança necessária nos clínicos e permitir a efetiva
incorporação deste tipo de ferramentas na prática clínica. Desta forma, têm tentado
desenvolver-se modelos cada vez mais white-box que, ao fornecerem explicações
sobre os resultados que apresentam, transmitem essa confiança aos utilizadores.
O objetivo principal do trabalho é analisar modelos Machine learning, de entre os
selecionados, e o modelo GRACE, para perceber qual consegue transmitir o melhor
compromisso entre interpretabilidade e performance. Escolheu-se o modelo GRACE
por ser, atualmente, um modelo de previsão de risco bastante utilizado por
profissionais da área clínica para avaliar pacientes com doenças cardíacas agudas.
Os algoritmos escolhidos são Árvore de decisão, Naïve Bayes e Clustering. A Árvore
de decisão é aplicada visto ser bastante interpretável e permitir facilmente a extração
de regras. O modelo Bayesiano permite calcular relações probabilísticas entre
classes, neste caso entre sintomas e possibilidade de morte ou sobrevivência. Por
último o Clustering, dado que permite agrupar pacientes com caraterísticas
semelhantes. Os modelos referidos são executados com um dataset composto por
dados clínicos de pacientes dos Hospitais de Santa Cruz e de Leiria. Para cada um
dos modelos são calculadas métricas demonstrativas da respetiva performance.
Simultaneamente, são extraídas regras a partir de cada um deles e tenta-se verificar
a veracidade das mesmas com recurso a dados reais.
Por fim, todos os modelos são comparados em termos das performances obtidas,
tendo-se concluído que o GRACE é o que consegue obter o melhor compromisso
entre a performance e a interpretabilidade que fornece. Isto acaba por revelar um
equilíbrio com a realidade, visto que este é um modelo bastante aplicado na prática
clínica