Statistical approaches to measure heterogeneity in malaria transmission intensity: an epidemiological study on the Tanzanian populations

Abstract

Tese de mestrado em Bioestatística, apresentada à Universidade de Lisboa, através da Faculdade de Ciências, em 2018A malária (paludismo) é uma doença infecciosa, reconhecida, nas últimas décadas, como sendo um dos maiores desafios para a saúde pública. A malária é endémica em grande parte da Africa Subsaariana, Sudeste asiático e América Latina, estimando-se cerca de 216 milhões de novos casos de infeção e 445 000 mortes, só em 2016. Os estudos produzidos nos últimos anos têm permitido abordagens efetivas para o controlo e para uma eliminação mais eficiente dos seus transmissores (os mosquitos do género Anopheles), bem como o desenvolvimento de tratamentos diretos na redução do parasita Plamodium falciparum, a espécie mais incidente nos países da Africa Subsaariana. Com estes avanços, a incidência de malária tem gradualmente vindo a ser reduzida, havendo cada vez mais áreas a transitar para estados de pre-eliminação e eliminação. Devido a estes desenvolvimentos, surgem novos desafios para a estimação da incidência dos locais e da intensidade de transmissão. As regiões onde a intensidade de transmissão é mantida baixa produzem infeções assintomáticas, tornando os indivíduos neste estado transmissores \invisíveis de malária, uma vez que os métodos mais comuns para medir os níveis de malária baseiam-se na deteção objetiva de casos de infeção. Como alternativa a estas medidas, surge a serologia, aplicada em análises sero-epidemiológicas. Este método põe de lado a análise de indivíduos infetados/não infetados, passando a lidar com a exposição/não exposição dos indivíduos ao parasita P. falciparum e o desenvolvimento de anticorpos pelo sistema imunitário. A serologia mede e identifica a presença de anticorpos específicos para antigénios do parasita, podendo definir um gradiente para a intensidade de transmissão de uma dada população analisada, mesmo em locais de baixa incidência. Esta tese teve como objetivo descrever e estimar a intensidade de transmissão do parasita P. falciparum de uma amostra estratificada de 5058 indivíduos distribuídos em 21 vilas ao longo do Nordeste da Tanzânia. Estes dados foram originalmente recolhidos e aplicados num estudo de referência para a área de sero-epidemiologia, tendo como intuito estimar a intensidade de transmissão associada às variáveis altitude e precipitação. Numa primeira abordagem, os principais fatores de risco associados à prevalência de infecção e heterogeneidade nos vários locais foram identificados. Através da construção e seleção do melhor modelo linear generalizado (generalised linear model, GLM), a influência destes determinantes de transmissão foi estudada. Nesta análise, determinantes representativos da altitude, agregado de vilas, grupo étnico, ou grupo etário, demonstraram ter uma influência significativa quando adicionados no modelo, tendo um efeito direto na probabilidade de infecção. O GLM também caracterizou os três determinantes de exposi_c~ao usados, relativos aos três antigénios estudados ao longo do projeto: merozoite surface protein 1 (MSP1), merozoite surface protein 2 (MSP2) e apical merozoite antigen 1 (AMA1). A presença destes determinantes no modelo demonstrou a sua utilidade como bons indicadores de infeções de malária, aumentando muito a probabilidade de infeção de indivíduos sempre que estavam presentes. Tendo identificado os anticorpos para os antigénios como uma alternativa ao estado de infeção das populações, a segunda parte da tese aplicou diferentes propostas sero-epidemiológicas para estudar a intensidade de transmissão das diferentes vilas estudadas. Para tal, diferentes modelos catalíticos reversíveis (reverse catalytic models, RCMs) foram propostos. Estes modelos baseiam-se na ideia de que indivíduos transitam entre dois estados serológicos (seronegativo e seropositivo), transitando de um para outro a diferentes taxas de transição, a taxa de seroconversão (seroconversion rate, SCR) e a taxa de serorreversão (seroreversion rate, SRR). A SCR representa a taxa média anual a que indivíduos de uma determinada idade (em anos) passam de seronegativos para seropositivos, após uma infeção. Já a SRR representa a taxa média anual a que indivíduos seropositivos regressam a um estado seronegativo devido ao decaimento gradual dos anticorpos. Quatro RCMs foram aplicados aos dados serológicos. Um primeiro modelo M0 assumiu as taxas SCR e SRR como constantes ao longo de todas as idades. Dois modelos consideraram SRR dependente da idade, M1;1 e M1;2. Os dois modelos assumiram a SCR de cada vila como constante ao longo da sequência de idades e a ocorrência de uma redução de SRR dada uma idade estimada. O modelo M1;2 representava uma versão mais restrita, considerando que após a idade de redução, a SRR era igual a zero. Por fim, o RCM M2 proposto considerava a ocorrência de algum efeito externo (e.g.: campanhas de intervenção e prevenção de malária nos locais estudados) que tenha ocorrido nas últimas décadas, influenciando a intensidade de transmissão. Este modelo assumiu a SRR estimada como constante ao longo dos anos, com uma variação na SCR, acontecendo um número estimado de anos antes da recolha das amostras. Os resultados deste estudo mostraram que qualquer um dos modelos tem o potencial de descrever a intensidade de transmissão, bem como a seroprevalência das várias vilas estudadas. A análise dos resultados dos diferentes modelos mostrou que as propostas tidas como mais próximas da realidade (modelos M1;2 e M0 ) foram rejeitadas, na sua maioria, quando comparadas com o modelo de taxas constantes, M0 (testes de razão de verosimilhanças, valores-p > 0:05). O modelo M1;2, com SRR dependente da idade, foi apenas significativo numa minoria de vilas a altitudes intermédias (altitudes entre os 600 e os 1200 metros). A não rejeição da hipótese nula, aquando da comparação com o modelo M2, demonstrou poucos episódios significativos onde a alteração de intensidade de transmissão foi observável. Este modelo foi apenas significativo em vilas com maiores taxas de transmissão estimadas, a altitudes baixas e intermédias. Os RCM ainda que sejam modelos específicos para populações infinitas produziram estimativas paramétricas aceitáveis. Uma análise de correlação entre M0 e M1;2 demonstrou que o modelo estatisticamente preferido, tendencialmente subestimou as estimativas de SCR. Esta taxa, um proxy da intensidade de transmissão, é geralmente a medida de interesse nas análises sero-epidemiológicas. Situações de baixa intensidade de transmissão, que requerem uma maior precisão das estimativas, devem ter em conta estes resultados dados por M0. O melhoramento dos modelos M1;1 e M1;2 poderá trazer novos resultados sobre a importância da SRR na estimativa o mais precisa das intensidades de transmissão. Já o modelo M2 continuará a servir como uma ferramenta para controlo e evolução do estado serológico das populações intervencionadas. Os dois modelos que consideram o efeito ao longo do tempo do sistema imunitário em regiões de malária endémica, M1;1 e M1;2, foram desenvolvidos paralelamente a esta tese, tendo sido propostos num artigo científico presentemente em avaliação.To this day, malaria continues to be a worldwide cause of death and disease. With the recent decades bringing insightful research studies, campaigns for control and elimination became more efficient, gradually reducing the Plasmodium falciparum parasitic malaria across sub-Saharan African countries. Such actions have resulted in regions of pre-elimination going into elimination stages, where detectable symptomatic infections are almost vestigial. These scenarios may impose a new challenge, as the more usual methodologies do not consider apparent invisible individuals when estimating malaria transmission intensity and prevalence of infection. As a proposed alternative to this question, sero-epidemiology can be used to more accurately perform such inferences. The objective of this thesis is then to estimate and characterise the P. falciparum transmission intensity from a sample of 5058 individuals structured by age groups, from across 21 villages in the Northeast Tanzania, with different prevalence levels. First, the principal transmission determinants inuencing the infection heterogeneity were identified. Using the generalised linear models (GLMs) the study revealed the importance of some demographical risk factors when assessing the presence/absence of infection. Determinants such as the age group of the individuals, the altitude of a village { a known proxy of transmission intensity {, or the transect in which the villages were encompassed, were some of the more impactful demographical transmission determinants assessed. The detected antimalarial antibodies for the specific antigens MSP1, MSP2, and AMA1, used throughout this thesis, were also included in the GLMs and showed the importance these exposure determinants have as reasonable indicators of malaria infection. The inference then led to the use of different reverse catalytic models (RCMs), applied solely to the serological data sets of the three antigens collected. The RCMs assume that individuals transit between two possible serological states (seronegative and seropositive) at distinct rates: seroconversion rate (SCR) and seroreversion rate (SRR). The SCR is the annual average rate by which the individuals of a certain age change from seronegative to seropositive, upon malaria infection. And the SRR is the annual average rate by which seropositive individuals of a certain age return to the seronegative state due to antibody decay. Focusing on different biological and epidemiological proposals { that might present an effect on the annual transitional rates between seronegative and seropositive individuals due to parasite exposure { four RCMs were tested. Model M0 assumed the seroconversion rate (SCR) and the seroreversion rate (SRR) as constant transition values across all ages. Models M1;1 and M1;2 were built to adjust for the biological effect of gradually developing immunity over time, in a scenario of endemic malaria transmission. Both models assumed SCR as constant over time, with SRR being reduced to a second rate given an estimated cutoff. Model M1;2, a more restrictive version, assumed that the reduced SRR would be equal to zero, with no seropositive individuals transiting into a seronegative state after the age cutoff. Finally, model M2 proposed the epidemiological effect that some event (e.g.: possible campaigns or interventions to prevent malaria) might have had on transmission intensity. This model assumed SRR as constant rate across all ages, with a change in SCR happening under an estimated cutoff sometime before the sampling. The results showed that, depending on the antigen, the models could be used to describe the transmission intensity and seroprevalence of the assessed villages. However, the traditional RCM M0 (transitional rates constant over time) was more often preferred when compared to the age dependent M1;2 (likelihood ratio test, p-values > 0:05). The age-dependent SRR model was only significant when applied to some villages at intermediate altitudes (600 meters to 1200 meters high). The traditional model was also chosen in favour of the model admitting a past change in transmission intensity, M2, with the epidemiological model only identifying a change in few villages placed at low and intermediate altitudes. Despite the limited information to estimate some of the models' parameters, further analyses demonstrated that the statistically and overall more parsimonious model M0 produced underestimations in its transitional rates, when compared to the more realistic model M1;2. This underestimation could have a negative impact when estimating malaria transmission intensity in low transmission scenarios. Sided with the newly formulated strategies to advance sites in stages of malaria elimination and pre elimination into eradication, serology serves as tool to more efficaciously measure transmission intensity. The improvement and application of the RCMs M1;1 and M1;2 could bring more information to the importance of a more precise estimation of the SRR

    Similar works