19 research outputs found

    Don't Fall for Tuning Parameters: Tuning-Free Variable Selection in High Dimensions With the TREX

    Full text link
    Lasso is a seminal contribution to high-dimensional statistics, but it hinges on a tuning parameter that is difficult to calibrate in practice. A partial remedy for this problem is Square-Root Lasso, because it inherently calibrates to the noise variance. However, Square-Root Lasso still requires the calibration of a tuning parameter to all other aspects of the model. In this study, we introduce TREX, an alternative to Lasso with an inherent calibration to all aspects of the model. This adaptation to the entire model renders TREX an estimator that does not require any calibration of tuning parameters. We show that TREX can outperform cross-validated Lasso in terms of variable selection and computational efficiency. We also introduce a bootstrapped version of TREX that can further improve variable selection. We illustrate the promising performance of TREX both on synthetic data and on a recent high-dimensional biological data set that considers riboflavin production in B. subtilis

    Feasibility of [F-18]fluoropivalate hybrid PET/MRI for imaging lower and higher grade glioma: a prospective first-in-patient pilot study

    Get PDF
    Purpose: MRI and PET are used in neuro-oncology for the detection and characterisation of lesions for malignancy to target surgical biopsy and to plan surgical resections or stereotactic radiosurgery. The critical role of short-chain fatty acids (SCFAs) in brain tumour biology has come to the forefront. The non-metabolised SCFA radiotracer, [18F]fluoropivalate (FPIA), shows low background signal in most tissues except eliminating organs and has appropriate human dosimetry. Tumour uptake of the radiotracer is, however, unknown. We investigated the uptake characteristics of FPIA in this pilot PET/MRI study. Methods: Ten adult glioma subjects were identified based on radiological features using standard-of-care MRI prior to any surgical intervention, with subsequent histopathological confirmation of glioma subtype and grade (lower-grade – LGG – and higher-grade – HGG – patients). FPIA was injected as an intravenous bolus injection (range 342–368 MBq), and dynamic PET and MRI data were acquired simultaneously over 66 min. Results: All patients tolerated the PET/MRI protocol. Three patients were reclassified following resection and histology. Tumour maximum standardised uptake value (SUVmax,60) increased in the order LGG (WHO grade 2) < HGG (WHO grade 3) < HGG (WHO grade 4). The net irreversible solute transfer, Ki, and influx rate constant, K1, were significantly higher in HGG (p < 0.05). Of the MRI variables studied, DCE-MRI-derived extravascular-and-extracellular volume fraction (ve) was high in tumours of WHO grade 4 compared with other grades (p < 0.05). SLC25A20 protein expression was higher in HGG compared with LGG. Conclusion: Tumoural FPIA PET uptake is higher in HGG compared to LGG. This study supports further investigation of FPIA PET/MRI for brain tumour imaging in a larger patient population. Clinical trial registration: Clinicaltrials.gov, NCT04097535

    Complex biomarker discovery in neuroimaging data: Finding a needle in a haystack

    Get PDF
    AbstractNeuropsychiatric disorders such as schizophrenia, bipolar disorder and Alzheimer's disease are major public health problems. However, despite decades of research, we currently have no validated prognostic or diagnostic tests that can be applied at an individual patient level. Many neuropsychiatric diseases are due to a combination of alterations that occur in a human brain rather than the result of localized lesions. While there is hope that newer imaging technologies such as functional and anatomic connectivity MRI or molecular imaging may offer breakthroughs, the single biomarkers that are discovered using these datasets are limited by their inability to capture the heterogeneity and complexity of most multifactorial brain disorders. Recently, complex biomarkers have been explored to address this limitation using neuroimaging data. In this manuscript we consider the nature of complex biomarkers being investigated in the recent literature and present techniques to find such biomarkers that have been developed in related areas of data mining, statistics, machine learning and bioinformatics

    Drivers and inhibitors of entrepreneurship in Europe's Outermost Regions: Implications for entrepreneurship education

    Get PDF
    Governments of peripheral regions often seek to encourage entrepreneurship as a means of bolstering employment, typically charging higher education institutions with the task of delivering this mission through their entrepreneurship education programmes. This study investigates the drivers and inhibitors of entrepreneurial intentions among young people in Madeira, a semi-autonomous outlying region of Portugal. Data were collected from 352 final-year undergraduate students on management, economics and tourism courses. The adaptive Least Absolute Shrinkage and Selection Operator method was then applied to select the best predictors from among a large pool of potential covariates. The results found that students with less access to start-up finance and a greater fear of failure tended to have the least entrepreneurial intentions. Children of entrepreneur had significantly stronger intentions to become entrepreneurs themselves. Entrepreneurial intention also increased significantly with the student’s age. The paper concludes that entrepreneurial education providers in island economies firstly need to change the narrative that young people in peripheral regions receive about becoming entrepreneurs, particularly with regard to the greater vulnerability to business risks (the ‘island penalty factor’), and secondly should provide practical support to students who do not have access to family business networks (a possible ‘island bonus factor’)

    Evaluation of machine learning algorithms for treatment outcome prediction in patients with epilepsy based on structural connectome data

    Get PDF
    The objective of this study is to evaluate machine learning algorithms aimed at predicting surgical treatment outcomes in groups of patients with temporal lobe epilepsy (TLE) using only the structural brain connectome. Specifically, the brain connectome is reconstructed using white matter fiber tracts from presurgical diffusion tensor imaging. To achieve our objective, a two-stage connectome-based prediction framework is developed that gradually selects a small number of abnormal network connections that contribute to the surgical treatment outcome, and in each stage a linear kernel operation is used to further improve the accuracy of the learned classifier. Using a 10-fold cross validation strategy, the first stage in the connectome-based framework is able to separate patients with TLE from normal controls with 80% accuracy, and second stage in the connectome-based framework is able to correctly predict the surgical treatment outcome of patients with TLE with 70% accuracy. Compared to existing state-of-the-art methods that use VBM data, the proposed two-stage connectome-based prediction framework is a suitable alternative with comparable prediction performance. Our results additionally show that machine learning algorithms that exclusively use structural connectome data can predict treatment outcomes in epilepsy with similar accuracy compared with "expert-based" clinical decision. In summary, using the unprecedented information provided in the brain connectome, machine learning algorithms may uncover pathological changes in brain network organization and improve outcome forecasting in the context of epilepsy

    Joint variable and rank selection for parsimonious estimation of high-dimensional matrices

    Full text link
    We propose dimension reduction methods for sparse, high-dimensional multivariate response regression models. Both the number of responses and that of the predictors may exceed the sample size. Sometimes viewed as complementary, predictor selection and rank reduction are the most popular strategies for obtaining lower-dimensional approximations of the parameter matrix in such models. We show in this article that important gains in prediction accuracy can be obtained by considering them jointly. We motivate a new class of sparse multivariate regression models, in which the coefficient matrix has low rank and zero rows or can be well approximated by such a matrix. Next, we introduce estimators that are based on penalized least squares, with novel penalties that impose simultaneous row and rank restrictions on the coefficient matrix. We prove that these estimators indeed adapt to the unknown matrix sparsity and have fast rates of convergence. We support our theoretical results with an extensive simulation study and two data analyses.Comment: Published in at http://dx.doi.org/10.1214/12-AOS1039 the Annals of Statistics (http://www.imstat.org/aos/) by the Institute of Mathematical Statistics (http://www.imstat.org

    Evaluation of machine learning algorithms for treatment outcome prediction in patients with epilepsy based on structural connectome data

    Get PDF
    The objective of this study is to evaluate machine learning algorithms aimed at predicting surgical treatment outcomes in groups of patients with temporal lobe epilepsy (TLE) using only the structural brain connectome. Specifically, the brain connectome is reconstructed using white matter fiber tracts from presurgical diffusion tensor imaging. To achieve our objective, a two-stage connectome-based prediction framework is developed that gradually selects a small number of abnormal network connections that contribute to the surgical treatment outcome, and in each stage a linear kernel operation is used to further improve the accuracy of the learned classifier. Using a 10-fold cross validation strategy, the first stage in the connectome-based framework is able to separate patients with TLE from normal controls with 80% accuracy, and second stage in the connectome-based framework is able to correctly predict the surgical treatment outcome of patients with TLE with 70% accuracy. Compared to existing state-of-the-art methods that use VBM data, the proposed two-stage connectome-based prediction framework is a suitable alternative with comparable prediction performance. Our results additionally show that machine learning algorithms that exclusively use structural connectome data can predict treatment outcomes in epilepsy with similar accuracy compared with “expert-based” clinical decision. In summary, using the unprecedented information provided in the brain connectome, machine learning algorithms may uncover pathological changes in brain network organization and improve outcome forecasting in the context of epilepsy

    Study of multicomponent T2* relaxation in brain tumours

    Get PDF
    Tese de mestrado integrado em Engenharia Biomédica e Biofísica (Sinais e Imagens Médicas), Universidade de Lisboa, Faculdade de Ciências, 2020Nas últimas décadas, o desenvolvimento e aperfeiçoamento de modalidades de imagem tem revolucionado o tratamento de pacientes com as mais variadas patologias. Inúmeros estudos científicos têm surgido no seguimento destas técnicas com o objetivo de ajudar no diagnóstico, no prognóstico e na monitorização das doenças. É o caso do cancro que segundo a Organização Mundial de Saúde (acrónimo em inglês: WHO), é a segunda maior causa de morte a nível mundial. Tumores cerebrais resultam do crescimento descontrolado de células, processo que pode ter origem direta no cérebro ou resultar da invasão de células de outros tecidos do corpo, também conhecido como metastização. Podem ser classificados como benignos ou malignos consoante os critérios de agressividade definidos pela WHO numa escala de I-IV. A alta subjetividade entre médicos na classificação dos tumores cerebrais levou a uma recente reformulação dos critérios de diferenciação que agora engloba tanto parâmetros fenotípicos como genotípicos. A sobrevivência dos pacientes está altamente dependente do tipo de tumor, do estágio em que se encontra aquando do diagnóstico e da avaliação médica que deverá definir o tratamento a ser aplicado. Os exames médicos que costumam ser realizados incluem imagem por ressonância magnética (acrónimo em inglês: MRI) e tomografia por emissão de positrões (acrónimo em inglês: PET). No Instituto de Neurociência e Medicina – 4 (acrónimo em inglês: INM-4) do centro de investigação em Jülich, a existência de um scanner híbrido permite a aquisição simultânea de imagens de PET e MRI. Esta tese não engloba o estudo de PET mas a informação metabólica proveniente das imagens simultaneamente adquiridas é usada para gerar máscaras tumorais, utilizadas ao longo deste trabalho. A MRI é uma modalidade não invasiva que tem por base a aplicação de um campo magnético externo e a emissão de ondas de radiofrequência que variam no tempo. Tem as vantagens de não utilizar radiação ionizante e providenciar excelentes contrastes entre os diferentes tipos de tecido. O contraste da imagem depende do peso relativo dado aos parâmetros específicos aquando da aquisição. A possibilidade de adaptar o contraste consoante o que se pretende visualizar ou estudar, faz desta uma modalidade de imagem essencial tanto na clínica médica como em investigação científica. A utilização de imagens ponderadas, também conhecido como MRI qualitativo, apresenta em si algumas limitações. A decisão do tratamento a aplicar é muitas vezes subjetiva, e pode diferir entre diferentes grupos de médicos. Por outro lado, o desenvolvimento de sequências que permitem a aquisição de séries de imagens introduziu a estimação de parâmetros específicos e independentes do scanner usados para avaliar quantitativamente os diferentes tecidos, o que é designado como MRI quantitativo (acrónimo em inglês: qMRI). Através da modelação das curvas de relaxação, qMRI pode ajudar na deteção de pequenas patologias no tecido cerebral, que podem não ser possíveis de observar nas imagens ponderadas usadas na clínica médica. Apesar das suas grandes vantagens, qMRI é maioritariamente uma área de investigação, e a sua inclusão clínica está ainda limitada pelo prolongamento do tempo de aquisição, necessário para adquirir as imagens extra, e pela necessidade de métodos de estimação com extrema exatidão e precisão. Para este estudo, 33 pacientes (entre os 27 e os 76 anos de idade) com suspeita de tumor cerebral ou recorrência de tumores previamente tratados, foram submetidos à aquisição simultânea de MRI e PET. O estudo de modelos de relaxação exponencial foi realizado através de imagens ponderadas em T2*, adquiridas com a uma sequência multi-eco gradiente-eco (acrónimo em inglês: mGRE). T2* permite caracterizar não homogeneidades de campo magnético associadas a concentrações locais de moléculas paramagnéticas, tais como o ferro. Contudo, existem outros fatores que contribuem para o decaimento exponencial mais rápido, nomeadamente contribuições de campos magnéticos externos não homogéneos. Uma vez que estas contribuições não contêm nenhuma informação sobre a fisiologia ou patofisiologia do tecido, torna-se necessário corrigir distorções associadas a campos magnéticos não homogéneos antes de qualquer método de processamento. Neste trabalho, é estudada a influência de dois métodos de correção de campos magnéticos não homogéneos, nomeadamente sinc correction e voxel spread function (VSF). O método de sinc correction considera o desfasamento causado pelo intervalo entre fatias e estima uma modulação sinc do sinal, associada às distorções macroscópicas do campo magnético, para que o sinal seja posteriormente reconstruído. O segundo método, VSF, é um algoritmo matemático que corrige os efeitos do campo magnético não homogéneo nas direções de codificação da fase e da frequência. Para estudar a influência dos efeitos de redução do ruído, dois métodos foram aplicados, nomeadamente filtragem Gaussiana e redução de ruído baseada na análise de componentes principais (acrónimo em inglês: PCA). A típica análise de dados em qMRI assume a existência de um único compartimento por voxel, que muitas vezes é demasiado simplista e pode levar a estimativas tendenciosas. Na realidade, um voxel pode ser constituído por múltiplos compartimentos, cada qual com o seu próprio tempo de relaxação T2*. Por isso, neste trabalho, comparam-se os resultados quantitativos de um modelo que descreve um único compartimento, com um modelo que descreve múltiplos compartimentos. Para tal, o algoritmo dos mínimos quadrados não negativos (acrónimo em inglês: NNLS) é utilizado, com a vantagem de não necessitar de um conhecimento prévio do número de compartimentos (ou seja, do número de exponenciais T2*). Contudo, a relaxometria multi-exponencial é um problema mal condicionado onde várias soluções são possíveis, e, por isso, extremamente sensível ao ruído. Para ultrapassar estas dificuldades e estabilizar as soluções é utilizada uma versão regularizada do algoritmo NNLS, que adicionalmente requer uma restrição da regularização a usar. Para encontrar o melhor intervalo de parâmetros de regularização foi implementado o método da curva L. Com este método, foram também estudadas a influência de escalas logarítmicas e lineares no intervalo de soluções de T2* e no intervalo de regularização. Em relação aos valores de T2*, foram encontradas diferenças significativas nas regiões tumorais entre a média de T2* obtida com uma abordagem mono-exponencial (~58 ms) e a média geométrica de T2* obtida com uma abordagem multi-exponencial (~74 ms), para todos os pacientes. É também demonstrada alta heterogeneidade nos valores de T2*, não só entre pacientes, mas também dentro do mesmo tumor, o que levou a um estudo individual de cada paciente. São relatadas diferenças significativas entre regiões de tecido tumoral ativo e regiões de controlo localizadas no lado contralateral às regiões tumorais (aparentemente saudáveis). De um modo geral, os métodos propostos para remoção do ruído demonstraram reduções substanciais de ruído nas imagens, enquanto que ambos os métodos de correção das não homogeneidades de campo magnético não revelaram ser robustos, e no caso particular da VSF, sendo que bons resultados foram publicados em experimentos 3D, o problema pode estar associado a uma má otimização para o caso de experimentos 2D. O conteúdo de água foi considerado altamente dependente do método de correção usado. Verificou-se que o conteúdo de água em regiões tumorais é próximo ao conteúdo de água encontrado em regiões de substância cinzenta, e maior do que o encontrado em regiões de edema. Ainda, o conteúdo de água na substância branca apresentou valores inferiores que as demais regiões. Finalmente, foi estudada a relação entre o conteúdo de água e os valores de T2*, apesar de nenhuma correlação ter sido evidenciada nas diferentes regiões de interesse. Com este trabalho concluiu-se que a interpretação quantitativa do relaxação de T2* em tumores cerebrais é uma tarefa complicada que exige métodos de elevada exatidão. No entanto, devido à heterogeneidade encontrada não só entre os diferentes tumores mas também no mesmo paciente, pode ser uma ferramenta não invasiva com potencial para monitorizar, avaliar e classificar tumores.Quantitative magnetic resonance imaging (qMRI) allows for the estimation of scanner-independent, tissue-specific parameters. By modelling the relaxation curves, qMRI can help inform on small pathological changes in the brain tissue, that might not be visible in the weighed images used typically in the clinic. However, the use of this imaging technique is often limited in the clinic by the prolonged measurement times and demand for very accurate estimation methods. To improve accuracy, noise reduction and field-inhomogeneity correction methods are of paramount importance. Additionally, the typical analysis of qMRI data assumes a single compartment per voxel, which is often oversimplified and can lead to biased estimations. This thesis addresses the effects of denoising, field-inhomogeneity correction and single compartment vs multiple compartment analysis in the estimation of the qMRI parameters water content and T2*. We explore these effects in the WM, GM, CSF, tumour and oedema regions of a cohort of 33 brain tumour patients. The images were acquired using a multiple echo gradient echo sequence in a hybrid MR-PET system, which allows for the identification of active tumour tissue. To survey the effects of noise reduction in the estimation of the aforementioned qMRI parameters, we apply two denoising methods, namely Gaussian filtering and principal component analysis (PCA). Furthermore, the effects of two field-inhomogeneity correction methods, in particular sinc correction and voxel spread function (VSF), are also investigated. Finally, we compare mono-exponential models to multi-exponential models and the corresponding T2* values of the different regions. In the case of multi-exponential model, no a priori assumptions about the number of exponential components are made. Regarding T2*, high differences are found in the tumour region between the obtained mean T2* with a mono-exponential approach (~58 ms) and the obtained geometric mean T2* with a multiexponential approach (~74 ms), across the different patients. High heterogeneity in the T2* values is found for different tumour types, as well as inside of the active tumour tissue within the same patient, which lead to an individual study of each patient. Significant differences are found between the T2* distributions within distinct regions of the active tumour tissue and the corresponding contralateral regions. Water content was found to be highly dependent on the used correction method. Overall, water content in the tumour is found to be close to that of GM, and higher than that of oedema. Water content in WM is lower than that of the other tissue classes. Finally, water content and geometric mean T2* values do not display significant correlations in any of the tissue classes investigated, thus offering a complementary view of the properties of tissue. We conclude that a quantitative interpretation of T2* relaxation in brain tumours is a very challenging task, but due to the heterogeneity found not only across the cohort but also within the active tumour tissue for each patient, it might be a potential non-invasive tool in monitoring, evaluation and grading of tumours
    corecore