3 research outputs found

    Practical selection of SVM parameters and noise estimation for SVM regression”, Neural

    Get PDF
    Abstract We investigate practical selection of hyper-parameters for support vector machines (SVM) regression (that is, 1-insensitive zone and regularization parameter C). The proposed methodology advocates analytic parameter selection directly from the training data, rather than re-sampling approaches commonly used in SVM applications. In particular, we describe a new analytical prescription for setting the value of insensitive zone 1; as a function of training sample size. Good generalization performance of the proposed parameter selection is demonstrated empirically using several low-and high-dimensional regression problems. Further, we point out the importance of Vapnik's 1-insensitive loss for regression problems with finite samples. To this end, we compare generalization performance of SVM regression (using proposed selection of 1-values) with regression using 'least-modulus' loss Ă°1 ÂĽ 0Ăž and standard squared loss. These comparisons indicate superior generalization performance of SVM regression under sparse sample settings, for various types of additive noise.

    Entwicklung Metabolom-basierter Methoden fĂĽr die Identifizierung von Biomarkern

    Get PDF
    In the first part of the thesis a metabolomics approach was undertaken for the identification of biomarkers in human urine indicating a urinary tract infection (UTI). For this purpose, the urine of 44 patients suffering from UTI and 48 healthy persons was analyzed for their metabolite composition using LC-MS analysis. For the accurate identification of metabolites indicative of UTI the statistical approach for LC-MS data interpretation had to be optimized. For this purpose, a prognostic model was developed and the relation between the metabolite level and the infection status was calculated by multiple linear regression analysis with the least squares method separately for each metabolite. Utilization of this novel data interpretation approach led to identification of thieno-(2,3-c) pyridine and heneicosanoyl-glycero-3-phospho-(1’-glycerol) as metabolites safely indicating UTIs. In a second project, software used for putative biomarker annotation, four in silico fragmentation tools (MetFragCL, CFM-ID, MAGMa+ and MS-Finder) and their performance was addressed on a Critical Assessment of Small Molecule Identification (CASMI) 2016 dataset. Pure in silico algorithms only identified 17% of the compounds correctly. The voting/consensus model developed for this purpose slightly improved the results to 22%. Once the database and MS/MS search was added the algorithm was able to correctly identify 87-93% of the unknown compounds as the first hit, showing the importance of ranking and database queries. These results confirmed that voting/consensus models can be used for real-world applications. Our software will also allow for automatic testing and performance tuning without user interaction. In a third project, metabolomic profiling was performed on plasma samples obtained in a previously published parallel randomized controlled study by Kox et.al., 2013. Metabolic signatures revealed altered lipid, protein and central metabolism in both intervention and control group as a response to endotoximia and breathing techniques. Overall, obtained results underscore the increasing power and relevance of metabolomics in biomedical research and diagnosis.Im ersten Teil der Arbeit wurde eine Metabolom Analyse zur Identifikation von Biomarkern in humanem Urin, welche auf eine Harnwegsinfektion (HWI) hinweisen, durchgeführt. Zu diesem Zweck wurden Urinproben von 44 an HWI leidenden und 48 gesunde Personen auf die Komposition ihrer Metabolite mittels LC-MS analysiert. Um eine korrekte Identifikation der auf HWI hindeutenden Metabolite zu gewährleisten musste die statistische Herangehensweise der LC-MS Dateninterpretation optimiert werden. Zu diesem Zweck wurde ein prognostisches Model entwickelt, bei welchem die Beziehung zwischen der Metabolit Konzentration und dem Stand der Infektion mit Hilfe linearer Regressionsanalyse mit der Kleinstquadratmethode individuell für jedes Metabolit ermittelt werden konnte. Die Anwendung dieses neu entwickelten Datenanalysesystems führte zur Identifikation von Thieno-(2,3-c) Pyridin und Heneicosanoyl-glycero-3-phosphp-(1´-glycerol) als Metabolite für die sichere Identifikation einer HWI. In einem zweiten Projekt wurde eine Software zur Annotation potentieller Biomarker und vier in silico Fragmentierungstools (MetFragCL, CFM-ID, MAGMa+ und MS-Finder) nach ihrer Performanz durch die Anwendung auf ein Critical Assessment of Small Molecule Identification (CASMI) 2016 Datenset beurteilt. Die in silico Algorithmen alleine haben 17 % der Komponenten korrekt identifiziert. Ein entwickeltes "voting/consensus" Model erzielte eine Verbesserung der Ergebnisse auf 22%. Die zusätzliche Integration einer Datenbank und MS/MS Suche verbesserte die korrekte Identifikation unbekannter Komponenten mittels der Algorithmen auf 87-93% für den ersten Treffer. Zusammenfassend wurde gezeigt, dass das "voting/consensus" Model für reale Anwendungen genutzt werden kann. Zudem erlaubt unsere entwickelte Software sowohl automatisierte Tests als auch eine automatisierte Performanzverbesserung. In einem dritten Projekt wurde ein metabolisches Profiling an Plasmaproben durchgeführt, welche im Rahmen einer parallel randomisierten kontrollierten Studie von Kox et al. 2013 gesammelt wurden. Diese Analyse des Metaboloms zeigte eine veränderte Komposition der Lipide, Proteine und Metabolite des zentralen Stoffwechsels sowohl in der Interventions- als auch in der Kontrollgruppe als Reaktion auf Endotoxämie und Atemmethoden. Zusammenfassend verdeutlichen die gewonnenen Erkenntnisse die zunehmende Bedeutung und Relevanz von Metabolom Analysen in der biomedizinischen Forschung und Diagnose
    corecore