    Prediction of disulfide bonding pattern based on a support vector machine and multiple trajectory search

    To determine protein folding, accurately predicting the connectivity pattern of disulfide bridges can significantly reduce the search space, helping to solving the protein-folding problem. Therefore, developing an effective means of predicting disulfide connectivity patterns facilitates the estimation of the three-dimensional structure of a protein and its function. To our knowledge, with the prior knowledge of the bonding states of cysteines, the highest accuracy rate in the literature for predicting the overall disulfide connectivity pattern (Q(p)) is 74.4% for dataset SP39. Dataset SP39 is conventionally adopted to predict disulfide connectivity. This work presents a novel classifier based on the support vector machine (SVM) that incorporates features of position-specific scoring matrix (PSSM), normalized bond lengths, the predicted secondary structure of protein, and indices for the physicochemical properties of amino acid. The support vector machine is trained to derive the connectivity probabilities of cysteine pairs. Additionally, an evolutionary algorithm called the multiple trajectory search (MTS) is integrated with the SVM model to tune the SVM parameters and window sizes for the above features. Moreover, the disulfide connectivity pattern is identified by using the maximum weight perfect matching algorithm. Experimental results indicate that the accuracy rate for predicting the overall disulfide connectivity pattern (Q(p)) reaches 79.8% when tested using the same dataset SP39. (C) 2012 Elsevier Inc. All rights reserved

    Application of Wavelets-based SVM Classification for Automated Fault Diagnosis and Prognosis of Mechanical Systems

    Anwendung der Wavelet-basierte SVM Klassifizierung für die automatisierte Fehlerdiagnose und -prognose mechanischer Systeme In dieser Arbeit werden Techniken der Mustererkennung auf verschiedene Problemstellungen der Fehlerdiagnose und -prognose angewendet. Die untersuchten Anwendungen stellen reale industrielle Anwendungen dar, bei denen verschiedene Messeigenschaften (wie zyklische, impulsive, und periodische Signale), verschiedene Charakteristik der Erkennungsobjektiven (wie kumulativ und einmalige Ereignisse), verschiedene Betriebsbedingungen und -parameter der Maschine, und verschiedene Fehler und Erkennungssystemanforderungen (wie Verschleiß, Riss, und Objekterkennung; Systemzustand und Restlebensdauer) die modulare Mustererkennungsverfahren und -techniken erfordern. Verschiedene Ansätze werden untersucht und angewendet, wie Support Vector Machine (SVM), Continuous Wavelet-Transform (CWT),Wavelet Packet Transform (WPT) und Diskrete Wavelet-Transform (DWT), und viele Konzepte und Lösungen werden vorgeschlagen und überprüft, um ein zuverlässiges Zustandsüberwachungssystem zu erreichen, dass die Instandhaltungsplanung der Maschine unterstützt und die Produktionsqualität und Produktionskosten verbessert. In der ersten untersuchten Anwendung in dieser Arbeit wird ein Ansatz für die Entwicklung eines Fehlerdiagnose- und -prognosesystems vorgestellt. Das System wird als Vorwarnmodul verwendet, um die Notwendigkeit für das Ersetzen von Verschleißteilen von Produktionsmaschinen zu erkennen und die Restlebensdauer des überwachten Teils zu bewerten. In der zweiten untersuchten Anwendung wird ein Produktionsverfahren überwacht. Ziel ist die Erkennung eines Objektes mit einer möglichst geringen Fehlalarmrate. Die Signale beinhalten nichtstationäre, impulsartige bzw. einmalige Ereignisse. Ein weiteres Merkmal der Sensorcluster-Signale ist die nicht gleichzeitige Erzeugung von Ereignissen, die die Verwendung von geeigneten Entscheidungsfusionstechniken erfordert. In der letzten untersuchten Anwendung, werden modell- und signalbasierte Verfahren für die Risserkennung und Prognose in rotierenden Maschinen untersucht, um eine Vorwarnung für Rotor-Risse zu erreichen für Online- Überwachung in Turbomaschinen. Die angetroffenen Signale sind periodische Schwingungssignale mit kumulativen Auswirkungen der Fehlerereignisse. Offene Fragen stellen sich bei den Themen Zustandsbewertung, Fehlerschweregrad und Restlebensdauer, basierend auf spezifischen Sensordaten mit besonderen anwendungsorientierten Eigenschaften. Diese Arbeit befasst sich mit diesen offenen Fragen, um ein zuverlässiges Zustandsüberwachungssystem zu erreichen. Es kann festgestellt werden, dass Wavelets und SVM sehr nützliche Werkzeuge für die Merkmalsextraktion und Klassifikation im Bereich der Zustandsüberwachung sind. Der Merkmalsraum von SVM ist nützlich für die Bewertung der verbleibenden Lebensdauer. Allerdings zeigt sich ebenfalls, dass angesichts der Herausforderungen anwendungsorientierte Lösungen gefunden werden müssen.In this thesis, the application of pattern recognition techniques is considered for different kinds of fault diagnosis and prognosis problems and applications. The investigated applications represent real industrial applications, in which different measurement characteristics (such as cyclic, impulsive, and periodic signals), different recognition objective characteristics (such as accumulative and one-time events), different operational conditions and parameters of the machine, and different faults and detection system requirements (such as wear, crack, and object detection; System state and remaining life time) are challenging the existence of modular pattern recognition procedures and techniques. Different approaches are investigated and applied such as Support Vector Machine (SVM), Discrete Wavelet Transform (DWT), Wavelet Packet Transform (WPT), and Continuous Wavelet Transform (CWT), and many concepts and solutions are proposed and verified, in order to achieve a reliable condition monitoring system, which supports the maintenance planning of the machine and adds value to the production quality and cost. In the first investigated application in this thesis, an approach for developing a fault diagnosis and prognosis system is presented. The system is used as a prewarning module to detect the necessity for replacing wear parts of production machines and to evaluate the remaining life time of the supervised part. The sensor signals encountered for processing are nondeterministic with cyclic nature related to the operation cycle of the machine. In the second investigated application, the goal is to monitor a production process for online detection of a target object with the lowest possible false alarm rate. The signals encountered in the system of this work are characterized with nonstationary impulsive one-time events representing the goal object. Another characteristic of the sensor cluster signals is the partly simultaneous stimulation of events which requires the use of suitable decision fusion techniques. In the last investigated application, two main approaches used for crack detection and prediction in rotating machinery; model based and signal based, are investigated, in order to achieve a prewarning technique for rotor cracks to be applied for online monitoring in turbo-machinery. The signals encountered are periodic vibration signals with accumulative impact of the fault incident. Open questions arise in the issues of state evaluation, severity estimation, and remaining life time prediction, based on specific sensor data with particular applicationoriented characteristics. This work deals with these open questions, in order to achieve a reliable condition monitoring system. As a general conclusion of the work, it can be stated that Wavelets and SVM are reliable tools for feature extraction and classification in the field of condition monitoring, and the feature space of SVM is useful for remaining life prediction. However; specific application oriented Solutions and tricks are necessary, considering the diversity of fault diagnosis and prognosis problems and difficulties

    Solución rápida y automática de parámetros hipocentrales para eventos sísmicos, mediante el empleo de técnicas de aprendizaje de máquina

    La generación de alertas tempranas para sismos es de gran utilidad, en particular para la ciudad de Bogotá-Colombia, dada su importancia social y económica para el país. Con base en la información de la estación sismológica de El Rosal, la cual es una estación de banda ancha y tres componentes, localizada muy cerca de la ciudad, perteneciente al Servicio Geológico Colombiano (SGC) se desarrolló un modelo de regresión basado en máquinas de vectores de soporte (SVM), con un kernel polinomial normalizado, usando como datos de entrada algunas características de la porción inicial de la onda P empleadas en trabajos anteriores tales como la amplitud máxima, los coeficientes de regresión lineal de los mismos, los parámetros de ajuste logarítmico de la envolvente y los valores propios de la relación de las tres componentes del sismograma. El modelo fue entrenado y evaluado aplicando correlación cruzada, permitiendo llevar a cabo el cálculo de la magnitud y la localización de un evento sísmico con una longitud de señal de tan solo cinco segundos. Con el modelo propuesto se logró la determinación de la magnitud local con una precisión de 0.19 unidades de magnitud, la distancia epicentral con una precisión de alrededor de 11 kilómetros, la profundidad hipocentral con una precisión de aproximadamente 40 kilómetros y el azimut de llegada con una precisión de 45°. Las precisiones obtenidas en magnitud y distancia epicentral son mejores que las encontradas en trabajos anteriores, donde se emplean gran número de eventos para la determinación del modelo y en los demás parámetros hipocentrales son del mismo orden. Este trabajo de investigación realiza un aporte considerable en la generación de alertas tempranas para sismos, no solamente para el país sino para cualquier otro lugar donde se deseen implementar los modelos aquí propuestos y es un excelente punto de partida para investigaciones futuras.Abstract. Earthquake early warning alerts generation is very useful, especially for the city of Bogotá-Colombia, given the social and economic importance of this city for the country. Based on the information from the seismological station “El Rosal”, which is a broadband and three components station, located very near the city that belongs to the Servicio Geológico Colombiano (SGC) a Support Vector Machine Regression (SVMR) model was developed, using a Normalized Polynomial Kernel, using as input some characteristics of the initial portion of the P wave used in earlier works such as the maximum amplitude, the linear regression coefficients of such amplitudes, the logarithmic adjustment parameters of the envelope of the waveform and the eigenvalues of the relationship between the three seismogram components of each band. The model was trained and evaluated by applying a cross-correlation strategy, allowing to calculate the magnitude and location of a seismic event with only five seconds of signal. With the proposed model it was possible to estimate local magnitude with an accuracy of 0.19 units of magnitude, epicentral distance with an accuracy of about 11 km, the hipocentral depth with a precision of approximately 40 km and the arrival back-azimut with a precision of 45°. Accuracies obtained in magnitude and epicentral distance are better that those found in earlier works, where a large number of events were used for model determination, and the other hipocentral parameters precisions obtained here are of the same order. This research work makes a considerable contribution in the generation of seismic early warning alerts, not only for the country but for any other place where proposed models here can be applied and is a very good starting point for future research.Doctorad