1,933 research outputs found
Multi-tier framework for the inferential measurement and data-driven modeling
A framework for the inferential measurement and data-driven modeling has been proposed and assessed in several real-world application domains. The architecture of the framework has been structured in multiple tiers to facilitate extensibility and the integration of new components. Each of the proposed four tiers has been assessed in an uncoupled way to verify their suitability. The first tier, dealing with exploratory data analysis, has been assessed with the characterization of the chemical space related to the biodegradation of organic chemicals. This analysis has established relationships between physicochemical variables and biodegradation rates that have been used for model development. At the preprocessing level, a novel method for feature selection based on dissimilarity measures between Self-Organizing maps (SOM) has been developed and assessed. The proposed method selected more features than others published in literature but leads to models with improved predictive power. Single and multiple data imputation techniques based on the SOM have also been used to recover missing data in a Waste Water Treatment Plant benchmark. A new dynamic method to adjust the centers and widths of in Radial basis Function networks has been proposed to predict water quality. The proposed method outperformed other neural networks. The proposed modeling components have also been assessed in the development of prediction and classification models for biodegradation rates in different media. The results obtained proved the suitability of this approach to develop data-driven models when the complex dynamics of the process prevents the formulation of mechanistic models. The use of rule generation algorithms and Bayesian dependency models has been preliminary screened to provide the framework with interpretation capabilities. Preliminary results obtained from the classification of Modes of Toxic Action (MOA) indicate that this could be a promising approach to use MOAs as proxy indicators of human health effects of chemicals.Finally, the complete framework has been applied to three different modeling scenarios. A virtual sensor system, capable of inferring product quality indices from primary process variables has been developed and assessed. The system was integrated with the control system in a real chemical plant outperforming multi-linear correlation models usually adopted by chemical manufacturers. A model to predict carcinogenicity from molecular structure for a set of aromatic compounds has been developed and tested. Results obtained after the application of the SOM-dissimilarity feature selection method yielded better results than models published in the literature. Finally, the framework has been used to facilitate a new approach for environmental modeling and risk management within geographical information systems (GIS). The SOM has been successfully used to characterize exposure scenarios and to provide estimations of missing data through geographic interpolation. The combination of SOM and Gaussian Mixture models facilitated the formulation of a new probabilistic risk assessment approach.Aquesta tesi proposa i avalua en diverses aplicacions reals, un marc general de treball per al desenvolupament de sistemes de mesurament inferencial i de modelat basats en dades. L'arquitectura d'aquest marc de treball s'organitza en diverses capes que faciliten la seva extensibilitat així com la integració de nous components. Cadascun dels quatre nivells en que s'estructura la proposta de marc de treball ha estat avaluat de forma independent per a verificar la seva funcionalitat. El primer que nivell s'ocupa de l'anàlisi exploratòria de dades ha esta avaluat a partir de la caracterització de l'espai químic corresponent a la biodegradació de certs compostos orgànics. Fruit d'aquest anàlisi s'han establert relacions entre diverses variables físico-químiques que han estat emprades posteriorment per al desenvolupament de models de biodegradació. A nivell del preprocés de les dades s'ha desenvolupat i avaluat una nova metodologia per a la selecció de variables basada en l'ús del Mapes Autoorganitzats (SOM). Tot i que el mètode proposat selecciona, en general, un major nombre de variables que altres mètodes proposats a la literatura, els models resultants mostren una millor capacitat predictiva. S'han avaluat també tot un conjunt de tècniques d'imputació de dades basades en el SOM amb un conjunt de dades estàndard corresponent als paràmetres d'operació d'una planta de tractament d'aigües residuals. Es proposa i avalua en un problema de predicció de qualitat en aigua un nou model dinàmic per a ajustar el centre i la dispersió en xarxes de funcions de base radial. El mètode proposat millora els resultats obtinguts amb altres arquitectures neuronals. Els components de modelat proposat s'han aplicat també al desenvolupament de models predictius i de classificació de les velocitats de biodegradació de compostos orgànics en diferents medis. Els resultats obtinguts demostren la viabilitat d'aquesta aproximació per a desenvolupar models basats en dades en aquells casos en els que la complexitat de dinàmica del procés impedeix formular models mecanicistes. S'ha dut a terme un estudi preliminar de l'ús de algorismes de generació de regles i de grafs de dependència bayesiana per a introduir una nova capa que faciliti la interpretació dels models. Els resultats preliminars obtinguts a partir de la classificació dels Modes d'acció Tòxica (MOA) apunten a que l'ús dels MOA com a indicadors intermediaris dels efectes dels compostos químics en la salut és una aproximació factible.Finalment, el marc de treball proposat s'ha aplicat en tres escenaris de modelat diferents. En primer lloc, s'ha desenvolupat i avaluat un sensor virtual capaç d'inferir índexs de qualitat a partir de variables primàries de procés. El sensor resultant ha estat implementat en una planta química real millorant els resultats de les correlacions multilineals emprades habitualment. S'ha desenvolupat i avaluat un model per a predir els efectes carcinògens d'un grup de compostos aromàtics a partir de la seva estructura molecular. Els resultats obtinguts desprès d'aplicar el mètode de selecció de variables basat en el SOM milloren els resultats prèviament publicats. Aquest marc de treball s'ha usat també per a proporcionar una nova aproximació al modelat ambiental i l'anàlisi de risc amb sistemes d'informació geogràfica (GIS). S'ha usat el SOM per a caracteritzar escenaris d'exposició i per a desenvolupar un nou mètode d'interpolació geogràfica. La combinació del SOM amb els models de mescla de gaussianes dona una nova formulació al problema de l'anàlisi de risc des d'un punt de vista probabilístic
Application of soft computing models with input vectors of snow cover area in addition to hydro-climatic data to predict the sediment loads
The accurate estimate of sediment load is important for management of the river ecosystem, designing of water infrastructures, and planning of reservoir operations. The direct measurement of sediment is the most credible method to estimate the sediments. However, this requires a lot of time and resources. Because of these two constraints, most often, it is not possible to continuously measure the daily sediments for most of the gauging sites. Nowadays, data-based sediment prediction models are famous for bridging the data gaps in the estimation of sediment loads. In data-driven sediment predictions models, the selection of input vectors is critical in determining the best structure of models for the accurate estimation of sediment yields. In this study, time series inputs of snow cover area, basin effective rainfall, mean basin average temperature, and mean basin evapotranspiration in addition to the flows were assessed for the prediction of sediment loads. The input vectors were assessed with artificial neural network (ANN), adaptive neuro-fuzzy logic inference system with grid partition (ANFIS-GP), adaptive neuro-fuzzy logic inference system with subtractive clustering (ANFIS-SC), adaptive neuro-fuzzy logic inference system with fuzzy c-means clustering (ANFIS-FCM), multiple adaptive regression splines (MARS), and sediment rating curve (SRC) models for the Gilgit River, the tributary of the Indus River in Pakistan. The comparison of different input vectors showed improvements in the prediction of sediments by using the snow cover area in addition to flows, effective rainfall, temperature, and evapotranspiration. Overall, the ANN model performed better than all other models. However, as regards sediment load peak time series, the sediment loads predicted using the ANN, ANFIS-FCM, and MARS models were found to be closer to the measured sediment loads. The ANFIS-FCM performed better in the estimation of peak sediment yields with a relative accuracy of 81.31% in comparison to the ANN and MARS models with 80.17% and 80.16% of relative accuracies, respectively. The developed multiple linear regression equation of all models show an R value of 0.85 and 0.74 during the training and testing period, respectively
Assessment of climate change and development of data based prediction models of sediment yields in Upper Indus Basin
Hohe Raten von Sedimentflüssen und ihre Schätzungen in Flusseinzugsgebieten erfordern die Auswahl effizienter Quantifizierungsansätze mit einem besseren Verständnis der dominierten Faktoren, die den Erosionsprozess auf zeitlicher und räumlicher Ebene steuern. Die vorherige Bewertung von Einflussfaktoren wie Abflussvariation, Klima, Landschaft und Fließprozess ist hilfreich, um den geeigneten Modellierungsansatz zur Quantifizierung der Sedimenterträge zu entwickeln. Einer der schwächsten Aspekte bei der Quantifizierung der Sedimentfracht ist die Verwendung traditioneller Beziehung zwischen Strömungsgeschwindigkeit und Bodensatzlöschung (SRC), bei denen die hydrometeorologischen Schwankungen, Abflusserzeugungsprozesse wie Schneedecke, Schneeschmelzen, Eisschmelzen usw. nicht berücksichtigt werden können. In vielen Fällen führt die empirische Q-SSC Beziehung daher zu ungenauen Prognosen.
Heute können datenbasierte Modelle mit künstlicher Intelligenz die Sedimentfracht präziser abschätzen. Die datenbasierten Modelle lernen aus den eingespeisten Datensätzen, indem sie bei komplexen Phänomenen wie dem Sedimenttransport die geeignete funktionale Beziehung zwischen dem Output und seinen Input-Variablen herstellen. In diesem Zusammenhang wurden die datenbasierten Modellierungsalgorithmen in der vorliegenden Forschungsarbeit am Lehrstuhl für Wasser- und Flussgebietsmanagement des Karlsruher Instituts für Technologie in Karlsruhe entwickelt, die zur Vorhersage von Sedimenten in oberen unteren Einzugsgebieten des oberen Indusbeckens von Pakistan (UIB) verwendet wurden.
Die dieser Arbeit zugrunde liegende Methodik gliedert sich in vier Bearbeitungsschritte: (1) Vergleichende Bewertung der räumlichen Variabilität und der Trends von Abflüssen und Sedimentfrachten unter dem Einfluss des Klimawandels im oberen Indus-Becken (2) Anwendung von Soft-Computing-Modellen mit Eingabevektoren der schneedeckten Fläche zusätzlich zu hydro-klimatischen Daten zur Vorhersage der Sedimentfracht (3) Vorhersage der Sedimentfracht unter Verwendung der NDVI-Datensätze (Hydroclimate and Normalized Difference Vegetation Index) mit Soft-Computing-Modellen (4) Klimasignalisierung bei suspendierten Sedimentausträge aus Gletscher und Schnee dominierten Teileinzugsgebeiten im oberen Indus-Becken (UIB).
Diese im UIB durchgeführte Analyse hat es ermöglicht, die dominiertenden Parameter wie Schneedecke und hydrologischen Prozesses besser zu und in eine verbesserte Prognose der Sedimentfrachten einfließen zu lassen.
Die Analyse der Bewertung des Klimawandels von Flüssen und Sedimenten in schnee- und gletscherdominierten UIB von 13 Messstationen zeigt, dass sich die jährlichen Flüsse und suspendierten Sedimente am Hauptindus in Besham Qila stromaufwärts des Tarbela-Reservoirs im ausgeglichenen Zustand befinden. Jedoch, die jährlichen Konzentrationen suspendierter Sedimente (SSC) wurden signifikant gesenkt und lagen zwischen 18,56% und 28,20% pro Jahrzehnt in Gilgit an der Alam Bridge (von Schnee und Gletschern dominiertes Becken), Indus in Kachura und Brandu in Daggar (von weniger Niederschlag dominiertes Becken). Während der Sommerperiode war der SSC signifikant reduziert und lag zwischen 18,63% und 27,79% pro Jahrzehnt, zusammen mit den Flüssen in den Regionen Hindukush und West-Karakorum aufgrund von Anomalien des Klimawandels und im unteren Unterbecken mit Regen aufgrund der Niederschlagsreduzierung. Die SSC während der Wintersaison waren jedoch aufgrund der signifikanten Erwärmung der durchschnittlichen Lufttemperatur signifikant erhöht und lagen zwischen 20,08% und 40,72% pro Jahrzehnt.
Die datenbasierte Modellierung im schnee und gletscherdominierten Gilgit Teilbecken unter Verwendung eines künstlichen neuronalen Netzwerks (ANN), eines adaptiven Neuro-Fuzzy-Logik-Inferenzsystems mit Gitterpartition (ANFIS-GP) und eines adaptiven Neuro-Fuzzy-Logik-Inferenzsystems mit subtraktivem Clustering (ANFIS) -SC), ein adaptives Neuro-Fuzzy-Logik- Inferenzsystem mit Fuzzy-C-Mittel-Clustering, multiplen adaptiven Regressionssplines (MARS) und Sedimentbewertungskurven (SRC) durchgeführt.
Die Ergebnisse von Algorithmen für maschinelles Lernen zeigen, dass die Eingabekombination aus täglichen Abflüssen (Qt), Schneedeckenfläche (SCAt), Temperatur (Tt-1) und Evapotranspiration (Evapt-1) die Leistung der Sedimentvorhersagemodelle verbesserne. Nach dem Vergleich der Gesamtleistung der Modelle schnitt das ANN-Modell besser ab als die übrigen Modelle. Bei der Vorhersage der Sedimentfrachten in Spitzenzeiten lag die Vorhersage der ANN-, ANIS-FCM- und MARS-Modelle näher an den gemessenen Sedimentbelastungen. Das ANIS-FCM-Modell mit einem absoluten Gesamtfehler von 81,31% schnitt bei der Vorhersage der Spitzensedimente besser ab als ANN und MARS mit einem absoluten Gesamtfehler von 80,17% bzw. 80,16%.
Die datenbasierte Modellierung der Sedimentfrachten im von Regen dominierten Brandu-Teilbecken wurde unter Verwendung von Datensätzen für Hydroklima und biophysikalische Eingaben durchgeführt, die aus Strömungen, Niederschlag, mittlerer Lufttemperatur und normalisiertem Differenzvegetationsindex (NDVI) bestehen. Die Ergebnisse von vier ANNs (Artificial Neural Networks) und drei ANFIS-Algorithmen (Adaptive Neuro-Fuzzy Logic Inference System) für das Brandu Teilnbecken haben gezeigt, dass der mittels Fernerkundung bestimmte NDVI als biophysikalische Parameter zusätzlich zu den Hydroklima-Parametern die Leistung das Modell nicht verbessert. Der ANFIS-GP schnitt in der Testphase besser ab als andere Modelle mit einer Eingangskombination aus Durchfluss und Niederschlag. ANN, eingebettet in Levenberg-Marquardt (ANN-LM) für den Zeitraum 1981-2010, schnitt jedoch am besten mit Eingabekombinationen aus Strömungen, Niederschlag und mittleren Lufttemperaturen ab. Die Ergebnisgenauigkeit R2 unter Verwendung des ANN-LM-Algorithmus verbesserte sich im Vergleich zur Sedimentbewertungskurve (SRC) um bis zu 28%. Es wurde gezeigt, dass für den unteren Teil der UIB-Flüsse Niederschlag und mittlere Lufttemperatur dominierende Faktoren für die Vorhersage von Sedimenterträgen sind und biophysikalische Parameter (NDVI) eine untergeordnete Rolle spielen.
Die Modellierung zur Bewertung der Änderungen des SSC in schnee- und gletschergespeiste Gilgit- und Astore-Teilbecken wurde unter Verwendung des Temp-Index degree day modell durchgeführt. Die Ergebnisse des Mann-Kendall-Trendtests in den Flüssen Gilgit und Astore zeigten, dass der Anstieg des SSC während der Wintersaison auf die Erwärmung der mittleren Lufttemperatur, die Zunahme der Winterniederschläge und die Zunahme der Schneeschmelzen im Winter zurückzuführen ist. Während der Frühjahrssaison haben die Niederschlags- und Schneedeckenanteile im Gilgit-Unterbecken zugenommen, im Gegensatz zu seiner Verringerung im Astore-Unterbecken. Im Gilgit-Unterbecken war der SSC im Sommer aufgrund des kombinierten Effekts der Karakorum-Klimaanomalie und der vergrößerten Schneedecke signifikant reduziert. Die Reduzierung des Sommer-SSC im Gilgit Fluss ist auf die Abkühlung der Sommertemperatur und die Bedeckung der exponierten proglazialen Landschaft zurückzuführen, die auf erhöhten Schnee, verringerte Trümmerflüsse Trümmerflüsse und verringerte Schneeschmelzen von Trümmergletschern zurückzuführen sind.
Im Gegensatz zum Gilgit River sind die SSC im Astore River im Sommer erhöht. Der Anstieg des SSC im Astore-Unterbecken ist auf die Verringerung des Frühlingsniederschlags und der Schneedecke, die Erwärmung der mittleren Sommerlufttemperatur und den Anstieg des effektiven Niederschlags zurückzuführen. Die Ergebnisse zeigen ferner eine Verschiebung der Dominanz von Gletscherschmelzen zu Schneeschmelzen im Gilgit-Unterbecken und von Schnee zu Niederschlägen im Astore-Unterbecken bei Sedimenteden Sedimentfrachten in UIB.
Die vorliegende Forschungsarbeit zur Bewertung der klimabedingten Veränderungen des SSC und seiner Vorhersage sowohl in den oberen als auch in den unteren Teilbecken des UIB wird nützlich sein, um den Sedimenttransportprozess besser zu verstehen und aufbauen auf dem verbessertenProzessverständnis ein angepasstes Sedimentmanagement und angepasste Planungen der zukünftigen Wasserinfrastrukturen im UIB ableiten zu können
Bidirectional optimization of the melting spinning process
This is the author's accepted manuscript (under the provisional title "Bi-directional optimization of the melting spinning process with an immune-enhanced neural network"). The final published article is available from the link below. Copyright 2014 @ IEEE.A bidirectional optimizing approach for the melting spinning process based on an immune-enhanced neural network is proposed. The proposed bidirectional model can not only reveal the internal nonlinear relationship between the process configuration and the quality indices of the fibers as final product, but also provide a tool for engineers to develop new fiber products with expected quality specifications. A neural network is taken as the basis for the bidirectional model, and an immune component is introduced to enlarge the searching scope of the solution field so that the neural network has a larger possibility to find the appropriate and reasonable solution, and the error of prediction can therefore be eliminated. The proposed intelligent model can also help to determine what kind of process configuration should be made in order to produce satisfactory fiber products. To make the proposed model practical to the manufacturing, a software platform is developed. Simulation results show that the proposed model can eliminate the approximation error raised by the neural network-based optimizing model, which is due to the extension of focusing scope by the artificial immune mechanism. Meanwhile, the proposed model with the corresponding software can conduct optimization in two directions, namely, the process optimization and category development, and the corresponding results outperform those with an ordinary neural network-based intelligent model. It is also proved that the proposed model has the potential to act as a valuable tool from which the engineers and decision makers of the spinning process could benefit.National Nature Science Foundation of China, Ministry of Education of China, the Shanghai Committee of Science and Technology), and the Fundamental Research Funds for the Central Universities
Adaptive inferential sensors based on evolving fuzzy models
A new technique to the design and use of inferential sensors in the process industry is proposed in this paper, which is based on the recently introduced concept of evolving fuzzy models (EFMs). They address the challenge that the modern process industry faces today, namely, to develop such adaptive and self-calibrating online inferential sensors that reduce the maintenance costs while keeping the high precision and interpretability/transparency. The proposed new methodology makes possible inferential sensors to recalibrate automatically, which reduces significantly the life-cycle efforts for their maintenance. This is achieved by the adaptive and flexible open-structure EFM used. The novelty of this paper lies in the following: (1) the overall concept of inferential sensors with evolving and self-developing structure from the data streams; (2) the new methodology for online automatic selection of input variables that are most relevant for the prediction; (3) the technique to detect automatically a shift in the data pattern using the age of the clusters (and fuzzy rules); (4) the online standardization technique used by the learning procedure of the evolving model; and (5) the application of this innovative approach to several real-life industrial processes from the chemical industry (evolving inferential sensors, namely, eSensors, were used for predicting the chemical properties of different products in The Dow Chemical Company, Freeport, TX). It should be noted, however, that the methodology and conclusions of this paper are valid for the broader area of chemical and process industries in general. The results demonstrate that well-interpretable and with-simple-structure inferential sensors can automatically be designed from the data stream in real time, which predict various process variables of interest. The proposed approach can be used as a basis for the development of a new generation of adaptive and evolving inferential sensors that can a- ddress the challenges of the modern advanced process industry
An Efficient LS-SVM-Based Method for Fuzzy System Construction
This paper proposes an efficient learning mechanism to build fuzzy rule-based systems through the construction of sparse least-squares support vector machines (LS-SVMs). In addition to the significantly reduced computational complexity in model training, the resultant LS-SVM-based fuzzy system is sparser while offers satisfactory generalization capability over unseen data. It is well known that the LS-SVMs have their computational advantage over conventional SVMs in the model training process; however, the model sparseness is lost, which is the main drawback of LS-SVMs. This is an open problem for the LS-SVMs. To tackle the nonsparseness issue, a new regression alternative to the Lagrangian solution for the LS-SVM is first presented. A novel efficient learning mechanism is then proposed in this paper to extract a sparse set of support vectors for generating fuzzy if-then rules. This novel mechanism works in a stepwise subset selection manner, including a forward expansion phase and a backward exclusion phase in each selection step. The implementation of the algorithm is computationally very efficient due to the introduction of a few key techniques to avoid the matrix inverse operations to accelerate the training process. The computational efficiency is also confirmed by detailed computational complexity analysis. As a result, the proposed approach is not only able to achieve the sparseness of the resultant LS-SVM-based fuzzy systems but significantly reduces the amount of computational effort in model training as well. Three experimental examples are presented to demonstrate the effectiveness and efficiency of the proposed learning mechanism and the sparseness of the obtained LS-SVM-based fuzzy systems, in comparison with other SVM-based learning techniques
Review of Application of Artificial Neural Networks in Textiles and Clothing Industries over Last Decades
2010-2011 > Academic research: refereed > Chapter in an edited book (author
Application of machine-learning algorithms for better understanding of tableting properties of lactose co-processed with lipid excipients
Co-processing (CP) provides superior properties to excipients and has become a reliable option to facilitated formulation and manufacturing of variety of solid dosage forms. Development of directly compressible formulations with high doses of poorly flowing/compressible active pharmaceutical ingredients, such as paracetamol, remains a great challenge for the pharmaceutical industry due to the lack of understanding of the interplay between the formulation properties, process of compaction, and stages of tablets’ detachment and ejection. The aim of this study was to analyze the influence of the compression load, excipients’ co-processing and the addition of paracetamol on the obtained tablets’ tensile strength and the specific parameters of the tableting process, such as (net) compression work, elastic recovery, detachment, and ejection work, as well as the ejection force. Two types of neural networks were used to analyze the data: classification (Kohonen network) and regression networks (multilayer perceptron and radial basis function), to build prediction models and identify the variables that are predominantly affecting the tableting process and the obtained tablets’ tensile strength. It has been demonstrated that sophisticated data-mining methods are necessary to interpret complex phenomena regarding the effect of co-processing on tableting properties of directly compressible excipients
Preparing, Characterizing, On-Line Digital Image Processing of Residence Time Distribution and Modeling of Mechanical Properties of Nanocomposite Foams
The objectives of this research were to prepare, characterize and to study the effects of organoclay and extrusion variables on the physical, mechanical, structural, thermal and functional properties of tapioca starch (TS)/poly(lactic acid) (PLA) nanocomposite foams. On-line digital imaging processing was used to determine residence time distribution (RTD). Adaptive neuro-fuzzy inference system (ANFIS) was used to model the mechanical properties of nanocomposite foams. Four different organoclays (Cloisite 10A, 25A, 93A, 15A) were used to produce nanocomposite foams by melt-intercalation. The properties were characterized using Xray diffraction, scanning electron microscopy, differential scanning calorimetric, and Instron universal testing machine. The properties were influenced significantly with the addition of different organoclays. TS/PLA/Cloisite 30B nanocomposite foams, with four clay contents of 1, 3, 5, 7 wt%, were prepared by a melt-intercalation method. Among the four nanocomposites, 3 wt% clay content produced significantly different properties. Screw speed, screw configuration, die nozzle diameter and moisture content were varied to determine their effects on organoclay intercalation. These extrusion variables had significant effects on the properties of TS/PLA /Cloisite 10A nanocomposite foams due to the intercalation of organoclay. Multiple inputs single output (MISO) models were developed to predict mechanical properties of nanocomposite foams. Four individual ANFIS models were developed. All models preformed well with R2 values \u3e 0.71 and had very low root mean squared errors (RMSE). Effects of screw configurations and barrel temperatures on the RTD and MISO models were developed to predict mechanical properties. The influence of the extrusion variables had a significant effect on the mean residence time (MTR). On-line digital image processing (DIP) technique was developed to measure the RTD as compared to the colorimeter method. R2 showed a correlation of 0.88 of a* values from both methods. The influence of screw configuration and temperature on RTD were analyzed by the MRT and variance for both methods. Mixing screws and lower temperature resulted in higher MRT and variance for both methods
- …