29 research outputs found

    APPLICATIONS OF MARKOV CHAIN MONTE CARLO AND POLYNOMIAL CHAOS EXPANSION BASED TECHNIQUES FOR STATE AND PARAMETER ESTIMATION

    Get PDF
    In this research thesis, we implement Markov Chain Monte Carlo techniques and polynomial-chaos expansion based techniques for states and parameters estimation in hidden Markov models (HMM). Our goal is to estimate the probability density function (PDF) of the states and parameters given noisy observations of the output of the hidden Markov model. We consider three problems, namely, (i) determining the PDF of the states in a non-linear HMM using sequential MCMC techniques, (ii) determining the parameters of discretized linear, ordinary differential equations (ODE) given noisy observations of the solutions and (iii) Determining the PDF of the solution of a linear ordinary differential equation when the parameters of the ODE are random variables. While these problems naturally arise in several areas in engineering, this thesis is motivated by potential applications in bio-mechanics. One of the interesting research questions that is being considered by some researchers is whether the formation of clots can be predicted by observing the mechanical properties of arteries, such as their stiff ness. In order for this approach to be successful, it is critical to estimate the stiffness of arteries based on noisy measurements of their mechanical response. The parameters of these models can then be used to differentiate diseased arteries from healthy ones or, the parameters can be used to predict the probability of formation of plaques. From experimental data, we would like to infer the posterior density of the states and parameters (such as stiffness), and classify it as being healthy or diseased. If it is accomplished, this will improve the state-of-the art in modeling mechanical properties of arteries, which could lead to better prediction, and diagnosis of coronary artery disease

    Disruption of the AMPK-TBC1D1 nexus increases lipogenic gene expression and causes obesity in mice via promoting IGF1 secretion

    Get PDF
    Tre-2/USP6, BUB2, cdc16 domain family member 1 (the TBC domain is the GTPase activating protein domain) (TBC1D1) is a Rab GTPase activating protein that is phosphorylated on Ser(231) by the AMP-activated protein kinase (AMPK) in response to intracellular energy stress. However, the in vivo role and importance of this phosphorylation event remains unknown. To address this question, we generated a mouse model harboring a TBC1D1(Ser231Ala) knockin (KI) mutation and found that the KI mice developed obesity on a normal chow diet. Mechanistically, TBC1D1 is located on insulin-like growth factor 1 (IGF1) storage vesicles, and the KI mutation increases endocrinal and paracrinal/autocrinal IGF1 secretion in an Rab8a-dependent manner. Hypersecretion of IGF1 causes increased expression of lipogenic genes via activating the protein kinase B (PKB; also known as Akt)–mammalian target of rapamycin (mTOR) pathway in adipose tissues, which contributes to the development of obesity, diabetes, and hepatic steatosis as the KI mice age. Collectively, these findings demonstrate that the AMPK–TBC1D1 signaling nexus interacts with the PKB–mTOR pathway via IGF1 secretion, which consequently controls expression of lipogenic genes in the adipose tissue. These findings also have implications for drug discovery to combat obesity

    Trabajo de graduación influencia de vetas arenosas en la producción de caña de azúcar, Finca Monte Alegre, diagnóstico y servicios prestados en Ingenio La Unión, Santa Lucía Cotzumalguapa, Escuintla, Guatemala, C.A.

    Get PDF
    La presente investigación se realizó en El Ingenio La Unión, ubicado en Santa Lucía Cotzumalguapa, Escuintla, Guatemala, mediante el diagnóstico se determinó la situación actual del servicio de Sistemas de Información Geográfica (SIG) que el Departamento de SIA brinda a los usuarios del área agrícola de Ingenio La Unión. El Departamento de SIA cuenta con una herramienta llamada BIOSALC la cual un usuario de dicho departamento la utiliza para generar información de campo en tiempo real, dicha herramienta de administración de datos alimenta a un sitio web llamado reportes BioSalc, el sitio web contiene una ventana llamada SIA, en la cual existe un hipervínculo llamado GIS, en este sitio los usuarios pueden generar mapas temáticos de plagas, variedades, producción, madurante y cosecha, en términos generales el Departamento de SIA provee información georreferenciada a los siguientes departamentos: Agronomía, Investigación Agrícola, Ingeniería Agrícola, Aplicaciones Aéreas, Cosecha Alce y Transporte (CAT), dicha información es plasmada en mapas temáticos con extensión PDF, KML y PNG. Se seleccionaron tres lotes de producción con manejos agronómicos homogéneos entre sí (4.020, 7.160 y 13.08), y se establecieron dos tratamientos llamados; T1 (suelos con vetas de arena) y T2 (suelos sin veta de arena), haciendo uso de los Sistemas de Información Geográfica y ortofotografías (MAGA 2006) se identificaron las áreas de vetas de arena por lote de estudio, y fueron ubicadas cinco unidades experimentales aleatoriamente dentro de cada tratamiento, 10 unidades por lote, haciendo un total de 30 unidades experimentales de estudio, estas fueron diseñadas con la siguientes medidas: 10 metros de largo y ancho de surco de caña. Las variables estudiadas y analizadas por medio de una prueba de medias, fueron las siguientes: población, longitud de tallo, peso y producción de toneladas métricas de caña por hectárea. En términos generales se determinó que la producción de toneladas métricas de caña por hectárea disminuye al momento que el contenido de arena aumenta en la veta, debido a que las vetas presentan diferentes contenidos de arena entre ellas la variabilidad existe, por la textura del suelo. Por lo tanto es necesario un manejo agronómico diferente dentro de las vetas de arena para que la variabilidad de producción disminuya dentro de los lotes de estudio. Los servicios para el área de campo y gerencia agrícola de Ingenio La Unión, fueron: 1) Primera aproximación de la clasificación del porcentaje de área influenciada con veta de arena sobre el lote en fincas bajo administración de Ingenio La Unión, S.A. El servicio fue elaborado con el fin de tener digitalizadas y georreferenciadas las áreas con vetas de arena y obtener el porcentaje que influye la veta en la finca, el trabajo se realizó en fincas bajo administración de Ingenio La Unión para la Zafra 20142015. 2) Monitoreo del Rendimiento Potencial (Kg/Tm), mensual durante la Zafra 20142015. El servicio fue desarrollado para poder visualizar gráficamente a través de mapas electrónicos, el rendimiento potencial (Kg/Tm) por lote de producción, estos mapas se elaboraron cada fin de mes y fueron compartidos a los usuarios del área agrícola

    Selección de genotipos promisorios de café (Coffea arabica L.) basados en caracteres agromorflógicos, resistencia a plagas y enfermedades en Finca Las Flores, Barberena, Santa Rosa, Guatemala, C.A.

    Get PDF
    El presente trabajo de investigación se realizó en la Finca Las Flores, Barberena, Santa Rosa, el objetivo fue seleccionar de genotipos promisorios de café (Coffea arabica L.) basados en caracteres agromorflógicos, resistencia a plagas y enfermedades del cultivo del café. Según la Asociación Nacional del Café (ANACAFE) las variedades de café cultivadas en Guatemala en orden de importancia son: Bourbón, Caturra, Catuaí y Pache Colis. Éstas variedades tienen problemas de plagas, enfermedades y disminuyen el rendimiento. Por ello, es importante evaluar nuevos genotipos con resistencia a plagas y enfermedades más importantes para el café en Guatemala. En la presente investigación se realizó la caracterización agromorfológica de 50 genotipos de café mejorados en Brasil, con alto potencial de rendimiento y con resistencia a plagas y enfermedades. Fueron establecidos en un ensayo sin diseño experimental en Barberena, Santa Rosa, en donde se hizo el estudio. La caracterización agromorfológica de 50 genotipos promisorios de café se realizó auxiliándose del descriptor de café adaptado a las condiciones de finca Las Flores, Santa Rosa (IPGRI, 1996). Con esto se conoció la variabilidad genética de los cafetos en estudio de acuerdo a las variables que se tomaron en el campo. Como testigo local se utilizó la variedad Caturra. En el análisis de la información se utilizó el software XLSTAT, EXCEL (2007), agrupando 22 variables de caracteres del tallo, hojas, flores y frutos. El método estadístico utilizado fue agrupamiento por conglomerados, coeficiente de Pearson y distancia eucledía al medio. La selección de los mejores genotipos promisorios se realizó en dos fases, fase de campo y fase de gabinete. La fase de campo con un grupo de expertos conocedores en temas de agronomía, fitomejoramiento y fitopatología, dónde se tomó como base el fenotipo y caracteres cualitativos como vigor, arquitectura de planta, color de fruto, rendimiento, plagas y enfermedades. La fase de gabinete se realizó con caracteres cuantitativos como: altura de planta, diámetro de tronco, área foliar, entre otros. Con estos datos se realizó un dendograma con 10 grupos fenotípicos. Los 10 genotipos promisorios de café seleccionados, basados en buenos caracteres agromorfológicos y de resistencia a plagas y enfermedades, estos fueron: híbrido 6 cruce 15-II-5 cv. 4; híbrido 7, cruce 6-IV-5 cv. 9, híbrido 13 cruce CIA-1-41-19 cv.3, híbrido 14 cruce CIA-316-16- cv.8; híbrido 31 cruce H-140-3-41 cv.8; híbrido 36 cruce H-145-17-17 cv.2, híbrido 41 cruce CIA 1-41-23 cv.73; híbrido 44 cruce CIA 1-41-23 cv.5; la mezcla de líneas 46 compuesta de CIA mezcla de línea cultivar 178 y la mezcla de líneas 49 CIA mezcla de línea cultivar 69. La selección de los genotipos promisorios de café resistentes a plagas y enfermedades se cuantificó intensidad de la enfermedad e incidencia de plagas en diferentes épocas del año, durante noviembre 2009 a diciembre 2011, en las condiciones ambientales de Barberena, Santa Rosa. En cuanto a enfermedades, se determinó susceptibilidad a roya, en los genotipos: 6, 31 y 36 que provienen de cruzas de Catuaí 62 y 99; con 30% de incidencia y severidad valor 3 de acuerdo a la escala utilizada. En el caso de cercospora amarilla y negra, se cuantificó 20% como valor máximo de incidencia y valores bajos de severidad. Para antracnosis, valor máximo de incidencia fue 20% y mínimo de 10%. En el caso de plagas, se presentó problema de minador con incidencia de 20%. El rendimiento promedio de los genotipos de café durante las dos primeras cosechas después de siembra, períodos de producción 2009-2011, fue de 1954.66 kg/ha. Los genotipos con mayor rendimiento fueron los identificados con los números: 14, 31, 46 y 49 con 2348.49 kg/ha, el menor rendimiento fue de 768.14 kg/ha que pertenece a los genotipos segregantes identificados con los números: 5a, 5b, 17a, 17b, 21a, 21b, 23a, 23b, 26a, 26b, 29a, 29b, 34a, 34b,35a, 37b, 40a y 40b. El rendimiento del testigo variedad Caturra fue de 920.35 kg/ha. Los genotipos promisorios de café seleccionados en esta investigación se ubicaron en 6 grupos fenotípicos. La calidad de bebida de los genotipos seleccionados, se reportó calidad tipo semidura y taza áspera para los identificados con los números: 13, 14 23a y 23b; el 50% restante, tipo duro con taza amarga y pertenecen a los genotipos de café identificados con los números: 41, 43, 44 y 49

    PATTERN RECOGNITION FOR RESTRICTED AND NONSTATIONARY DATA

    No full text
    The standard assumption in classification is that the training data are independent and identically distributed. Indeed, this assumption is so pervasive that it is often applied without mention. In this dissertation, we propose novel methods that address violations of this standard assumption corresponding to 1) restricted sampling and 2) a nonstationary environment. The first part of this dissertation concerns the bias of classification precision estimation under restricted sampling. Precision and recall have become very popular classification accuracy metrics in the statistical learning literature, under the standard i.i.d. sampling assumption. However, in many cases of interest, as in observational case-control studies for biomarker discovery in cancer studies, the training data are sampled separately from the case and control populations, violating the standard sampling assumption, under which the data is sampled randomly from the mixture of the populations. We present an analysis of the bias in the estimation of the precision of classifiers designed on separately sampled data. The analysis consists of both theoretical and numerical results, which show that classifier precision estimates can display strong bias under separating sampling, with the bias magnitude depending on the difference between the true case prevalence in the population and the sample prevalence in the data. We show that this bias is systematic in the sense that it cannot be reduced by increasing sample size. If information about the true case prevalence is available from public health records, then we propose the use of a modified precision estimator based on the known prevalence that displays smaller bias, which can in fact be reduced to zero as sample size increases under regularity conditions on the classification algorithm. The accuracy of the theoretical analysis and the performance of the precision estimators under separate sampling are confirmed by numerical experiments using synthetic and real data from published observational case-control studies. The results with real data confirmed that under separately-sampled data, the usual precision estimator produces larger, i.e. more optimistic, estimates than the estimator using the true prevalence value. The second part of this dissertation proposes a state space model approach to classification of nonstationary data. In many applications, the data are collected at different time points. If the time between consecutive acquisition points is large enough, the distribution of data is likely to shift due to natural physical processes, and the standard i.i.d. sampling assumption is violated. This has been known in the statistical learning literature as “population drift” problem. Most attempts to address nonstationarity are ad-hoc and carry no guarantee of optimality. In this dissertation, we propose a state-space methodology, whereby the data are assumed to evolve linearly or nonlinearly under Gaussian observation noise, and applied adaptive filtering methods to estimate the distributional parameters, leading to nonstationary linear and quadratic discriminant analysis (NSLDA and NSQDA) classification rules. Parameter estimation in the linear state-space model is accomplished by a combination of Kalman smoothing and maximum-likelihood estimation by expectation maximization, while particle filtering methods are proposed for the nonlinear state-space model. We have also addressed the case where the time labels of some data are unknown, a situation that often arises in practice, by proposing a hybrid Gaussian mixture modeling (GMM)-Kalman Smoother approach. The accuracy of the proposed nonstationary discriminant analysis rule, as well as its robustness against noise, missing data, and unbalanced training data are demonstrated in numerical experiments, where we compare it to “naive” LDA, QDA, and nonlinear SVM classification rules

    Evaluating the effects of common control measures for influenza A (H1N1) outbreak at school in China: A modeling study

    No full text
    <div><p>Background</p><p>Influenza A (H1N1) outbreaks have become common at schools in China since 2009. However, the effects of common countermeasures for school influenza outbreak have not been quantified so far, including isolation, vaccination, antivirus and school closure. We conducted a mathematically modeling study to address this unsolved issue.</p><p>Methods</p><p>We collected data of all small-scale school outbreaks caused by influenza A that occurred in Changsha city between January 2009 and December 2013. Two outbreaks (one was in 2009 and the other one was in 2013) were used for simulating the effects of single and combined use of common measures, including isolation (Iso), therapeutics (T), prophylactics (P), vaccinating 70% of susceptible individuals prior to the outbreak (V<sub>P70</sub>), vaccinating 70% of susceptible individuals every day during the outbreak (V<sub>D70</sub>) and school closure of one week (S1w). A susceptible—exposed—infectious/asymptomatic—recovered (SEIR) model was developed to implement the simulations based on the natural history of influenza A.</p><p>Results</p><p>When no control measures are taken, the influenza is expected to spread quickly at school for the selected outbreak in 2013; the outbreak would last 56 days, and the total attack rate (TAR) would reach up to 46.32% (95% CI: 46.12–46.52). Of all single control measures, V<sub>P70</sub> is most effective to control the epidemic (TAR = 8.68%), followed by V<sub>P50</sub>, V<sub>D70</sub>, V<sub>D50</sub> and Iso. The use of V<sub>P70</sub> with any other measure can reduce TAR to 3.37–14.04% and showed better effects than any other combination of two kinds of measures. The best two-measure combination is ‘S1w+V<sub>P70</sub>’ (TAR = 3.37%, DO = 41 days). All combinations of three kinds of measures were not satisfactory when V<sub>p70</sub> and V<sub>D70</sub> were excluded. The most effective three-intervention combination was ‘Iso+S1w+V<sub>P70</sub>’ (with TAR = 3.23%). When V<sub>P70</sub> or V<sub>D70</sub> is included, the combinations of four or five kinds of interventions are very effective, reducing TAR to lower than 5%. But the TAR of combination of ‘T+P+Iso+S1w’ is 23.20%. Similar simulation results were observed for the selected outbreak in 2009.</p><p>Conclusion</p><p>Vaccinating no less than 70% of individuals prior to the outbreak and isolation are recommended as single measures to control H1N1outbreak at school. The combination of V<sub>P70</sub>+S1w can achieve very good control for school outbreak.</p></div
    corecore