326 research outputs found

    Dimensionality reduction via an orthogonal autoencoder approach for hyperspectral image classification

    Get PDF
    Nowadays, the increasing amount of information provided by hyperspectral sensors requires optimal solutions to ease the subsequent analysis of the produced data. A common issue in this matter relates to the hyperspectral data representation for classification tasks. Existing approaches address the data representation problem by performing a dimensionality reduction over the original data. However, mining complementary features that reduce the redundancy from the multiple levels of hyperspectral images remains challenging. Thus, exploiting the representation power of neural networks based techniques becomes an attractive alternative in this matter. In this work, we propose a novel dimensionality reduction implementation for hyperspectral imaging based on autoencoders, ensuring the orthogonality among features to reduce the redundancy in hyperspectral data. The experiments conducted on the Pavia University, the Kennedy Space Center, and Botswana hyperspectral datasets evidence such representation power of our approach, leading to better classification performances compared to traditional hyperspectral dimensionality reduction algorithms

    Smooth generalized linear models for aggregated data

    Get PDF
    Mención Internacional en el título de doctorAggregated data commonly appear in areas such as epidemiology, demography, and public health. Generally, the aggregation process is done to protect the privacy of patients, to facilitate compact presentation, or to make it comparable with other coarser datasets. However, this process may hinder the visualization of the underlying distribution that follows the data. Also, it prohibits the direct analysis of relationships between aggregated data and potential risk factors, which are commonly measured at a finer resolution. Therefore, it is of interest to develop statistical methodologies that deal with the disaggregation of coarse health data at a finer scale. For example, in the spatial setting, it could be desirable to obtain estimates, from coarse areal data, at a fine spatial grid or units less coarser than the original ones. These two cases are known as the area-to-point (ATP) and area-to-area (ATA) cases, respectively, which are illustrated in the first chapter of this thesis. Moreover, we can have spatial data recorded at coarse units over time. In some cases, the temporal dimension can also be in an aggregated form, hindering the visualization of the evolution of the underlying process over time. In this thesis we propose the use of a novel non-parametric method that we called composite link mixed model or, more succinctly, CLMM. In our proposed model, we look at the observed data as indirect observations of an underlying process (defined at a finer resolution than observed data), which we want to estimate. The mixed model formulation of our proposal allow us to include fine-scale population information and complex structures as random effects as parts of the modelling of the underlying trend. Since the CLMM is based on the approach given by Eilers (2007), called penalized composite link model (PCLM), we briefly review the PCLM approach in the first section of the second chapter of this thesis. Then, in the second section of this chapter, we introduce the CLMM approach under an univariate setting, which can be seen as a reformulation of the PCLM into a mixed model framework. This is achieved by following the mixed model reformulation of P-splines proposed in Currie and Durbán (2002) and Currie et al. (2006), which is also reviewed here. Then, the parameter estimation of the CLMM can be done under the framework of mixed model theory. This offers another alternative for the estimation of the PCLM, avoiding the use of information criteria for smoothing parameter selection. In the third section of the second chapter, we extend the CLMM approach to the multidimensional (array) case, where Kronecker products are involved in the extended model formulation. Illustrations for the univariate and the multidimensional array settings are presented throughout the second chapter, using mortality and fertility datasets. In the third chapter, we present a new methodology for the analysis of spatially aggregated data, by extending the CLMM approach developed in the second chapter to the spatial case. The spatial CLMM provides smoothed solutions for the ATP and ATA cases described in the first chapter, i.e., it gives a smoothed estimation for the underlying spatial trend, from aggregated data, at a finer resolution. The ATP and ATA cases are illustrated using several mortality (or morbidity) datasets, and simulation studies of the prediction performance between our approach and the area-to-point Poisson kriging of Goovaerts (2006) are realized. Also, in the third chapter we provide a methodology to deal with the overdispersion problem, which is based on the PRIDE (‘penalized regression with individual deviance effects’) approach of Perperoglou and Eilers (2010). In the fourth chapter, we generalize the methodology developed in the third chapter for the analysis of spatio-temporally aggregated data. Under this framework, we adapt the SAP (‘separation of anisotropic penalties’) algorithm of Rodríguez- Álvarez et al. (2015) and the GLAM (‘generalized linear array model’) algorithms given in Currie et al. (2006) and Eilers et al. (2006), to the CLMM context. The use of these efficient algorithms allow us to avoid possible storage problems and to speed up the computational time of the model estimation. We illustrate the methodology presented in this chapter by using a Q fever incidence dataset recorded in the Netherlands at municipality level and by months. Our aim, then, is to estimate smoothed incidences at a fine spatial grid over the study area throughout the 53 weeks of 2009. A simulation study is provided at the end of chapter four, in order to evaluate the prediction performance of our approach under three different coarse situations, using a detailed (and confidential) Q fever incidence dataset. Finally, the fifth chapter summarizes the main contributions made in this thesis and further work.Datos agregados aparecen comúnmente en áreas como la epidemiología, demografía, y salud pública. Generalmente, el proceso de agregación es efectuado para proteger la privacidad de los pacientes, para facilitar una presentación compacta, o para hacerlos comparables con otros conjuntos de datos más gruesos. Sin embargo, este proceso puede dificultar la visualización de la distribución subyacente que siguen los datos. Además, prohíbe el análisis directo de relaciones entre los datos agregados y factores de riesgos potenciales, los cuales son medidos usualmente en una resolución más fina. En consecuencia, es de interés el desarrollar metodologías estadísticas que traten la desagregación de datos de salud gruesos a una escala más fina. Por ejemplo, en el caso espacial, podría ser deseable obtener estimaciones, a partir de datos disponibles en unidades geográficas gruesas, en una malla espacial fina o en unidades menos gruesas que las originales. Estos dos casos se conocen como los casos área-a-punto (ATP, ‘area-to-point’) y área-a-área (ATA, ‘area-to-area’), respectivamente, los cuales son ilustrados en el primer capítulo de esta tesis. Más aún, podemos tener datos espaciales registrados en unidades geográficas gruesas a lo largo del tiempo. En algunos casos, la dimensión temporal también puede estar en una forma agregada, dificultando la visualización de la evolución del proceso subyacente a lo largo del tiempo. En esta tesis proponemos el uso de un novedoso método no-paramétrico que llamamos modelo mixto de enlace compuesto o, más brevemente, CLMM (‘composite link mixed model’). En nuestro modelo propuesto, miramos a los datos observados como observaciones indirectas de un proceso subyacente (definido en una resolución más fina que los datos observados), el cual queremos estimar. La formulación de modelo mixto en nuestra propuesta nos permite incluir información de la población medida en una escala fina y estructuras complejas como efectos aleatorios, como partes de la modelización de la tendencia subyacente. Dado que el CLMM est´a basado en el enfoque dado por Eilers (2007), llamado modelo de enlace compuesto penalizado (PCLM, ‘penalized composite link model’), revisaremos brevemente el enfoque PCLM en la primera sección del segundo capítulo de esta tesis. Luego, en la segunda sección de este capítulo, introduciremos el enfoque CLMM bajo un marco univariante, el cual puede ser visto como una reformulación del PCLM en un marco de modelo mixto. Esto es logrado siguiendo la reformulación como modelo mixto de los P-splines propuestos por Currie y Durbán (2002) y Currie et al. (2006), el cual es también revisado aquí. Luego, la estimación de parámetros del CLMM puede hacerse bajo el marco de la teoría de los modelos mixtos. Esto ofrece otra alternativa para la estimación del PCLM, evitando el uso de criterios de información para la selección del parámetro de suavizado. En la tercera sección del segundo capítulo, extendemos el enfoque CLMM al caso (array) multidimensional, en donde productos de Kronecker están implicados en la formulación del modelo extendido. Ilustraciones para los casos univariantes y (array) multidimensional son presentados a lo largo del segundo capítulo, usando conjuntos de datos de mortalidad y fertilidad. En el tercer capítulo, presentamos una nueva metodología para el análisis de datos agregados espacialmente, extendiendo el enfoque CLMM desarrollado en el segundo capítulo al caso espacial. El CLMM espacial proporciona soluciones suavizadas para los casos ATP y ATA descritos en el primer capítulo, es decir, entrega una estimación suavizada para la tendencia espacial subyacente, a partir de datos agregados, en una resolución más fina. Los casos ATP y ATA son ilustrados usando diferentes conjuntos de datos de mortalidad (o morbilidad), y estudios de simulación sobre el desempeño de predicción entre nuestro enfoque y el Poisson kriging área-a-punto de Goovaerts (2006) son realizados. Además, en el tercer capítulo proporcionamos una metodología para lidiar con el problema de sobredispersión, el cual está basado en el enfoque PRIDE (‘penalized regression with individual deviance effects’) de Perperoglou y Eilers (2010). En el cuarto capítulo, generalizamos la metodología desarrollada en el tercer capítulo para el análisis de datos agregados espacio-temporalmente. Bajo este contexto, adaptamos el algoritmo SAP (‘separation of anisotropic penalties’) de Rodríguez- Álvarez et al. (2015) y los algoritmos GLAM (‘generalized linear array model’) dados por Currie et al. (2006) y Eilers et al. (2006) en el contexto de los CLMMs. El uso de estos algoritmos eficientes nos permite evitar posibles problemas de almacenamiento y acelerar el tiempo de cómputo de la estimación del modelo. Ilustramos la metodología presentada en este capítulo usando un conjunto de datos sobre incidencia de fiebre Q registradas en Holanda a nivel municipal y por meses. Nuestro objetivo, luego, es el de estimar incidencias suavizadas en una malla espacial fina sobre el área de estudio a lo largo de las 53 semanas del 2009. Un estudio de simulación es dado al final del cuarto capítulo, de manera de evaluar el desempeño de predicción de nuestro enfoque bajo tres diferentes situaciones de agregación, usando un conjunto de datos detallado (y confidencial) de incidencia de fiebre Q. Finalmente, el quinto capítulo resume las contribuciones principales hechas en esta tesis y el trabajo a futuro.The work presented in this thesis was supported by the Spanish Ministry of Economy and Competitiveness grants MTM2011-28285-C02-02 and MTM2014-52184-P.Programa Oficial de Doctorado en Ingeniería MatemáticaPresidente: Miguel Ángel Martínez Beneito.- Secretario: Irene Albarrán Lozano.- Vocal: Jutta Gamp

    Humpback Whale’s Flukes Segmentation Algorithms

    Get PDF
    Photo-identification consists of the analysis of photographs to identify cetacean individuals based on unique characteristics that each specimen of the same species exhibits. The use of this tool allows us to carry out studies about the size of its population and migratory routes by comparing catalogues. However, the number of images that make up these catalogues is large, so the manual execution of photo-identification takes considerable time. On the other hand, many of the methods proposed for the automation of this task coincide in proposing a segmentation phase to ensure that the identification algorithm takes into account only the characteristics of the cetacean and not the background. Thus, in this work, we compared four segmentation techniques from the image processing and computer vision fields to isolate whales’ flukes. We evaluated the Otsu (OTSU), Chan Vese (CV), Fully Convolutional Networks (FCN), and Pyramid Scene Parsing Network (PSP) algorithms in a subset of images from the Humpback Whale Identification Challenge dataset. The experimental results show that the FCN and PSP algorithms performed similarly and were superior to the OTSU and CV segmentation techniques

    Makine imalat sanayi iş sağlığı ve güvenliği uygulamalarının analizi Sakarya makine imalatçıları örneği

    Get PDF
    06.03.2018 tarihli ve 30352 sayılı Resmi Gazetede yayımlanan “Yükseköğretim Kanunu İle Bazı Kanun Ve Kanun Hükmünde Kararnamelerde Değişiklik Yapılması Hakkında Kanun” ile 18.06.2018 tarihli “Lisansüstü Tezlerin Elektronik Ortamda Toplanması, Düzenlenmesi ve Erişime Açılmasına İlişkin Yönerge” gereğince tam metin erişime açılmıştır.İş sağlığı ve güvenliği dünyagenelinde tüm çalışanları ilgilendiren önemli bir sorundur. Her yıl çok sayıda çalışan, gerekli tedbirler alınmadığı veya alınan tedbirlere uyulmadığı için iş kazasına uğramaktadır. İş kazaları, çalışanları fiziki ve psikolojik zarara uğratırken ülke ekonomisine de önemli zararlar vermektedir. Bu çalışmanın amacı, makine imalat sanayinde iş sağlığı ve güvenliğini uygulamalarının analizi ve Sakarya ili örneği çerçevesinde uygulama sorunlarını tespit etmektir. Türkiye geneli ve Sakarya ili özelinde, makine imalat sektörünü içeren kapsam analizi ardından Sakarya ilinde faaliyet gösteren 60 adet makine imalat firmasındaiş sağlığı ve güvenliği uygulamalarına yönelik araştırma yapılmıştır. Nicel yönlü gerçekleştirilen analizde, yapılandırılmış anket tekniği kullanılmıştır. Anketler ilgili firmalarda,ulaşılan yetkili kişilere uygulanmıştır.Occupational health and safety is an important problem for all employees in the world. Every year, a large number of employees suffer from work accidents due to non-observance of necessary measures or measures taken. Occupational accidents cause physical and psychological harm to employees and also cause serious damage to the national economy. The aim of this study is to analyze occupational health and safety practices in machinery manufacturing industry and to determine application problems within the scope of Sakarya province. Sakarya province of Turkey in general and in particular, the scope of analysis includes the machinery manufacturing sector, followed by machinery manufacturing has been studied for 60 firmasındaiş health and safety practices operating in the province of Sakarya. In the quantitative analysis, structured questionnaire technique was used. The surveys were applied to the authorized persons in the related companies

    La evasion tributaria por comercio electrónico de las micro y pequeñas empresas en el distrito del Cusco – 2020

    Get PDF
    La presente investigación “La Evasión Tributaria Por Comercio Electrónico De Las Micro Y Pequeñas Empresas En El Distrito Del Cusco – 2020”, tiene como principal propósito determinar de qué manera se presenta la evasión tributaria por parte de las Micro y Pequeñas empresas en la Provincia del Cusco, del Distrito del Cusco, en el contexto del año 2020 . La metodología que se empleó para el desarrollo de esta investigación fue de enfoque cualitativo y de tipo básico, así mismo cuenta con un diseño de teoría fundamentada, se utilizó como instrumentos de recolección de datos a la guía de entrevista y guía de análisis documental. Así mismo se concluyó que, el crecimiento de la tecnología de los últimos años y el contexto de pandemia actual, hizo que muchas empresas comenzaran implementar en sus negocios, la venta de sus productos por comercio electrónico. Sin embargo, al no existir fiscalización por parte de las instituciones competentes y un sistema especializado que haga seguimiento a este tipo de comercio, muchas de las empresas comenzaron a incurrir en evasión tributaria. Dejando de declarar por estas ventas, y como consecuencia se da la afectación económica al país

    Supreme Decree No. 28984 - Regulation of the Regime of Incentives for Small and Marginal Field Production

    Get PDF
    The purpose of this decree is to regulate Article 64 of Law No. 3058- Hydrocarbons Law by establishing a regime of incentives for oil and natural gas in small and marginal fields

    A comparison of classification models to detect cyberbullying in the Peruvian Spanish language on twitter

    Get PDF
    Cyberbullying is a social problem in which bullies’ actions are more harmful than in traditional forms of bullying as they have the power to repeatedly humiliate the victim in front of an entire community through social media. Nowadays, multiple works aim at detecting acts of cyberbullying via the analysis of texts in social media publications written in one or more languages; however, few investigations target the cyberbullying detection in the Spanish language. In this work, we aim to compare four traditional supervised machine learning methods performances in detecting cyberbullying via the identification of four cyberbullying-related categories on Twitter posts written in the Peruvian Spanish language. Specifically, we trained and tested the Naive Bayes, Multinomial Logistic Regression, Support Vector Machines, and Random Forest classifiers upon a manually annotated dataset with the help of human participants. The results indicate that the best performing classifier for the cyberbullying detection task was the Support Vector Machine classifier

    La potestad discrecional en el pase a la situación de retiro por falta de idoneidad en la Policía Nacional del Perú: una visión a partir de la aplicación de los principios de buen gobierno

    Get PDF
    En el presente trabajo académico se ha realizado un estudio del procedimiento de pase a la situación de retiro por Falta de idoneidad, al amparo de una potestad discrecional otorgada por los artículos 2º y 3.3 del Decreto de Urgencia Nº 012-2020 al Director de Recursos Humanos de la PNP, al Comandante General, al Ministro del Interior y al Presidente de la República, cuyos procedimientos y criterios de aplicación terminan siendo arbitrarios en perjuicio de los efectivos de la Policía Nacional del Perú. Tomando como referencia los estudios realizados por el Tribunal Constitucional en sus diferentes sentencias se han identificado derechos fundamentales y principios constitucionales vulnerados en los pases a la situación de retiro en el ejercicio de una potestad discrecional. Asimismo, se ha analizado cada uno de los criterios establecidos por ley para que un efectivo sea considerado en el procedimiento de pase a retiro por falta de idoneidad y la manera en que estos vulneran derechos fundamentales y principios constitucionales de los integrantes de esta institución. Por esta razón, luego de realizar un estudio de los principios de buen gobierno se ha logrado determinar que, a través de su aplicación, en estricto de los principios de transparencia y corrección, permitirán orientar de manera positiva la potestad discrecional que ostentan las autoridades administrativas en el pase a la situación de retiro de efectivos policiales por falta de idoneidad. En ese sentido, se propone que el pase a retiro por falta de idoneidad sea regulada en una Ley así como la modificación del procedimiento administrativo y de sus criterios de aplicaciónTrabajo académic

    Carta de Evo Morales a los pueblos Indígenas del mundo

    Get PDF
    Nature, forests and indigenous peoples are not for sale. World's indigenous brothers: I am deeply concerned that you intend to use some leaders and indigenous groups to promote the commodification of nature and forests in particular through the creation of a REDD mechanism (Reducing Emissions from Deforestation and Degradation) and its REDD + versions, plus REDD and REDD + +La naturaleza, los bosques y los pueblos indígenas no estamos en venta. Hermanos indígenas del mundo: Estoy profundamente preocupado porque se pretende utilizar a algunos dirigentes y grupos indígenas para promover la mercantilización de la naturaleza y en particular de los bosques a través de la creación del mecanismo REDD (Reducción de Emisiones por Deforestación y Degradación) y sus versiones REDD+, REDD plus y REED++

    Asociación entre bruxismo autorreportado y rendimiento académico de los estudiantes universitarios.

    Get PDF
    Objective: To evaluate the association between self-reported bruxism and academic performance in students at a university in Lima, Peru. Material and Methods: A total of 203 students were evaluated in this study, between the ages of 19 and 35 years. Self-reported bruxism was measured using the Bruxism Assessment Questionnaire. Academic performance was evaluated using the Approval Index Scale. In addition, other variables were included such as employment status, socioeconomic level, stress, anxiety, among others. The association of variables were factored in using the chi-square test and the logistic regression presented the unadjusted and adjusted analisis. Results: The frequency of self-reported awake bruxism and sleep bruxism was 53.20% and 36.45%, respectively. Evidence revealed there was a statistically significant association between awake bruxism with stress and anxiety, and sleep bruxism with anxiety. Students with high academic performance (OR=2.36; IC del 95%:1.06-5.23) and low academic performance (OR=5.72; IC del 95%:1.28-25.57) were found to be more likely to have awake bruxism than those with medium academic performance. Conclusion: This study revealed a statistically significant association between self-reported awake bruxism and academic performance. However, in the future it is suggested to carry out a study with focus only on students with bruxism and with a larger sample of participants with low academic performance to confirm the association found between these variables.Objetivo: Evaluar la asociación entre bruxismo autorreportado y rendimiento académico en estudiantes de una universidad privada de Lima, Perú. Material y Métodos: Un total de 203 estudiantes con edades comprendidas entre 18 a 35 años fueron encuestados en esta investigación. Para la evaluación del bruxismo autoreportado se aplicó el cuestionario ‘Bruxism Assessment Questionnaire’ en su versión en español. Asimismo, el rendimiento académico se evaluó mediante la escala de Índice de Aprobación (IA). Además, se incluyeron otras variables como situación laboral, estrés, ansiedad, entre otros. La asociación de variables se realizó mediante la prueba chi cuadrado y para el análisis crudo y ajustado se utilizó la regresión logística. Resultados: Se encontró una prevalencia de bruxismo de vigilia de 53.20% y de bruxismo de sueño de 36.45%. Se evidenció asociación estadísticamente significativa entre bruxismo de vigilia con estrés y ansiedad, y bruxismo de sueño con ansiedad. Se halló que los estudiantes con rendimiento académico alto (OR=2.36; IC del 95%:1.06-5.23) y rendimiento académico bajo (OR=5.72; IC del 95%:1.28-25.57) tienen más probabilidades de presentar bruxismo de vigilia que aquellos con rendimiento académico medio. Conclusiones: En el presente estudio se halló asociación estadísticamente significativa entre bruxismo de vigilia autorreportado y rendimiento académico. No obstante, a futuro se sugiere realizar un estudio a los estudiantes con presencia de bruxismo y con un mayor tamaño muestral de participantes con rendimiento académico bajo para afirmar la asociación encontrada entre dichas variables
    corecore