87 research outputs found
Simple but Not Simplistic: Reducing the Complexity of Machine Learning Methods
Programa Oficial de Doutoramento en Computación . 5009V01[Resumo]
A chegada do Big Data e a explosión do Internet das cousas supuxeron un gran
reto para os investigadores en Aprendizaxe Automática, facendo que o proceso de
aprendizaxe sexa mesmo roáis complexo. No mundo real, os problemas da aprendizaxe
automática xeralmente teñen complexidades inherentes, como poden ser as
características intrínsecas dos datos, o gran número de mostras, a alta dimensión dos
datos de entrada, os cambios na distribución entre o conxunto de adestramento e
test, etc. Todos estes aspectos son importantes, e requiren novoS modelos que poi dan
facer fronte a estas situacións. Nesta tese, abordáronse todos estes problemas, tratando
de simplificar o proceso de aprendizaxe automática no escenario actual. En
primeiro lugar, realízase unha análise de complexidade para observar como inflúe
esta na tarefa de clasificación, e se é posible que a aplicación dun proceso previo
de selección de características reduza esta complexidade. Logo, abórdase o proceso
de simplificación da fase de aprendizaxe automática mediante a filosofía divide e
vencerás, usando un enfoque distribuído. Seguidamente, aplicamos esa mesma filosofía
sobre o proceso de selección de características. Finalmente, optamos por un
enfoque diferente seguindo a filosofía do Edge Computing, a cal permite que os datos
producidos polos dispositivos do Internet das cousas se procesen máis preto de
onde se crearon. Os enfoques propostos demostraron a súa capacidade para reducir
a complexidade dos métodos de aprendizaxe automática tradicionais e, polo tanto,
espérase que a contribución desta tese abra as portas ao desenvolvemento de novos
métodos de aprendizaxe máquina máis simples, máis robustos, e máis eficientes
computacionalmente.[Resumen]
La llegada del Big Data y la explosión del Internet de las cosas han supuesto
un gran reto para los investigadores en Aprendizaje Automático, haciendo que el
proceso de aprendizaje sea incluso más complejo. En el mundo real, los problemas de
aprendizaje automático generalmente tienen complejidades inherentes) como pueden
ser las características intrínsecas de los datos, el gran número de muestras, la alta
dimensión de los datos de entrada, los cambios en la distribución entre el conjunto de
entrenamiento y test, etc. Todos estos aspectos son importantes, y requieren nuevos
modelos que puedan hacer frente a estas situaciones. En esta tesis, se han abordado
todos estos problemas, tratando de simplificar el proceso de aprendizaje automático
en el escenario actual. En primer lugar, se realiza un análisis de complejidad para
observar cómo influye ésta en la tarea de clasificación1 y si es posible que la aplicación
de un proceso previo de selección de características reduzca esta complejidad.
Luego, se aborda el proceso de simplificación de la fase de aprendizaje automático
mediante la filosofía divide y vencerás, usando un enfoque distribuido. A continuación,
aplicamos esa misma filosofía sobre el proceso de selección de características.
Finalmente, optamos por un enfoque diferente siguiendo la filosofía del Edge Computing,
la cual permite que los datos producidos por los dispositivos del Internet de
las cosas se procesen más cerca de donde se crearon. Los enfoques propuestos han
demostrado su capacidad para reducir la complejidad de los métodos de aprendizaje
automático tnidicionales y, por lo tanto, se espera que la contribución de esta
tesis abra las puertas al desarrollo de nuevos métodos de aprendizaje máquina más
simples, más robustos, y más eficientes computacionalmente.[Abstract]
The advent of Big Data and the explosion of the Internet of Things, has brought
unprecedented challenges to Machine Learning researchers, making the learning task
more complexo Real-world machine learning problems usually have inherent complexities,
such as the intrinsic characteristics of the data, large number of instauces,
high input dimensionality, dataset shift, etc. AH these aspects matter, and can
fOI new models that can confront these situations. Thus, in this thesis, we have
addressed aH these issues) simplifying the machine learning process in the current
scenario. First, we carry out a complexity analysis to see how it inftuences the
classification models, and if it is possible that feature selection might result in a
deerease of that eomplexity. Then, we address the proeess of simplifying learning
with the divide-and-conquer philosophy of the distributed approaeh. Later, we aim
to reduce the complexity of the feature seleetion preprocessing through the same
philosophy. FinallYl we opt for a different approaeh following the eurrent philosophy
Edge eomputing, whieh allows the data produeed by Internet of Things deviees
to be proeessed closer to where they were ereated. The proposed approaehes have
demonstrated their eapability to reduce the complexity of traditional maehine learning
algorithms, and thus it is expeeted that the eontribution of this thesis will open
the doors to the development of new maehine learning methods that are simpler,
more robust, and more eomputationally efficient
Imagining thre future in a difficult present: storylines from spanish youth
This book investigates and explores the complex dynamics of youth in contemporary society, especially in troubled and crisis-ridden contexts. On the one hand, teenagers and young adults experience social suffering, marginalisation, gender and ethnic bias, and an increased risk to be radicalised and involved in extremism and related violence. On the other hand, it is shown that young people are resilient, and they have a remarkable ability to adapt and cope with extremely difficult situations.2017-1
Reduced precision discretization based on information theory
[Abstract]:In recent years, new technological areas have emerged and proliferated, such as the Internet of Things or embedded systems in drones, which are usually characterized by making use of devices with strict requirements of weight, size, cost and power consumption. As a consequence, there has been a growing interest in the implementation of machine learning algorithms with reduced precision that can be embedded in these constrained devices. These algorithms cover not only learning, but they can also be applied to other stages such as feature selection or data discretization. In this work we study the behavior of the Minimum Description Length Principle (MDLP) discretizer, proposed by Fayyad and Irani, when reduced precision is used, and how much it affects to a typical machine learning pipeline. Experimental results show that the use of fixed-point format is sufficient to achieve performances similar to those obtained when using double-precision format, which opens the door to the use of reduced-precision discretizers in embedded systems, minimizing energy consumption and carbon emissions.Ministerio de Ciencia e Innovación; PID2019-109238GB-C2Xunta de Galicia; ED431C 2018/34Secretaría Xeral de Universidades; ED431G 2019/01Fundación BBVA; Ayudas a Equipos de Investigación Científica 201
How Important Is Data Quality? Best Classifiers vs Best Features
Financiado para publicación en acceso aberto: Universidade da Coruña/CISUG[Abstract] The task of choosing the appropriate classifier for a given scenario is not an easy-to-solve question. First, there is an increasingly high number of algorithms available belonging to different families. And also there is a lack of methodologies that can help on recommending in advance a given family of algorithms for a certain type of datasets. Besides, most of these classification algorithms exhibit a degradation in the performance when faced with datasets containing irrelevant and/or redundant features. In this work we analyze the impact of feature selection in classification over several synthetic and real datasets. The experimental results obtained show that the significance of selecting a classifier decreases after applying an appropriate preprocessing step and, not only this alleviates the choice, but it also improves the results in almost all the datasets tested.This work has been supported by the National Plan for Scientific and Technical Research and Innovation of the Spanish Government (Grant PID2019-109238 GB-C2), and by the Xunta de Galicia (Grant ED431C 2018/34) with the European Union ERDF funds. CITIC, as Research Center accredited by Galician University System, is funded by “Consellería de Cultura, Educación e Universidades from Xunta de Galicia”, supported in an 80% through ERDF Funds, ERDF Operational Programme Galicia 2014–2020, and the remaining 20% by “Secretaría Xeral de Universidades” (Grant ED431G 2019/01). Funding for open access charge: Universidade da Coruña/CISUGXunta de Galicia; ED431C 2018/34Xunta de Galicia; ED431G 2019/0
Low-Precision Feature Selection on Microarray Data: An Information Theoretic Approach
Financiado para publicación en acceso aberto: Universidade da Coruña/CISUG[Abstract] The number of interconnected devices, such as personal wearables, cars, and smart-homes, surrounding us every day has recently increased. The Internet of Things devices monitor many processes, and have the capacity of using machine learning models for pattern recognition, and even making decisions, with the added advantage of diminishing network congestion by allowing computations near to the data sources. The main restriction is the low computation capacity of these devices. Thus, machine learning algorithms capable of maintaining accuracy while using mechanisms that exploit certain characteristics, such as low-precision versions, are needed. In this paper, low-precision mutual information-based feature selection algorithms are employed over DNA microarray datasets, showing that 16-bit and some times even 8-bit representations of these algorithms can be used without significant variations in the final classification results achieved.This work has been supported by the grant Machine Learning on the Edge - Ayudas Fundación BBVA a Equipos de Investigación Científica 2019. It has also been possible thanks to the support received by the National Plan for Scientific and Technical Research and Innovation of the Spanish Government (Grant PID2019-109238GB-C2), and by the Xunta de Galicia (Grant ED431C 2018/34) with the European Union ERDF funds. CITIC, as Research Center accredited by Galician University System, is funded by “Consellería de Cultura, Educación e Universidades from Xunta de Galicia”, supported in an 80% through ERDF Funds, ERDF Operational Programme Galicia 2014-2020, and the remaining 20% by “Secretaría Xeral de Universidades” (Grant ED431G 2019/01). Open Access funding provided thanks to the CRUE-CSIC agreement with Springer NatureXunta de Galicia; ED431C 2018/34Xunta de Galicia; ED431G 2019/0
Encontrar la cultura: estrategias de indagación para el análisis sociopolítico
El objetivo de este artículo es profundizar en los modos de investigar la cultura y el discurso público. Para lograrlo, la primera parte del texto está dedicada a situar los discursos y prácticas en el seno de una concepción amplia de cultura. Se trata de una concepción que, más allá del giro cultural, se centra en la cultura en acción, así como en el diálogo dinámico entre la estructura y la acción. Con el fin de avanzar en una propuesta metodológica, se analizan cuatro trabajos que proponen estrategias diferenciadas para hacer operativo el concepto de cultura.This paper is intended to explore modes of inquiry into culture and public discourse. To this end, the first part of the paper is devoted to situating discourses and practices within a broad notion of culture, a notion which goes beyond the cultural turn and focuses on culture in action, as well as on the dynamic dialogue between structure and action. In order to advance in a methodological proposal, the paper examines four different studies that propose differentiated strategies for making the concept of culture operational.O objetivo deste artigo é aprofundar nos modos de pesquisar a cultura e o discurso público. Para atingi-lo, a primeira parte do texto está dedicada a situar os discursos e práticas no seio de uma concepção ampla de cultura. Trata-se de uma concepção que, mais além do giro cultural, se centra na cultura em ação, bem como no diálogo dinâmico entre a estrutura e a ação. A fim de avançar numa proposta metodológica, analisam-se quatro trabalhos que propõem estratégias diferenciadas para fazer operativo o conceito de cultura
Assessment of Rights-Related Personal Outcomes in Young People with Intellectual Disability and Autism Spectrum Disorder
Despite the great importance of the quality of life concept in the intellectual disability (ID) field, literature about its application to youth with autism spectrum disorder (ASD) is scarce, especially for the rights domain, an area that has become particularly important after the ratification of the Convention on the Rights of Persons with Disabilities. This study focuses on assessing the rights of youth with ASD and ID and comparing their results obtained by people with ID and other associated conditions: Down syndrome and cerebral palsy. The Rights subscale from the field-test version of the KidsLife Scale was administered in a sample composed of 153 participants with ID aged from 4 to 21 years old (ASD = 51; Down syndrome = 51; cerebral palsy = 51). The variables gender, type of schooling, level of ID and level of support needs were significant for the group with ASD. The three groups showed positive outcomes, though youth with Down syndrome obtained statistically significant higher scores than participants with ASD.Aun teniendo gran relevancia el concepto de calidad de vida en el ámbito de la discapacidad intelectual (DI), existe escasa investigación acerca de su aplicación en jóvenes con trastorno del espectro del autismo (TEA), especialmente acerca de la dimensión derechos, área que ha cobrado especial importancia en los últimos años con la ratificación de la Convención de los Derechos de las Personas con Discapacidad de Naciones Unidas. Este estudio se centra en la evaluación de derechos en jóvenes con TEA y DI, comparando sus resultados con dos grupos de jóvenes que presentan DI y otra condición comórbida: síndrome de Down y parálisis cerebral. Para ello, se utilizó la subescala derechos de la versión piloto de la Escala KidsLife en una muestra de 153 participantes con DI entre 4 y 21 años (TEA = 51; síndrome de Down = 51; parálisis cerebral = 51). En el grupo con TEA, el género, el tipo de escolarización, el nivel de DI y de necesidades de apoyo dieron lugar a diferencias significativas. Los tres grupos obtuvieron resultados positivos, aunque los jóvenes con síndrome de Down obtienen resultados significativamente superiores a los obtenidos por jóvenes con TEA
Los docentes que no han dejado de ser alumnos. Retos y experiencias en dos medios diferentes: online vs presencial
En este trabajo presentamos cómo ha sido nuestra primera experiencia docente en dos marcos distintos: por un lado en una asignatura presencial del Grado de Informática de la Universidade da Coruña y por el otro en una asignatura online en el Máster Universitario en Investigación en Inteligencia Artificial de la Universidad Internacional Menéndez Pelayo. La experiencia de impartir simultáneamente ambas asignaturas nos ha permitido conocer las diferencias entre estos dos tipos de enseñanza. Nuestra intención es poner de manifiesto cómo hemos solventado los retos que nos plantearon las dos asignaturas, a fin de que el lector pueda servirse de nuestras breves pero intensas peripecias docentes.In this work, we describe our first teaching experience in two different areas: a face-to-face subject in the Computer Science Degree of the University of A Coruña and an online subject in the Research Master’s Degree in Artificial Intelligence of the Menéndez Pelayo International University. The experience of teaching both subjects simultaneously has allowed us to know the differences between both areas. We want to show how we solved the challenges posed by these two subjects with the aim that the reader can use our brief but intense teaching adventures
Transitar a la intemperie: jóvenes en busca de integración
Depto. de Sociología AplicadaFac. de Ciencias Políticas y SociologíaTRUEpu
- …