579 research outputs found
GNUsmail: Open framework for on-line email classification
Real-time classification of massive email data is a challenging task that presents its own particular difficulties. Since email data presents an important temporal component, several problems arise: emails arrive continuously, and the criteria used to classify those emails can change, so the learning algorithms have to be able to deal with concept drift. Our problem is more general than spam detection, which has received much more attention in the literature.
In this paper we present GNUsmail, an open-source extensible framework for email classification, which structure supports incremental and on-line learning. This framework enables the incorporation of algorithms developed by other researchers, such as those included in WEKA and MOA. We evaluate this framework, characterized by two overlapping phases (pre-processing and learning), using the ENRON dataset, and we compare the results achieved by WEKA and MOA algorithms
Propuesta de gestión de inventario para reducir costos en el área lácteos - perecibles en el Supermercado Metro – Chiclayo, 2021
En la presente investigación titulada “Propuesta de gestión de inventario para
reducir costos en el área lácteos - perecibles en el Supermercado Metro – Chiclayo,
2021”, cuyo objetivo fue proponer una gestión de inventario para su reducción de
costos excesivos de inventario presentes mediante el método de clasificación ABC
en el área de lácteos de la división de perecibles del supermercado Metro, la
investigación fue de enfoque cuantitativo, no-experimental. Los resultados fueron
obtenidos a través de la recolección datos y entrevista, pudiendo identificar las
causas que generan las altas perdidas de inventario en el área de lácteos
mostrados en un diagrama de Ishikawa, matriz de Correlación y Pareto, obteniendo
12 causas de perdida de inventario en el área de lácteos, las cuales fueron 3 las
principales como son: Inventarios inexacto, Falta de rotulación en los productos con
alto riesgo de hurto y Falta de inventario rotativos. Se identificaron las herramientas
de gestión de inventario para reducir los costos y perdida de inventario las cuales
fueron la redistribución de productos en base a la clasificación ABC; capacitación a
los trabajadores que realizan los inventarios; Implementación del conteo mediante
la lectora del código de barras y la implementación de video vigilancia en lugares
donde se ubican los productos críticos
Combining different tracers (CFC-12, 3H, 3He, 4He) to understand the hydrogeological functioning of a semiconfined aquifer.
The hydrochemical results obtained in a semiconfined aquifer called Niebla-Posadas aquifer (S of Spain) show an increase in mineralisation and δ13C in the flow direction, suggesting increasing residence time in the aquifer. However, different agricultural contaminants associated with recently infiltrated waters appear in the confined section. The combination of different groundwater-age tracers (CFC-12, 3H, 3He, 4He) provides valuable information to understand the hydrogeological processes and water quality intending to achieve proper water supply management. The preliminary result of tracers suggests that samples may be a mixture of a majority of tritium-free old groundwater and a minor fraction of recently infiltrated water.Universidad de Málaga. Campus de Excelencia Internacional Andalucía Tech
Maximum likelihood methods and their application in neighbourhood models
Los métodos de máxima verosimilitud (MMV) ofrecen un marco alternativo a la estadística frecuentista convencional, alejándose del uso del p-valor para el rechazo de una única hipótesis nula y optando por el uso de las verosimilitudes para evaluar el grado de apoyo en los datos a un conjunto de hipótesis alternativas (o modelos) de interés para el investigador. Estos métodos han sido ampliamente aplicados en ecología en el marco de los modelos de vecindad. Dichos modelos usan una aproximación espacialmente explícita para describir procesos demográficos de plantas o procesos ecosistémicos en función de los atributos de los individuos vecinos. Se trata por tanto de modelos fenomenológicos cuya principal utilidad radica en funcionar como herramientas de síntesis de los múltiples mecanismos por los que las especies pueden interactuar e influenciar su entorno, proporcionando una medida del efecto per cápita de individuos de distintas características (ej. tamaño, especie, rasgos fisiológicos) sobre los procesos de interés. La gran ventaja de aplicar los MMV en el marco de los modelos de vecindad es que permite ajustar y comparar múltiples modelos que usen distintos atributos de los vecinos y/o formas funcionales para seleccionar aquel con mayor soporte empírico. De esta manera, cada modelo funcionará como un “experimento virtual” para responder preguntas relacionadas con la magnitud y extensión espacial de los efectos de distintas especies coexistentes, y extraer conclusiones sobre posibles implicaciones para el funcionamiento de comunidades y ecosistemas. Este trabajo sintetiza las técnicas de implementación de los MMV y los modelos de vecindad en ecología terrestre, resumiendo su uso hasta la fecha y destacando nuevas líneas de aplicación.Maximum likelihood methods (MLM) offer an alternative framework to the traditional frequentist approach of data analysis, where the use of p-values to reject a single null (usually trivial) hypothesis is replaced by the use of likelihoods to evaluate the support in the data for a set of alternative working hypotheses of scientific relevance. These methods have been widely applied in the ecological framework of the neighbourhood models. These models use a spatially-explicit approach to describe demographic or ecosystem processes as a function of the attributes of neighbouring plants. They are therefore phenomenological models that serve as a tool of synthesis of the multiple mechanisms by which species can interact and modify its immediate environment, offering an estimate of the per-capita influence of individuals of different characteristics (e.g. size, species, functional traits) on the processes of study. A fundamental advantage of applying MMV in the framework of the neighbourhood models is that it allows fitting and comparing multiple models that use contrasting neighbour attributes and/or functional forms to select the one with the largest empirical support. In this way, each model works as a “virtual experiment” to answer questions related with the magnitude and spatial extent of the effects of different coexisting species and their potential implications for the function of communities and ecosystems. This paper reviews the use of MMV and neighborhood models in terrestrial ecology, synthesizing the state of the art and emphasizing new avenues of application
Analysis of Stratosphere-troposphere exchange processes associated to the Northern Subtropical Jet Stream
Informe técnico que recoge la contribución del INM y el INTA al proyecto TRACAS (Transport of Chemical species Across the Subtropical
tropopause) (ENV4-CT97-0546).An intensive campaign of 41 ozonesoundings was conducted from
February 1st to April 23rd 1999 at Tenerife (28ºN, 16ºW). The Subtropical
Jet Stream (STJ) is located close to the Canary Islands in this period. A
case analysis (March 25th and 26th) is presented to describe in detail the
STE processes associated to the STJ, using both, meteorological analysis
and information provided by the ozone soundings. Ozone sonde
statistical analysis assess the significant role played by the STJ in the
intrusions of subtropical upper tropospheric air masses into the midlatitude
lower stratosphere
Educational Data Mining for Personalized Prediction of Academic Performance
La Minería de Datos Educativos (Educational Data Mining - EDM) está adquiriendo gran importancia como un nuevo campo de investigación interdisciplinario relacionado con algunas otras áreas. Está directamente relacionado con los Sistemas Educativos basados en la Web (Web-based Educational Systems - WBES) y la Minería de Datos (Data Mining - DM), siendo esta última una parte fundamental del Descubrimiento de Conocimiento en Bases de Datos (Knowledge Discovery in Databases - KDD).
Los WBES almacenan y administran grandes cantidades de datos. Estos datos están creciendo cada vez más y contienen conocimientos ocultos que podrían ser muy útiles para los usuarios (tanto profesores como estudiantes). Es conveniente identificar tales conocimientos en forma de modelos, patrones o cualquier otro esquema de repre- sentación que permita una mejor explotación del sistema. La minería de datos se revela como la herramienta para lograr tal descubrimiento, dando lugar a la EDM. En este contexto complejo se suelen utilizar distintas técnicas y algoritmos de aprendizaje para obtener los mejores resultados.
En este trabajo se estudia, para una asignatura de Informática Teórica, concretamente la asignatura “Teoría de Autómatas y Lenguajes Formales”, cómo predecir el rendimiento académico alcanzado por los estudiantes, a partir de la realización de controles intermedios. Para ello se han aplicado y comparado distintos tipos de algoritmos de aprendizaje (vecinos más cercanos, árboles de decisión, multiclasificadores). Todo el proceso de control y evaluación de los estudiantes durante el curso se ha llevado a cabo a través de la herramienta web denominada SIETTE, desarrollada en nuestro departamento, y que además se utiliza en ámbitos fuera de nuestra propia universidad.Universidad de Málaga. Campus de Excelencia Internacional Andalucía Tech. Este trabajo ha sido parcialmente financiado por el I Plan Propio de Investigacion y Transferencia de la Universidad de Malaga
Autonomous location system based on propioceptive sensor fusion for mobile robots
El objetivo principal de este trabajo es desarrollar un sistema de localización autónomo capaz de entregar mejores estimaciones de posición en comparación a un sistema exclusivamente odométrico mediante un algoritmo de fusión sensorial. Un robot móvil recorre una trayectoria previamente programada para proporcionar datos sensoriales al sistema. Se define una arquitectura de fusión que trabaja con datos de odómetros, acelerómetros y giroscopio. El modelo de movimiento del robot, el modelo de medición y los datos sensoriales se fusionan empleando un filtro de Kalman extendido. Los resultados muestran que en todos los casos evaluados, el sistema registra una mejora del 38% en comparación a un sistema de localización determinístico estándar. Por otra parte, los datos revelan que la variable θ es la más influyente en el proceso. En conclusión, los resultados satisfacen el objetivo planteado, sin embargo, pueden ser mejorados incorporando sensores adicionales y ajustando las matrices de incertidumbre R y Q.The main objective of this study is to develop an autonomous localization system capable of delivering better position estimates compared to an exclusively odometer system by means of a sensor fusion algorithm. A mobile robot travels a pre-programmed path to provide sensory data to the system. A fusion architecture is define that works with odometers, accelerometers and gyroscope data. The robot movement model, the measurement model and the sensory data are using an Extended Kalman Filter. The results show that in all the cases that were evaluated the system records an improvement of 38% compared to a standard deterministic localization system. The data show that the θ variable is the most influential in the process. In conclusion, the results satisfy the stated objective, nevertheless, it can be improved by incorporating additional sensors and adjusting the uncertainty matrices R and Q
- …