Search CORE

77 research outputs found

IMPLEMENTACIÓN DE UN SISTEMA BASADO EN ALGORITMOS COMPUTACIONALES COMO AYUDA A LOS PROCESOS PROFESIONALES EN EL MINISTERIO DE TRANSPORTES Y COMUNICACIONES - LIMA,2018

Author: Cubas Guevara Rubén Alberto
Publication venue: 'Universidad Senor de Sipan SAC'
Publication date: 01/01/2020
Field of study

El objetivo de la presente tesis es implementar un algoritmo computacional para ayudar a los proceso de selección profesional en el Ministerio de Transportes y Comunicaciones del Perú-MTC La tarea clave fue conformar las relaciones que hay entre evaluador y postulante empleando modelos basados en contenido. Para ellos se representó las relaciones de manera gráfica que permitieron conjuntar esa representación mediante una red bayesiana, conformados por atributos y una variable clase. Los procesos de selección de profesional en el Ministerio de Transporte y Comunicaciones-MTC fueron implementados en un sistema aplicando la metodología de desarrollo de basado en Prototipos Se definió un algoritmo computacional, que permita evaluar a los postulantes de una convocatoria para selección de personal basado en resultados históricos de sus evaluaciones. La implementación de un sistema utilizando el Algoritmo Bayesiano TAN en los procesos de selección tiene un promedio de precisión de 79.33% y exactitud de 70.33%. También se observó que el tiempo promedio en dichos procesos de selección disminuye con la implementación de un sistema utilizando el algoritmo bayesiana Tan de 124.17 minutos a 23.76 minutos.Tesi

Repositorio institucional - Universidad Señor de Sipán

Diseño de sistemas de detección de intrusión en redes definidas por software: revisión basada en machine learning

Author: Becci Graciela
Marrone Luis
Morandi Miguel
Publication venue
Publication date: 03/08/2021
Field of study

El paradigma de Redes Definidas por Software SDN propone el control centralizado de la red, desacoplando los dispositivos de enrutamiento e independizando la red del software propietario. Esto ofrece la ventaja al controlador de tener una visión integral de la topología, y flexibilidad para generar reglas que gobiernen el comportamiento de toda la red. No obstante en una red SDN se agrega el desafío a la seguridad debido a su naturaleza distribuida: cada nodo es un punto de vulnerabilidad, y el controlador es pasible de ataques del tipo man-in-the-middle, en su conexión con el plano de aplicaciones, y con el plano de datos de los enrutadores. En seguridad de redes una de las herramientas básicas es el Sistema de Detección de Intrusión IDS, siendo la detección de amenazas un problema doble: identificación de datos sospechosos, y clasificación del flujo en normal o anómalo. Para aportar al diseño de un IDS es que en este artículo se presenta un resumen de los tipos de IDS con aplicabilidad en SDN y con el enfoque de Machine Learning, para dotar al IDS de inteligencia, mejorando la performance, y aprovechando las características de programabilidad del controlador SDN.Sociedad Argentina de Informática e Investigación Operativ

Servicio de Difusión de la Creación Intelectual

Mejora de la efectividad de la clasificación en la plataforma WEKA en base al uso de métodos de remuestreo sobre la distribución de clases óptima

Author: Arostegui Carrasco Asier
Publication venue
Publication date: 17/09/2021
Field of study

Los problemas de clasificación de bases de datos desbalanceadas constituyen un paradigma específico dentro del Machine Learning que ha sido ampliamente estudiado en los últimos años y que puede ser abordado desde distintos puntos de vista. Hay distintos tipos de aproximaciones a este problema: las más comúnmente encontradas en literatura son aquellas de tipo algorítmico, las de selección de atributos (features) y las de tratamiento de datos o remuestreo. La ventaja de las aproximaciones de tratamiento de datos es que son versátiles y pueden aplicarse a cualquier tipo de algoritmo y se basan en la aplicación de un remuestreo de las instancias disponibles para tratar de balancear la clase minoritaria, con una aproximación clásica de rebalanceo al 50%. Este trabajo plantea un doble objetivo: por un lado, extender análisis empíricos previos que muestran que la distribución óptima no tiene por qué ser la del 50% que plantearon las primeras hipótesis y que dependerá del tipo de problema o conjunto de datos a estudiar, del tipo de clasificador elegido, del tipo de algoritmo de remuestreo aplicado y de la métrica que se defina para la evaluación del clasificador, lo que se refiere típicamente como dependencia del contexto. Del análisis de resultados, se comprobará si alguna de las variables de contexto obtiene un mejor desempeño que otra sobre el universo de análisis considerado. Por otro lado, se pretende poner a disposición de la comunidad un módulo sobre la plataforma WEKA que permita, no sólo automatizar el procedimiento para replicar el estudio, sino poder aplicar esta implementación de manera general para encontrar una distribución óptima para un contexto determinado, es decir, para un problema de clasificación, un método de remuestreo, un algoritmo de clasificación y una métrica de evaluación concreta que pueda definir el usuario

Archivo Digital para la Docencia y la Investigación

Creación e implementación de un clasificador suave para estimar la aprobación de materias de los estudiantes del instituto de ciencias Matemáticas de la ESPOL

Author: Chang Aguilar Miguel Angel
Publication venue
Publication date: 01/01/2007
Field of study

La planificación de actividades es una disciplina que une lo estratégico a lo operativo ó una herramienta de conjunción en la operación que podría ubicarse en el nivel táctico de trabajo, por lo tanto un tema muy importante y aplicable a la mayoría de instituciones educativas debiera ser determinar la demanda para los cursos que se van a planificar en un periodo futuro de actividades, siempre y cuando se trabaje bajo el esquema sobre demanda y no sobre un determinado grupo fijo de materias para aprobar el periodo académico

Escuela Superior Politecnica del Litoral

Análisis de técnicas de aprendizaje automático en el sector de la viticultura

Author: Martín Gallo Carmen
Publication venue
Publication date: 01/01/2022
Field of study

Este Trabajo Fin de Grado ofrece contribuciones relevantes al estado del arte de la investigación relacionada con la tecnología en el sector de la viticultura. En primer lugar, se presenta una exhaustiva visión de las técnicas de Inteligencia Artificial empleadas en los últimos años en el ámbito de la vinificación a partir del estudio de artículos que inciden en las técnicas empleadas y cómo estas ayudan a mejorar diversos aspectos, como puede ser la calidad del vino o incluso factores relacionados con la producción o cantidad del vino producido. A partir de estos datos, podemos ofrecer un recorrido documentado sobre las inclinaciones actuales de emplear este gran recurso, la Inteligencia Artificial. Este estudio se centra en las técnicas de Aprendizaje Automático que se pueden integrar en la gestión y procesos de vinificación de viñedos actuales para brindar resultados relevantes y útiles para la industria. Por otra parte, el segundo componente del trabajo destaca la importancia de las Bases de Datos empleadas, ofreciendo ejemplos y unas breves pinceladas sobre características importantes que influyen a la hora de afrontar un estudio con muestras de vino. Este documento concluye ofreciendo una interpretación de las nuevas tendencias que se adoptarán en el futuro cercano para mejorar un sector enormemente influyente en nuestro país y a nivel mundial.This Final Project offers relevant contributions to the state of the art’s research related to technology in the viticulture sector. On the one hand, an exhaustive vision of Artificial Intelligence techniques used in recent years in the field of winemaking is presented. In order to meet that goal, the study of articles that affect the techniques used and how they help to improve various aspects -such as wine quality or factors related to the production or quantity of the wine produced- are used. From these data, we can offer a documented tour of the current inclinations to use this great resource, Artificial Intelligence. This study focuses on Machine Learning techniques that can be integrated into current vineyard management and winemaking processes to deliver industry-relevant and useful results. On the other hand, the second component of the current work highlights the importance of the databases used, offering examples and a few brief notes on important characteristics that influence when facing a study with wine samples. This document concludes offering an interpretation of the new trends that will be adopted in the near future to improve a greatly influential sector in our country.Departamento de Teoría de la Señal y Comunicaciones e Ingeniería TelemáticaGrado en Ingeniería de Tecnologías de Telecomunicació

Repositorio Documental de la Universidad de Valladolid

Elementos de ingeniería de explotación de la información aplicados a la investigación tributaria fiscal

Author: López-Pablos Rodrigo
Publication venue
Publication date: 09/09/2013
Field of study

Introduciendo elementos de ingeniería de explotación de la información al análisis tributario, a partir de herramental y conceptos computacionales avanzados de inteligencia artificial, en un enfoque epistemológico pragmático, se aborda la problemática del delito contra la hacienda pública. Mediante una aproximación empírica hipotética para un caso simulado, se aplican algoritmos de inducción, redes neuronales y redes bayesianas para determinar la factibilidad de su aplicación heurística en la administración pública fiscal. Distintas estrategias son exploradas para facilitar la labor local y regional del investigador tributario federal; esta vez, a partir de un enfoque computacionalmente limitado, pero igualmente eficaz para el experto en ciencias económicas avocado a la tarea de la investigación tributaria artesanal.Apresentando a introdução de elementos de exploração de informações para análise fiscal, por meio de software de mineração de dados e conceitos avançados computacionais de inteligência artificial, foi abordado o problema do crime de sonegador fiscal contra o patrimônio público. Através de uma abordagem empírica a partir de um caso hipotético de uso, os algoritmos de indução, redes neurais e redes bayesianas são aplicados para determinar a viabilidade de sua aplicação heurística pelo administrador público tributário. Diferentes estratégias são exploradas para facilitar o trabalho dos inspectores tributários federais locais e regionais, tendo em conta as suas capacidades computacionais limitados, mas igualmente eficaz para aqueles cientista social comprometido com a investigação fiscal.Trabajo de investigación en Ciencias Económicas y Ciencias Informáticas, parte del mismo correspondiente al Proyecto de Investigación de Posgrado EISI-MISI de la Universidad Tecnológica Nacional así como del Doctorado en Ciencias Económicas de la Escuela de Posgrado de la Universidad Nacional de La Matanza. Este trabajo puede citarse como: Cita 1: LÓPEZ-PABLOS, Rodrigo [2013], «Elementos de ingeniería en explotación de la información aplicados a la investigación tributaria fiscal», Trabajo de investigación, DCE-UNLM, Septiembre, La Matanza. Cita 2: LÓPEZ-PABLOS, Rodrigo [2013], «Elementos de ingeniería en explotación de la información aplicados a la investigación tributaria fiscal», Trabajo de investigación, EISI-MISI, UTN, Septiembre, Argentina.Facultad de Ciencias Económica

Servicio de Difusión de la Creación Intelectual

Minería de textos y análisis de sentimientos en sanidadysalud.com

Author: Rincón García Sergio
Publication venue: Facultad de Estudios Estadísticos (UCM)
Publication date: 01/01/2016
Field of study

Fac. de Estudios EstadísticosTRUEpu

Docta Complutense

Automatic classification of public procurement contracts

Author: Ruiz Salmón Julia
Publication venue
Publication date: 01/01/2019
Field of study

RESUMEN: Este proyecto tiene como objetivo el desarrollo de un producto software que permita realizar una clasificación automática, con la máxima precisión posible, del mayor número de contratos públicos del Gobierno de Cantabria, en relación a unas dimensiones predefinidas: Naturaleza del gasto y Objeto de administración. La fuente de datos contiene una serie de textos descriptivos de los contratos de los años 2014-2015 y la clase correspondiente a la que pertenece el contrato según la dimensión. Los textos constan de diferente vocabulario que describe las solicitudes de contrato. Gran parte de este vocabulario, e incluso simbología, carece de significado a la hora de clasificar los contratos en las diferentes clases. Por lo tanto, el propósito de este proyecto es aplicar diversas técnicas de preprocesado de los datos de entrada para eliminar el vocabulario irrelevante de los textos y conseguir que contengan únicamente el vocabulario necesario y relevante con respecto a la categoría de clasificación. El tamaño variable y la estructura sin formato de los textos no son procesables por los algoritmos de clasificación. Así, el siguiente paso es convertir los textos en vectores de características numéricas a través del cálculo del term frequency-inverse document frequency (tf-idf). Por último, se aplican diferentes algoritmos de clasificación pertenecientes al aprendizaje supervisado: regresión logística, máquinas de vector soporte (SVM), árboles de decision, Random Forest y el clasificador Naive Bayes. Los resultados se analizan a través de tres métricas diferentes (accuracy, matriz de confusión, precision y recall), que muestran diversas conclusiones para cada uno de los clasificadores empleados.ABSTRACT: The aim of this project is to develop a software product that is able to classify automatically, with the highest possible accuracy, the largest number of public procurement contracts from the Government of Cantabria, in relation to predefined dimensions: Naturaleza del gasto y Objeto de administración. Available data contains a text collection describing public procurement contracts from 2014 and 2015, and the corresponding category to which the contract belongs according to the dimension. Texts consist of different vocabulary that describes the contract. Most of words and symbology do not provide relevant information to classify the contracts into different categories. Therefore, the purpose of this project is to apply several data preprocesssing techniques to take out irrelevant vocabulary from the texts and to exclusively obtain the necessary and important words regarding the category of classification. The variable size and unformatted structure of the texts are not actionable by the algorithms. Thus, the next step is to convert the texts into numerical characteristics vectors through the term frequency-inverse document frequency (tf-idf). Finally, some supervised learning algorithms are applied: logistic regression, support vector machines (SVM), decision trees, Random Forest and Naive Bayes classifier. Results are analysed using three metrics (accuracy, confusion matrix, precision and recall), showing relevant conclusions for each of the classifiers employed.Máster en Ciencia de Dato

LAReferencia - Red Federada de Repositorios Institucionales de Publicaciones Científicas Latinoamericanas

UCrea

Aplicación de técnicas de minería de datos En accidentes de tráfico

Author: Hassinger Rodriguez Mark Mirko
Publication venue: 'Universitat Politecnica de Valencia'
Publication date: 02/06/2016
Field of study

[EN] Nowadays traffic accidents represent a global problem being the eleventh cause of death in the world and it is believed that it will take the third place in 2020. Every year more than 1 million of people die in accidents, including drivers, pedestrians, cyclists, motorcyclists and users of public transportation, besides of thousands of people who get permanently disability. For these, one of the main strategies set out in the road safety plans is the reduction of the economic impact and the public health problems. One of the key factors for achieving this goal is the improvement of road safety. For these reasons, this master thesis discusses in depth these road accidents. There are different approaches to carry out the study of traffic accidents. This analysis is conducted in terms of the severity of their consequences. Currently many researchers have begun to use techniques in the data mining field. These techniques allow to extract knowledge of previously unknown data, and usually are not based on assumptions not even require prior knowledge of the probabilistic problem under study. Different techniques have been used to perform these studies. Particularly Decision Trees are a mining data technique very appropriate for the study of traffic accidents for different reasons: they can be easily interpreted, they can work with large amounts of data, they provide a highly effective structure which allows to estimate the options and investigate the possible consequences and the probability of occurrence and then select one of them, and above all, allow to discover interactions between data. It is remarkable that this technique allows the extraction of "if-then" kind decision rules, which are used to discover patterns of behavior that occur within a data set. These patterns are vital because they help us to understand the event of an accident, as well as identifying the main variables that determine its severity. Therefore in this thesis master different data mining techniques are used to obtain these patterns. There are some similar studies which analyze the severity of the accidents; however they have to be performed independently because of the heterogeneity of the roads´ characteristics, the environment and other elements that are related to accidents. In this work, data traffic accidents in the UK and Queensland (Australia) were used. According to the results obtained, it can be concluded that the Decision Tree are a useful tool to analyze traffic identifying the variables most relevant in the severity of the accident. Besides, the extraction of decision rules help us to discover patterns that are of vital interest to analysts and managers of road safety, and from these they can make concrete plans in order to reduce the socio-economic impact caused by traffic accidents.[ES] Actualmente los accidentes de tráfico representan un problema mundial, siendo la undécima causa de muerte en el mundo y se estima que en el año 2020 será la tercera. Todos los años mueren más de 1 millón de personas a causa de estos accidentes, entre conductores, peatones, ciclistas, motociclistas y usuarios del transporte público, además de miles de personas que resultan con discapacidades permanentes. Por tales motivos, reducir el impacto económico y los problemas de salud pública sigue siendo una de las prioridades estratégicas planteadas en los planes de seguridad vial. Uno de los factores clave para alcanzar este objetivo radica en el mejoramiento de la seguridad vial en las carreteras. Por dichas razones, en esta tesis de máster se analiza en profundidad la accidentalidad de estas carreteras. Existen diferentes enfoques para llevar a cabo el estudio de los accidentes de tráfico. Este estudio se realiza en términos de la gravedad de sus consecuencias. En la actualidad numerosos investigadores han comenzado a utilizar técnicas que se encuentran dentro del campo de la Minería de Datos. Estas técnicas permiten extraer conocimiento de datos previamente desconocidos, y normalmente, no parten de hipótesis ni requieren un previo conocimiento probabilístico del problema objeto de estudio. Para realizar estos estudios, se han aplicado diferentes técnicas, pero, particularmente, los Árboles de Decisión son una técnica de Minería de Datos muy apropiada para el estudio de los accidentes de tráfico, por diferentes razones: son fácilmente interpretables, pueden trabajar con grandes volúmenes de datos, provee una estructura sumamente efectiva dentro la cual se puede estimar cuales son las opciones e investigar las posibles consecuencias, y la probabilidad de que suceda, de seleccionar cada una de ellas, y sobre todo, permiten descubrir interacciones entre los datos. Un aspecto relevante, es que esta técnica permite la extracción de Reglas de Decisión del tipo "si-entonces", que son utilizadas para descubrir patrones de comportamientos que ocurren dentro de un conjunto de datos. Estos patrones son de vital importancia, ya que nos ayudan a la comprensión del suceso de un accidente, así como a la identificación de las principales variables que determinan su gravedad. Por ello en esta tesis de máster se utilizan diferentes técnicas de minería de datos con el fin de obtener estos patrones. Existen algunos estudios similares, donde se analiza la severidad de los accidentes, pero debido a la heterogeneidad de las características de las carreteras, medio ambiente y otros elementos que están relacionados con los accidentes, los estudios se tienen que realizar de forma independiente. En este caso, se utilizan datos de accidentes de tráfico ocurridos en el Reino Unido y en Queensland (Australia). Con los resultados obtenidos, se puede concluir que los Árboles de Decisión son una herramienta idónea para analizar los accidentes de tráfico, ya que permiten identificar las variables con mayor relevancia en la gravedad del accidente, y que la extracción de las Reglas de Decisión, nos ayudan a descubrir patrones que son de vital interés para los analistas y gestores de seguridad vial, para que posteriormente se puedan realizar planes concretos con el fin de reducir el impacto socio-económico causado por los accidentes de tráfico.Hassinger Rodriguez, MM. (2015). Aplicación de técnicas de minería de datos En accidentes de tráfico. http://hdl.handle.net/10251/65082Archivo delegad

RiuNet