5 research outputs found

    Detección automática de plagio usando información sintáctica

    No full text
    La acción de plagiar consiste en utilizar, de manera parcial o total, el trabajo creativo de alguien más sin el debido reconocimiento a los autores de dicho trabajo. Se considera al plagio como una acción delictiva porque quién lo realiza busca obtener beneficios mediante la falsa atribución de la autoría del trabajo creativo. La detección automática de plagio de textos se puede realizar desde un enfoque intrínseco o un enfoque extrínseco. En el enfoque extrínseco se realiza una comparación directa entre un conjunto de textos para determinar cuáles han cometido plagio, mientras que en el enfoque intrínseco se realiza un análisis sobre el estilo de escritura presente en las diferentes secciones del texto para detectar aquellas que presenten un estilo marcadamente diferente y que se asume corresponden a un autor diferente. La atribución de autoría es un caso particular de detección de plagio intrínseco donde se busca determinar si un texto fue escrito por un autor o si fue escrito por alguien más. Para resolver el problema de atribución de autoría se cuenta con un conjunto de autores candidatos y de algunas muestras de textos escritos por ellos, mediante un análisis de las muestras se construye un modelo sobre el estilo de escritura de los autores candidatos así como la obtención del estilo presente en un texto de autoría desconocida, se busca asociar el texto de autoría desconocida necesariamente con alguno de los autores candidatos. En el problema de atribución de autoría se requiere de la construcción de un modelo sobre el estilo de escritura de un autor, es decir, la forma en que un autor utiliza el lenguaje escrito para expresar sus ideas. El estilo de escritura de un autor o simplemente el estilo de un autor se construye utilizando marcadores de estilo, los cuales hacen referencia a característica sobre el uso del lenguaje escrito que permite identificar y cuantificar hábitos del autor. En esta tesis se propone un método para la atribución de autoría cerrada (detección de plagio intrínseca) utilizando un enfoque de aprendizaje automático supervisado. Se proponen dos estrategias para modelar el estilo de un autor: la primer estrategia utiliza una representación distribuida a nivel de documentos (doc2vec) en la que se analiza el contexto de ocurrencia de las palabras y bigramas de palabras para obtener un modelo sobre el estilo de un autor, la segunda estrategia se basa en el uso de n-gramas sintácticos analizando las variante de n-gramas mixtos. El método propuesto se evaluó utilizando diferentes corpus reportados en la literatura para la atribución de autoría en los que se abarcan escenarios con distintos tipos de texto y con diferentes temáticas. Los resultados obtenidos utilizando una representación distribuida igualan o superan los resultados reportados en el estado del arte, mientras que el uso de n-gramas sintácticos demostró igualar la eficiencia obtenida en algunos corpus del estado del arte

    Compilación de un corpus paralelo español-inglés alineado a nivel de oraciones

    No full text
    Maestría en Ciencias de la Computació

    Energy-Efficient Industrial Internet of Things Software-Defined Network by Means of the Peano Fractal

    No full text
    The Industrial Internet of Things (IIoT) network generates great economic benefits in processes, system installation, maintenance, reliability, scalability, and interoperability. Wireless sensor networks (WSNs) allow the IIoT network to collect, process, and share data of different parameters among Industrial IoT sense Node (IISN). ESP8266 are IISNs connected to the Internet by means of a hub to share their information. In this article, a light-diffusion algorithm in WSN to connect all the IISNs is designed, based on the Peano fractal and swarm intelligence, i.e., without using a hub, simply sharing parameters with two adjacent IINSs, assuming that any IISN knows the parameters of the rest of these devices, even if they are not adjacent. We simulated the performance of our algorithm and compared it with other state-of-the-art protocols, finding that our proposal generates a longer lifetime of the IIoT network when few IISNs were connected. Thus, there is a saving-energy of approximately 5% but with 64 nodes there is a saving of more than 20%, because the IIoT network can grow in a 3 n way and the proposed topology does not impact in a linear way but log 3 , which balances energy consumption throughout the IIoT network

    Biomedical Signal Acquisition Using Sensors under the Paradigm of Parallel Computing

    No full text
    There are several pathologies attacking the central nervous system and diverse therapies for each specific disease. These therapies seek as far as possible to minimize or offset the consequences caused by these types of pathologies and disorders in the patient. Therefore, comprehensive neurological care has been performed by neurorehabilitation therapies, to improve the patients’ life quality and facilitating their performance in society. One way to know how the neurorehabilitation therapies contribute to help patients is by measuring changes in their brain activity by means of electroencephalograms (EEG). EEG data-processing applications have been used in neuroscience research to be highly computing- and data-intensive. Our proposal is an integrated system of Electroencephalographic, Electrocardiographic, Bioacoustic, and Digital Image Acquisition Analysis to provide neuroscience experts with tools to estimate the efficiency of a great variety of therapies. The three main axes of this proposal are: parallel or distributed capture, filtering and adaptation of biomedical signals, and synchronization in real epochs of sampling. Thus, the present proposal underlies a general system, whose main objective is to be a wireless benchmark in the field. In this way, this proposal could acquire and give some analysis tools for biomedical signals used for measuring brain interactions when it is stimulated by an external system during therapies, for example. Therefore, this system supports extreme environmental conditions, when necessary, which broadens the spectrum of its applications. In addition, in this proposal sensors could be added or eliminated depending on the needs of the research, generating a wide range of configuration limited by the number of CPU cores, i.e., the more biosensors, the more CPU cores will be required. To validate the proposed integrated system, it is used in a Dolphin-Assisted Therapy in patients with Infantile Cerebral Palsy and Obsessive–Compulsive Disorder, as well as with a neurotypical one. Event synchronization of sample periods helped isolate the same therapy stimulus and allowed it to be analyzed by tools such as the Power Spectrum or the Fractal Geometry
    corecore