6 research outputs found

    Revisión exploratoria de literatura científica en acuicultura: Análisis de tendencias utilizando un mocelo probabilístico bayesiano y herramientas de machine learning

    Get PDF
    {EN}Research in aquaculture develops fast as it has to respond to the significant growth of this industry; there are many biological challenges, technical improvements and technology developments that need to be addressed by researchers. Thousands of articles on aquaculture have been published, so it is laborious and time consuming to extract information from accumulated collections. The aim of this study was to understand the distribution patterns and trends of the literature available in the field of aquaculture in order to improve knowledge, nature and structure of these publications. This study performed a literature review of 38319 abstracts published in 14 top-tier aquaculture journals, between the years 1972 and 2019. A Latent Dirichlet Allocation (LDA) was applied to perform text mining on the dataset, finding 40 key topics. Machine learning tools were used in the subsequent distribution and composition of words. As result, we found that topic modeling has the ability to segregate a collection of articles on different topics, and could be used as a tool to understand literature, not only recapturing known facts but also discovering other relevant topics. In general, the topics found confirm key areas of aquaculture research that have been identified by qualitative studies. However in our case it also provides a quantitative evaluation and analysis in the most recent scientific literatur

    Contribuciones al análisis multivariante de datos ponderados geográficamente

    Get PDF
    [ES] Dentro de la estadística espacial hay una subárea particular denominada modelos ponderados geográficamente. Estos modelos se utilizan en situaciones donde la dependencia y la heterogeneidad espacial se convierte en el mayor foco de investigación. El paradigma de los modelos ponderados geográficamente es amplio y ha incluido una variedad de modelos entre los cuales tenemos la Regresión Ponderada Geográficamente, el Análisis de Componentes Principales Ponderados Geográficamente, el Análisis Discriminante Ponderado Geográficamente y el Análisis de Cluster Ponderado Geográficamente. En este trabajo se, ha realizado una exhaustiva revisión bibliográfica tanto de las técnicas estadísticas que se pueden utilizar para analizar datos ponderados geográficamente como de sus aplicaciones a las diferentes áreas científicas. También se ha revisado el software existente en la actualidad para llevar a cabo la aplicación de estos métodos y se ha desarrollado una herramienta en un entorno informático que permite la utilización de esas técnicas de una manera fácil, amigable y flexible. Para la revisión bibliográfica se propuso una novedosa metodología que fue implementada en una aplicación de código abierto llamada LDAShiny, que utiliza herramientas de aprendizaje automático y modelado de una manera interactiva y fácil de usar. Las matrices resultantes de la modelización de tópicos fueron analizadas mediante técnicas de Análisis Multivariante, en concreto mediante Escalamiento Multidimensional no métrico y HJ-Biplot. Tras la revisión de los programas informáticos que implementan los modelos ponderados geográficamente, se propuso una nueva herramienta de análisis, denominada GeoWeightedModel. Esta se presenta como una interfaz simple e intuitiva en donde los análisis se pueden realizar de forma interactiva (“apuntar y hacer clic”) en un navegador web. La aplicación GeoWeightedModel se utilizó para el análisis de datos reales que recogen información para explorar y visualizar la heterogeneidad espacial de las relaciones entre varias variables (a saber, datos sobre la mortalidad por cáncer de pulmón y bronquios y factores de riesgo a nivel de condados de EE.UU, y datos sobre resultados electorales en EE.UU). A partir de los resultados obtenidos, concluimos que la Regresión Ponderada Geográficamente fue la técnica con el mayor número de extensiones y publicaciones (a saber, 3183). Además, el uso de la metodología de revisión propuesta a través del programa LDAShiny, permitió identificar con éxito 22 tópicos de investigación que definen el estado actual de la investigación en el área de los modelos ponderados geográficamente. Los resultados del escalamiento multidimensional no métrico permitieron validar el etiquetado de los tópicos, al mostrar agrupaciones coherentes y superposición de nodos, lo que indica distribuciones de palabras similares. El HJ-Biplot permitió analizar y visualizar de manera sencilla la distribución por países de los tópicos encontrados. El análisis de datos reales mediante el programa propuesto GeoWeightedModel, puso de manifiesto que es una interesante herramienta para el análisis de datos ponderados geográficamente que no exige que los investigadores aplicados, como usuarios, tengan grandes conocimientos de programación y/o manejo de software. Con la interfaz gráfica desarrollada para el programa GeoWeightedModel se pudo demostrar que todas las acciones necesarias para el proceso de análisis de datos pueden ser accesibles para cualquier usuario, así como extensible a cualquier área de interés

    Trends and topics in geographically weighted regression research from 1996 to 2019

    Get PDF
    [EN]This research was conducted in order to improve the understanding of the struc-ture, contents, and trend of topics within the existing literature in the field of geographically weighted regression. Additionally, it intended to determine and produce a mapping of scientific networks in the domain of geographically weighted regression. The proposed methodology implements a combination of bibliometric techniques and modelling of topics in order to extract the latent top-ics from the collected literature by utilising latent Dirichlet allocation and a ma-chine learning tool. The results identified the most prolific authors, the most cited authors, the most representative articles and journals, and the countries which are responsible for the publication

    GeoWeightedModel : An R-Shiny package for Geographically Weighted Models

    Get PDF
    [EN]This paper describes GeoWeightedModel, a R package, which provides a graphical user friendly web application to perform techniques from a subarea of spatial Statistics known as Geographically Weighted (GW) models, such as Geographically Weighted Regression (GWR) and its extensions: Robust GWR, Generalized GWR, Heteroskedastic GWR, Mixed GWR, and “Scalable​ GWR), Geographically Weighted Principal Component Analysis, and Geographically Weighted Discriminant analysis. It also allows calculating a basic and robust Geographically weighted summary. The main goal of GeoWeightedModel package was to make the workflow easier to use, especially for those who are not familiar with the R environment. With GeoWeightedModel, analyses can be performed interactively (point-and-click way) in a web browser, making the applications easier for many more researchers. In addition with this tool, the results of the analyses can be mapped providing a valuable tool for exploring the spatial heterogeneity of the data

    Experimentación y validación técnico económica de refugios artificiales para la pesca de langosta panulirus argus (latreille, 1804) en la costa de la guajira.

    Get PDF
    Con el objetivo fundamental de validar nuevas tecnologías de extracción para la pesca de langosta Panulirus argus, en la costa del Departamento de la Guajira, mediante la implementación de refugios artificiales como una alternativa de producción respecto a los sistemas tradicionales de captura se efectúo la validación técnico económica de estas estructuras las cuales están constituidas por una placa de concreto (cemento, arena, gravilla y varilla) de 1.2 m de largo, 1.2 m de ancho y 3.5 cm de espesor montada sobre cuatro troncos de palmicho (Copernicea sanctamattae) de 10 a 12 cm de diámetro. Los refugios fueron distribuidos en ocho comunidades pero solo a tres (Las Delicias, Popoya y Mayapo) se le realizo el monitoreo. Este se realizó entre los meses de Agosto a Diciembre mediante la observación directa de los refugios sumergidos con la ayuda de equipos autónomos de buceo. A las capturas se les efectuó mediciones morfométricas, con el fin de determinar algunas de las relaciones biométricas y estimar las tallas promedios de captura. Los estimados de Captura por Unidad de Esfuerzo (CPUE) para la captura total fueron 7.53, 9.25 y 21.78 Kg/refugio para Las Delicias, Popoya y Mayapo, respectivamente y en este mismo orden para la CPUE comercial fue de 6.63, 2.17 y 7.84 kg/refugio. Se realizó una proyección económica que muestra la factibilidad de la utilización de refugios artificiales y esta indica que el proyecto es factible puesto que los indicadores económicos (VAN, TIR, C-B) obtenidos así lo demuestran

    LDAShiny: An R Package for Exploratory Review of Scientific Literature Based on a Bayesian Probabilistic Model and Machine Learning Tools

    Get PDF
    [EN]In this paper we propose an open source application called LDAShiny, which provides a graphical user interface to perform a review of scientific literature using the latent Dirichlet allocation algorithm and machine learning tools in an interactive and easy-to-use way. The procedures implemented are based on familiar approaches to modeling topics such as preprocessing, modeling, and postprocessing. The tool can be used by researchers or analysts who are not familiar with the R environment. We demonstrated the application by reviewing the literature published in the last three decades on the species Oreochromis niloticus. In total we reviewed 6196 abstracts of articles recorded in Scopus. LDAShiny allowed us to create the matrix of terms and documents. In the preprocessing phase it went from 530,143 unique terms to 3268. Thus, with the implemented options the number of unique terms was reduced, as well as the computational needs. The results showed that 14 topics were sufficient to describe the corpus of the example used in the demonstration. We also found that the general research topics on this species were related to growth performance, body weight, heavy metals, genetics and water quality, among others.FCT (Fundação para a Ciência e a Tecnologia)Centro 2020 program, Portugal2020, European UnionEuropean Regional Development Fun
    corecore