38 research outputs found

    GPT Semantic Networking: A Dream of the Semantic Web – The Time is Now

    Get PDF
    The book presents research and practical implementations related to natural language processing (NLP) technologies based on the concept of artificial intelligence, generative AI, and the concept of Complex Networks aimed at creating Semantic Networks. The main principles of NLP, training models on large volumes of text data, new universal and multi-purpose language processing systems are presented. It is shown how the combination of NLP and Semantic Networks technologies opens up new horizons for text analysis, context understanding, the formation of domain models, causal networks, etc. This book presents methods for creating Semantic Networks based on prompt engineering. Practices are presented that will help build semantic networks capable of solving complex problems and making revolutionary changes in the analytical activity. The publication is intended for those who are going to use large language models for the construction and analysis of semantic networks in order to solve applied problems, in particular, in the field of decision making.У книзі представлені дослідження та практичні реалізації технологій обробки природної мови (НЛП), заснованих на концепції штучного інтелект, генеративний ШІ та концепція складних мереж, спрямована на створення семантичних мереж. Представлено основні принципи НЛП, моделі навчання на великих обсягах текстових даних, нові універсальні та багатоцільові системи обробки мови. Показано, як поєднання технологій NLP і семантичних мереж відкриває нові горизонти для аналізу тексту, розуміння контексту, формування моделей домену, причинно-наслідкових мереж тощо. У цій книзі представлені методи створення семантичних мереж на основі оперативного проектування. Представлені практики, які допоможуть побудувати семантичні мережі, здатні вирішувати складні проблеми та вносити революційні зміни в аналітичну діяльність. Видання розраховане на тих, хто збирається використовувати велику мову моделі побудови та аналізу семантичних мереж з метою вирішення прикладних задач, зокрема, у сфері прийняття рішень

    Geographic information extraction from texts

    Get PDF
    A large volume of unstructured texts, containing valuable geographic information, is available online. This information – provided implicitly or explicitly – is useful not only for scientific studies (e.g., spatial humanities) but also for many practical applications (e.g., geographic information retrieval). Although large progress has been achieved in geographic information extraction from texts, there are still unsolved challenges and issues, ranging from methods, systems, and data, to applications and privacy. Therefore, this workshop will provide a timely opportunity to discuss the recent advances, new ideas, and concepts but also identify research gaps in geographic information extraction

    Uncovering the Dynamic, Cognitive, and Linguistic Strategies of Misinformation

    Get PDF
    Les mentides, la manipulació o la informació falsa no són res de nou. Totes han existit durant segles des que el flux i el contingut de la informació ha estat una font de poder. Tot i això, a l'era de les plataformes socials, el mecanisme ha canviat. Si bé encara hi ha emissors d'informació institucionals, competeixen amb altres fonts d'informació que depenen de la viralitat a través de la xarxa per a la difusió d'informació. En aquesta competència, els continguts tradicionals i els creats institucionalment pateixen un desavantatge: no juguen amb les mateixes regles. El contingut que es desvia dels codis deontològics i estilístics dels proveïdors d'informació fiable aprofita diverses heurístiques psicològiques per tornar-se més viral. Per exemple, es basen en l'evocació emocional (llenguatge sentimental i apel·lació als valors morals) i es basen en estils que requereixen menys esforç cognitiu per ser processats (en termes de complexitat gramatical i lèxica). En aquesta tesi doctoral, exploro com les fonts de desinformació aprofiten les heurístiques psicològiques per definir les seves eleccions estratègiques. Més específicament, la tesi es compon de tres estudis: (1) Ús del processament del llenguatge natural per a una exploració quantitativa sobre com les diferents categories d'informació falsa (clickbait, teories de conspiració, fake news, discurs d'odi, pseudociència i rumors) difereixen en termes de sentiment, apel·lació a la moralitat, llegibilitat i diversitat lèxica; (2) Mitjançant anàlisis de xarxes i processament de llenguatge natural, una demostració d'estratègies d'isomorfisme de fonts d'informació falsa cap a fonts confiables amb l'objectiu d'imitar actors d'alt estatus a l'ecosistema d'informació; i (3) una anàlisi dinàmica de notícies falses versus fonts fiables que informen sobre la pandèmia de Covid durant 2020 i 2021. En general, els resultats indiquen que hi ha diferències estructurals significatives entre diferents categories d'informació falsa i entre fonts d'informació fiables (per exemple, les notícies falses són, de mitjana, 18 vegades més negatives, 12 vegades menys diverses lèxicament, un 50% més apel·lants a la moralitat i un 13% més fàcils de processar que les notícies fàctiques). A més, presento evidència sobre com les fake news, el clickbait i els rumors fan servir una estratègia d'imitació cap a fonts fiables amb l'objectiu de ser percebuts com a proveïdors d'informació legítims i d'alt estatus. A més, mostro com es van comportar les fonts de notícies fiables i falses durant la pandèmia de Covid, revelant una reacció inicial convulsa seguida d'una estratègia de desinformació per crear caos i ambigüitat en canviar constantment entre temes. Finalment, discuteixo les implicacions dels resultats de la tesi per a les plataformes de xarxes socials, l'ecosistema mediàtic, les elits polítiques i els usuaris d'Internet.Las mentiras, la manipulación o la información falsa no son nada nuevo. Todas han existido durante siglos desde que el flujo y el contenido de la información ha sido una fuente de poder. Sin embargo, en la era de las plataformas sociales, el mecanismo ha cambiado. Si bien los emisores de información institucionales aún existen, compiten con otras fuentes de información que dependen de la viralidad a través de la red para la difusión de información. En esta competencia, los contenidos tradicionales y los creados institucionalmente sufren una desventaja: no juegan con las mismas reglas. El contenido que se desvía de los códigos deontológicos y estilísticos de los proveedores de información confiable aprovecha diversas heurísticas psicológicas para volverse más viral. Por ejemplo, se basan en la evocación emocional (lenguaje sentimental y apelación a los valores morales) y se basan en estilos que requieren menos esfuerzo cognitivo para ser procesados (en términos de complejidad gramatical y léxica). En esta tesis doctoral, exploro cómo las fuentes de desinformación aprovechan las heurísticas psicológicas para definir sus elecciones estratégicas. Más específicamente, la tesis se compone de tres estudios: (1) Uso del procesamiento del lenguaje natural para una exploración cuantitativa sobre cómo las diferentes categorías de información falsa (clickbait, teorías de conspiración, fake news, discurso de odio, pseudociencia y rumores) difieren en términos de sentimiento, apelación a la moralidad, legibilidad y diversidad léxica; (2) Por medio de análisis de redes y procesamiento de lenguaje natural, una demostración de estrategias de isomorfismo de fuentes de información falsa hacia fuentes confiables con el objetivo de imitar a actores de alto estatus en el ecosistema de información; y (3) un análisis dinámico de noticias falsas versus fuentes confiables que informan sobre la pandemia de Covid durante 2020 y 2021. En general, mis resultados indican que existen diferencias estructurales significativas entre distintas categorías de información falsa y entre fuentes de información confiables (por ejemplo, las noticias falsas son, en promedio, 18 veces más negativas, 12 veces menos diversas léxicamente, un 50 % más apelantes a la moralidad y un 13 % más fáciles de procesar que las noticias fácticas). Además, presento evidencia sobre cómo las fake news, el clickbait y los rumores emplean una estrategia de imitación hacia fuentes confiables con el objetivo de ser percibidos como proveedores de información legítimos y de alto estatus. Además, muestro cómo se comportaron las fuentes de noticias confiables y falsas durante la pandemia de Covid, revelando una reacción inicial convulsa seguida de una estrategia de desinformación para crear caos y ambigüedad al cambiar constantemente entre temas. Finalmente, discuto las implicaciones de los resultados de la tesis para las plataformas de redes sociales, el ecosistema mediático, las élites políticas y los usuarios de Internet.Las mentiras, la manipulación o la información falsa no son nada nuevo. Todas han existido durante siglos desde que el flujo y el contenido de la información ha sido una fuente de poder. Sin embargo, en la era de las plataformas sociales, el mecanismo ha cambiado. Si bien los emisores de información institucionales aún existen, compiten con otras fuentes de información que dependen de la viralidad a través de la red para la difusión de información. En esta competencia, los contenidos tradicionales y los creados institucionalmente sufren una desventaja: no juegan con las mismas reglas. El contenido que se desvía de los códigos deontológicos y estilísticos de los proveedores de información confiable aprovecha diversas heurísticas psicológicas para volverse más viral. Por ejemplo, se basan en la evocación emocional (lenguaje sentimental y apelación a los valores morales) y se basan en estilos que requieren menos esfuerzo cognitivo para ser procesados (en términos de complejidad gramatical y léxica). En esta tesis doctoral, exploro cómo las fuentes de desinformación aprovechan las heurísticas psicológicas para definir sus elecciones estratégicas. Más específicamente, la tesis se compone de tres estudios: (1) Uso del procesamiento del lenguaje natural para una exploración cuantitativa sobre cómo las diferentes categorías de información falsa (clickbait, teorías de conspiración, fake news, discurso de odio, pseudociencia y rumores) difieren en términos de sentimiento, apelación a la moralidad, legibilidad y diversidad léxica; (2) Por medio de análisis de redes y procesamiento de lenguaje natural, una demostración de estrategias de isomorfismo de fuentes de información falsa hacia fuentes confiables con el objetivo de imitar a actores de alto estatus en el ecosistema de información; y (3) un análisis dinámico de noticias falsas versus fuentes confiables que informan sobre la pandemia de Covid durante 2020 y 2021. En general, mis resultados indican que existen diferencias estructurales significativas entre distintas categorías de información falsa y entre fuentes de información confiables (por ejemplo, las noticias falsas son, en promedio, 18 veces más negativas, 12 veces menos diversas léxicamente, un 50 % más apelantes a la moralidad y un 13 % más fáciles de procesar que las noticias fácticas). Además, presento evidencia sobre cómo las fake news, el clickbait y los rumores emplean una estrategia de imitación hacia fuentes confiables con el objetivo de ser percibidos como proveedores de información legítimos y de alto estatus. Además, muestro cómo se comportaron las fuentes de noticias confiables y falsas durante la pandemia de Covid, revelando una reacción inicial convulsa seguida de una estrategia de desinformación para crear caos y ambigüedad al cambiar constantemente entre temas. Finalmente, discuto las implicaciones de los resultados de la tesis para las plataformas de redes sociales, el ecosistema mediático, las élites políticas y los usuarios de Internet

    Handbook of Digital Face Manipulation and Detection

    Get PDF
    This open access book provides the first comprehensive collection of studies dealing with the hot topic of digital face manipulation such as DeepFakes, Face Morphing, or Reenactment. It combines the research fields of biometrics and media forensics including contributions from academia and industry. Appealing to a broad readership, introductory chapters provide a comprehensive overview of the topic, which address readers wishing to gain a brief overview of the state-of-the-art. Subsequent chapters, which delve deeper into various research challenges, are oriented towards advanced readers. Moreover, the book provides a good starting point for young researchers as well as a reference guide pointing at further literature. Hence, the primary readership is academic institutions and industry currently involved in digital face manipulation and detection. The book could easily be used as a recommended text for courses in image processing, machine learning, media forensics, biometrics, and the general security area

    Efficient Decision Support Systems

    Get PDF
    This series is directed to diverse managerial professionals who are leading the transformation of individual domains by using expert information and domain knowledge to drive decision support systems (DSSs). The series offers a broad range of subjects addressed in specific areas such as health care, business management, banking, agriculture, environmental improvement, natural resource and spatial management, aviation administration, and hybrid applications of information technology aimed to interdisciplinary issues. This book series is composed of three volumes: Volume 1 consists of general concepts and methodology of DSSs; Volume 2 consists of applications of DSSs in the biomedical domain; Volume 3 consists of hybrid applications of DSSs in multidisciplinary domains. The book is shaped upon decision support strategies in the new infrastructure that assists the readers in full use of the creative technology to manipulate input data and to transform information into useful decisions for decision makers

    Harnessing rare category trinity for complex data

    Get PDF
    In the era of big data, we are inundated with the sheer volume of data being collected from various domains. In contrast, it is often the rare occurrences that are crucially important to many high-impact domains with diverse data types. For example, in online transaction platforms, the percentage of fraudulent transactions might be small, but the resultant financial loss could be significant; in social networks, a novel topic is often neglected by the majority of users at the initial stage, but it could burst into an emerging trend afterward; in the Sloan Digital Sky Survey, the vast majority of sky images (e.g., known stars, comets, nebulae, etc.) are of no interest to the astronomers, while only 0.001% of the sky images lead to novel scientific discoveries; in the worldwide pandemics (e.g., SARS, MERS, COVID19, etc.), the primary cases might be limited, but the consequences could be catastrophic (e.g., mass mortality and economic recession). Therefore, studying such complex rare categories have profound significance and longstanding impact in many aspects of modern society, from preventing financial fraud to uncovering hot topics and trends, from supporting scientific research to forecasting pandemic and natural disasters. In this thesis, we propose a generic learning mechanism with trinity modules for complex rare category analysis: (M1) Rare Category Characterization - characterizing the rare patterns with a compact representation; (M2) Rare Category Explanation - interpreting the prediction results and providing relevant clues for the end-users; (M3) Rare Category Generation - producing synthetic rare category examples that resemble the real ones. The key philosophy of our mechanism lies in "all for one and one for all" - each module makes unique contributions to the whole mechanism and thus receives support from its companions. In particular, M1 serves as the de-novo step to discover rare category patterns on complex data; M2 provides a proper lens to the end-users to examine the outputs and understand the learning process; and M3 synthesizes real rare category examples for data augmentation to further improve M1 and M2. To enrich the learning mechanism, we develop principled theorems and solutions to characterize, understand, and synthesize rare categories on complex scenarios, ranging from static rare categories to time-evolving rare categories, from attributed data to graph-structured data, from homogeneous data to heterogeneous data, from low-order connectivity patterns to high-order connectivity patterns, etc. It is worthy of mentioning that we have also launched one of the first visual analytic systems for dynamic rare category analysis, which integrates our developed techniques and enables users to investigate complex rare categories in practice

    ICTERI 2020: ІКТ в освіті, дослідженнях та промислових застосуваннях. Інтеграція, гармонізація та передача знань 2020: Матеріали 16-ї Міжнародної конференції. Том II: Семінари. Харків, Україна, 06-10 жовтня 2020 р.

    Get PDF
    This volume represents the proceedings of the Workshops co-located with the 16th International Conference on ICT in Education, Research, and Industrial Applications, held in Kharkiv, Ukraine, in October 2020. It comprises 101 contributed papers that were carefully peer-reviewed and selected from 233 submissions for the five workshops: RMSEBT, TheRMIT, ITER, 3L-Person, CoSinE, MROL. The volume is structured in six parts, each presenting the contributions for a particular workshop. The topical scope of the volume is aligned with the thematic tracks of ICTERI 2020: (I) Advances in ICT Research; (II) Information Systems: Technology and Applications; (III) Academia/Industry ICT Cooperation; and (IV) ICT in Education.Цей збірник представляє матеріали семінарів, які були проведені в рамках 16-ї Міжнародної конференції з ІКТ в освіті, наукових дослідженнях та промислових застосуваннях, що відбулася в Харкові, Україна, у жовтні 2020 року. Він містить 101 доповідь, які були ретельно рецензовані та відібрані з 233 заявок на участь у п'яти воркшопах: RMSEBT, TheRMIT, ITER, 3L-Person, CoSinE, MROL. Збірник складається з шести частин, кожна з яких представляє матеріали для певного семінару. Тематична спрямованість збірника узгоджена з тематичними напрямками ICTERI 2020: (I) Досягнення в галузі досліджень ІКТ; (II) Інформаційні системи: Технології і застосування; (ІІІ) Співпраця в галузі ІКТ між академічними і промисловими колами; і (IV) ІКТ в освіті

    An Initial Framework Assessing the Safety of Complex Systems

    Get PDF
    Trabajo presentado en la Conference on Complex Systems, celebrada online del 7 al 11 de diciembre de 2020.Atmospheric blocking events, that is large-scale nearly stationary atmospheric pressure patterns, are often associated with extreme weather in the mid-latitudes, such as heat waves and cold spells which have significant consequences on ecosystems, human health and economy. The high impact of blocking events has motivated numerous studies. However, there is not yet a comprehensive theory explaining their onset, maintenance and decay and their numerical prediction remains a challenge. In recent years, a number of studies have successfully employed complex network descriptions of fluid transport to characterize dynamical patterns in geophysical flows. The aim of the current work is to investigate the potential of so called Lagrangian flow networks for the detection and perhaps forecasting of atmospheric blocking events. The network is constructed by associating nodes to regions of the atmosphere and establishing links based on the flux of material between these nodes during a given time interval. One can then use effective tools and metrics developed in the context of graph theory to explore the atmospheric flow properties. In particular, Ser-Giacomi et al. [1] showed how optimal paths in a Lagrangian flow network highlight distinctive circulation patterns associated with atmospheric blocking events. We extend these results by studying the behavior of selected network measures (such as degree, entropy and harmonic closeness centrality)at the onset of and during blocking situations, demonstrating their ability to trace the spatio-temporal characteristics of these events.This research was conducted as part of the CAFE (Climate Advanced Forecasting of sub-seasonal Extremes) Innovative Training Network which has received funding from the European Union’s Horizon 2020 research and innovation programme under the Marie Skłodowska-Curie grant agreement No. 813844
    corecore