4,083 research outputs found
Unsupervised Detection of Sub-events in Large Scale Disasters
Social media plays a major role during and after major natural disasters
(e.g., hurricanes, large-scale fires, etc.), as people ``on the ground'' post
useful information on what is actually happening. Given the large amounts of
posts, a major challenge is identifying the information that is useful and
actionable. Emergency responders are largely interested in finding out what
events are taking place so they can properly plan and deploy resources. In this
paper we address the problem of automatically identifying important sub-events
(within a large-scale emergency ``event'', such as a hurricane). In particular,
we present a novel, unsupervised learning framework to detect sub-events in
Tweets for retrospective crisis analysis. We first extract noun-verb pairs and
phrases from raw tweets as sub-event candidates. Then, we learn a semantic
embedding of extracted noun-verb pairs and phrases, and rank them against a
crisis-specific ontology. We filter out noisy and irrelevant information then
cluster the noun-verb pairs and phrases so that the top-ranked ones describe
the most important sub-events. Through quantitative experiments on two large
crisis data sets (Hurricane Harvey and the 2015 Nepal Earthquake), we
demonstrate the effectiveness of our approach over the state-of-the-art. Our
qualitative evaluation shows better performance compared to our baseline.Comment: AAAI-20 Social Impact Trac
Event Detection and Tracking Detection of Dangerous Events on Social Media
Online social media platforms have become essential tools for communication and information exchange in our lives. It is used for connecting with people and sharing information.
This phenomenon has been intensively studied in the past decade to investigate users’ sentiments for different scenarios and purposes. As the technology advanced and popularity
increased, it led to the use of different terms referring to similar topics which often result in
confusion. We study such trends and intend to propose a uniform solution that deals with
the subject clearly. We gather all these ambiguous terms under the umbrella of the most
recent and popular terms to reach a concise verdict. Many events have been addressed
in recent works that cover only specific types and domains of events. For the sake of
keeping things simple and practical, the events that are extreme, negative, and dangerous
are grouped under the name Dangerous Events (DE). These dangerous events are further
divided into three main categories of action-based, scenario-based, and sentiments-based
dangerous events to specify their characteristics. We then propose deep-learning-based
models to detect events that are dangerous in nature. The deep-learning models that include BERT, RoBERTa, and XLNet provide valuable results that can effectively help solve
the issue of detecting dangerous events using various dimensions. Even though the models
perform well, the main constraint of fewer available event datasets and lower quality of
certain events data affects the performance of these models can be tackled by handling
the issue accordingly.As plataformas online de redes sociais tornaram-se ferramentas essenciais para a comunicação, conexão com outros, e troca de informação nas nossas vidas. Este fenómeno
tem sido intensamente estudado na última década para investigar os sentimentos dos utilizadores em diferentes cenários e para vários propósitos. Contudo, a utilização dos meios
de comunicação social tornou-se mais complexa e num fenómeno mais vasto devido ao
envolvimento de múltiplos intervenientes, tais como empresas, grupos e outras organizações. À medida que a tecnologia avançou e a popularidade aumentou, a utilização de
termos diferentes referentes a tópicos semelhantes gerou confusão. Por outras palavras, os
modelos são treinados segundo a informação de termos e âmbitos específicos. Portanto, a
padronização é imperativa. O objetivo deste trabalho é unir os diferentes termos utilizados
em termos mais abrangentes e padronizados. O perigo pode ser uma ameaça como violência social, desastres naturais, danos intelectuais ou comunitários, contágio, agitação social,
perda económica, ou apenas a difusão de ideologias odiosas e violentas. Estudamos estes
diferentes eventos e classificamos-los em tópicos para que a ténica de deteção baseada em
tópicos possa ser concebida e integrada sob o termo Evento Perigosos (DE). Consequentemente, definimos o termo proposto “Eventos Perigosos” (Dangerous Events) e dividimo-lo
em três categorias principais de modo a especificar as suas características. Sendo estes
denominados Eventos Perigosos, Eventos Perigosos de nível superior, e Eventos Perigosos
de nível inferior. O conjunto de dados MAVEN foi utilizado para a obtenção de conjuntos
de dados para realizar a experiência. Estes conjuntos de dados são filtrados manualmente
com base no tipo de eventos para separar eventos perigosos de eventos gerais. Os modelos
de transformação BERT, RoBERTa, e XLNet foram utilizados para classificar dados de
texto consoante a respetiva categoria de Eventos Perigosos. Os resultados demonstraram
que o desempenho do BERT é superior a outros modelos e pode ser eficazmente utilizado
para a tarefa de deteção de Eventos Perigosos. Salienta-se que a abordagem de divisão
dos conjuntos de dados aumentou significativamente o desempenho dos modelos.
Existem diversos métodos propostos para a deteção de eventos. A deteção destes eventos
(ED) são maioritariamente classificados na categoria de supervisonado e não supervisionados, como demonstrado nos metódos supervisionados, estão incluidos support vector
machine (SVM), Conditional random field (CRF), Decision tree (DT), Naive Bayes (NB),
entre outros. Enquanto a categoria de não supervisionados inclui Query-based, Statisticalbased, Probabilistic-based, Clustering-based e Graph-based. Estas são as duas abordagens
em uso na deteção de eventos e são denonimados de document-pivot and feature-pivot. A
diferença entre estas abordagens é na sua maioria a clustering approach, a forma como
os documentos são utilizados para caracterizar vetores, e a similaridade métrica utilizada
para identificar se dois documentos correspondem ao mesmo evento ou não. Além da
deteção de eventos, a previsão de eventos é um problema importante mas complicado
que engloba diversas dimensões. Muitos destes eventos são difíceis de prever antes de
se tornarem visíveis e ocorrerem. Como um exemplo, é impossível antecipar catástrofes
naturais, sendo apenas detetáveis após o seu acontecimento. Existe um número limitado
de recursos em ternos de conjuntos de dados de eventos. ACE 2005, MAVEN, EVIN são alguns dos exemplos de conjuntos de dados disponíveis para a deteção de evnetos.
Os trabalhos recentes demonstraram que os Transformer-based pre-trained models (PTMs)
são capazes de alcançar desempenho de última geração em várias tarefas de NLP. Estes
modelos são pré-treinados em grandes quantidades de texto. Aprendem incorporações
para as palavras da língua ou representações de vetores de modo a que as palavras que se
relacionem se agrupen no espaço vectorial. Um total de três transformadores diferentes,
nomeadamente BERT, RoBERTa, e XLNet, será utilizado para conduzir a experiência e
tirar a conclusão através da comparação destes modelos.
Os modelos baseados em transformação (Transformer-based) estão em total sintonia utilizando uma divisão de 70,30 dos conjuntos de dados para fins de formação e teste/validação.
A sintonização do hiperparâmetro inclui 10 epochs, 16 batch size, e o optimizador AdamW
com taxa de aprendizagem 2e-5 para BERT e RoBERTa e 3e-5 para XLNet. Para eventos
perigosos, o BERT fornece 60%, o RoBERTa 59 enquanto a XLNet fornece apenas 54%
de precisão geral. Para as outras experiências de configuração de eventos de alto nível, o
BERT e a XLNet dão 71% e 70% de desempenho com RoBERTa em relação aos outros
modelos com 74% de precisão. Enquanto para o DE baseado em acções, DE baseado em
cenários, e DE baseado em sentimentos, o BERT dá 62%, 85%, e 81% respetivamente;
RoBERTa com 61%, 83%, e 71%; a XLNet com 52%, 81%, e 77% de precisão.
Existe a necessidade de clarificar a ambiguidade entre os diferentes trabalhos que abordam
problemas similares utilizando termos diferentes. A ideia proposta de referir acontecimentos especifícos como eventos perigosos torna mais fácil a abordagem do problema em
questão. No entanto, a escassez de conjunto de dados de eventos limita o desempenho dos
modelos e o progresso na deteção das tarefas. A disponibilidade de uma maior quantidade
de informação relacionada com eventos perigosos pode melhorar o desempenho do modelo
existente. É evidente que o uso de modelos de aprendizagem profunda, tais como como
BERT, RoBERTa, e XLNet, pode ajudar a detetar e classificar eventos perigosos de forma
eficiente. Tem sido evidente que a utilização de modelos de aprendizagem profunda, tais
como BERT, RoBERTa, e XLNet, pode ajudar a detetar e classificar eventos perigosos
de forma eficiente. Em geral, o BERT tem um desempenho superior ao do RoBERTa e
XLNet na detecção de eventos perigosos. É igualmente importante rastrear os eventos
após a sua detecção. Por conseguinte, para trabalhos futuros, propõe-se a implementação
das técnicas que lidam com o espaço e o tempo, a fim de monitorizar a sua emergência
com o tempo
Using social media for sub-event detection during disasters
AbstractSocial media platforms have become fundamental tools for sharing information during natural disasters or catastrophic events. This paper presents SEDOM-DD (Sub-Events Detection on sOcial Media During Disasters), a new method that analyzes user posts to discover sub-events that occurred after a disaster (e.g., collapsed buildings, broken gas pipes, floods). SEDOM-DD has been evaluated with datasets of different sizes that contain real posts from social media related to different natural disasters (e.g., earthquakes, floods and hurricanes). Starting from such data, we generated synthetic datasets with different features, such as different percentages of relevant posts and/or geotagged posts. Experiments performed on both real and synthetic datasets showed that SEDOM-DD is able to identify sub-events with high accuracy. For example, with a percentage of relevant posts of 80% and geotagged posts of 15%, our method detects the sub-events and their areas with an accuracy of 85%, revealing the high accuracy and effectiveness of the proposed approach
OntoDSumm : Ontology based Tweet Summarization for Disaster Events
The huge popularity of social media platforms like Twitter attracts a large
fraction of users to share real-time information and short situational messages
during disasters. A summary of these tweets is required by the government
organizations, agencies, and volunteers for efficient and quick disaster
response. However, the huge influx of tweets makes it difficult to manually get
a precise overview of ongoing events. To handle this challenge, several tweet
summarization approaches have been proposed. In most of the existing
literature, tweet summarization is broken into a two-step process where in the
first step, it categorizes tweets, and in the second step, it chooses
representative tweets from each category. There are both supervised as well as
unsupervised approaches found in literature to solve the problem of first step.
Supervised approaches requires huge amount of labelled data which incurs cost
as well as time. On the other hand, unsupervised approaches could not clusters
tweet properly due to the overlapping keywords, vocabulary size, lack of
understanding of semantic meaning etc. While, for the second step of
summarization, existing approaches applied different ranking methods where
those ranking methods are very generic which fail to compute proper importance
of a tweet respect to a disaster. Both the problems can be handled far better
with proper domain knowledge. In this paper, we exploited already existing
domain knowledge by the means of ontology in both the steps and proposed a
novel disaster summarization method OntoDSumm. We evaluate this proposed method
with 4 state-of-the-art methods using 10 disaster datasets. Evaluation results
reveal that OntoDSumm outperforms existing methods by approximately 2-66% in
terms of ROUGE-1 F1 score
Sarcasm Detection in a Disaster Context
During natural disasters, people often use social media platforms such as
Twitter to ask for help, to provide information about the disaster situation,
or to express contempt about the unfolding event or public policies and
guidelines. This contempt is in some cases expressed as sarcasm or irony.
Understanding this form of speech in a disaster-centric context is essential to
improving natural language understanding of disaster-related tweets. In this
paper, we introduce HurricaneSARC, a dataset of 15,000 tweets annotated for
intended sarcasm, and provide a comprehensive investigation of sarcasm
detection using pre-trained language models. Our best model is able to obtain
as much as 0.70 F1 on our dataset. We also demonstrate that the performance on
HurricaneSARC can be improved by leveraging intermediate task transfer
learning. We release our data and code at
https://github.com/tsosea2/HurricaneSarc
- …