Search CORE

9 research outputs found

Expansion de requêtes à base de motifs et de Word Embeddings pour améliorer la recherche de microblogs

Author: Bendella Meryem
Quafafou Mohamed
Publication venue: HAL CCSD
Publication date: 27/03/2019
Field of study

International audienceSocial microblogging services have an especially significant role in our society. Twitter is one of the most popular microblogging sites used by people to find relevant information (e.g., breaking news, popular trends, information about people of interest, etc). In this context, retrieving information from such data has recently gained growing attention and opening new challenges. However, the size of such data and queries is usually short and may impact the search result. Query Expansion (QE) has the main task in this issue. In fact, words can have different meanings where only one is used for a given context. In this paper, we propose a QE method by considering the meaning of the context. Thus, we use patterns and Word Embeddings to expand users' queries. We experiment and evaluate the proposed method on the TREC dataset. Results show the effectiveness of the proposed approach and signify the combination of patterns and word embedding for enhanced microblog retrieval.Les services sociaux de microblogging jouent un rôle important dans notre société. Twitter est l'une des plateformes de microblogging les plus populaires, utilisées par les internautes pour trouver des informations pertinentes (sujets d'actualité, tendances populaires, informations sur certains internautes, etc.). Dans ce contexte, la recherche d'information provenant de telles données a récemment gagné un intérêt majeur et ouvert de nouveaux défis. Cependant, la taille de ces données ainsi que des requêtes est généralement courte et peut avoir un impact sur le résultat de la recherche. Cette dernière peut être améliorée à l'aide de l'expansion de requêtes. En effet, les mots peuvent avoir plusieurs sens dont un seul est utilisé pour un contexte donné. Dans cet article, nous proposons une méthode d'expansion de requêtes prenant en compte le sens du contexte. Nous utilisons les motifs et les plongements de mots pour étendre les requêtes des utilisateurs. L'évaluation expérimentale de la méthode proposée est menée sur la collection TREC. Les résultats montrent l'efficacité de l'approche en combinant des motifs avec des plongements de mots pour améliorer significativement la recherche de microblog

OLGA SÁNCHEZ RODRÍGUEZ [Material gráfico]

Author: Bendella Meryem
Quafafou Mohamed
Publication venue
Publication date: 01/01/1949
Field of study

ÁLBUM FAMILIAR CASA DE COLÓNCopia digital. Madrid : Ministerio de Educación, Cultura y Deporte. Subdirección General de Coordinación Bibliotecaria, 201

Biblioteca Virtual del Patrimonio Bibliográfico (Virtual Library of Bibliographical Heritage)

HAL AMU

Social networks data mining for detection and retrieval

Author: Bendella Meryem
Publication venue
Publication date: 09/12/2019
Field of study

L'avènement des réseaux sociaux a suscité un intérêt considérable pour la société au cours de notre décennie. Ces plateformes permettent aux utilisateurs de produire, partager et échanger des contenus divers. Twitter est l'un des réseaux sociaux les plus populaires permettant à ses utilisateurs de publier des messages, appelés tweets. Ces derniers peuvent contenir des textes offensifs, tels que les messages de harcèlement, ou encore des informations liées à des sujets controversés. De nombreux travaux de recherche ont montré comment ces contenus sociaux peuvent avoir une influence sur les utilisateurs. Un système de détection de ce type de messages est nécessaire afin de protéger l'utilisateur et prédire l'apparition des évènements. Dans ce travail de thèse, nous proposons un système de détection de tweets suspects basé sur les modèles thématiques probabilistes et la logique floue. Afin d'identifier les tweets de harcèlement, nous introduisons un modèle de classification exploitant un ensemble de caractéristiques et utilisant des algorithmes d'apprentissage supervisé. Les utilisateurs effectuent également des recherches sur ces plateformes pour trouver des informations qui répondent à un besoin exprimé par une requête. Cependant, les tweets sont courts et l'accès à l'information est parfois difficile. Une partie de nos travaux se situe plus particulièrement dans le contexte de la recherche d'information sociale et vise à améliorer la recherche de tweets. Nous proposons une méthode d'expansion de requêtes, afin de pallier le problème de concision des messages ainsi que des requêtes, basée sur l’extraction des motifs fermés fréquents et utilisant des plongements lexicauxSocial networks have gained a significant interest for society during our decade. These platforms allow users to produce, share and exchange various content. Twitter is one of the most popular social networks that allow users to publish messages, called tweets. These tweets may contain offensive texts, such as harassment or bullying messages, or information related to abnormal topics. Many research studies have shown how such social content can have an impact on users and cause psychological harm. Developing a system for detecting such type of messages is necessary to protect the user and predict tragic events. The work presented in this thesis is brought into the context of data mining from Twitter to identify and detect such messages. We propose a suspicious tweets detection system based on probabilistic topic models and fuzzy logic. In order to identify harassment tweets, we introduce a classification model that exploits a set of features and uses supervised learning algorithms. People also use social networks to search for relevant posts that satisfy their information need where this need is usually formulated using a textual query. Twitter’s messages are short and access to information is sometimes difficult because of the variety of published content and huge amount of data generated. The second part of this work deals with the context of social information retrieval and aims to improve tweets retrieval quality. We propose a query expansion approach to overcome the shortness of user queries and tweets by extracting frequent closed patterns and using word embedding

Theses.fr

Classification probabiliste des Tweets Suspects

Author: Bendella Meryem
Mohamed Quafafou
Publication venue: HAL CCSD
Publication date: 05/09/2018
Field of study

International audienc

Patterns Based Query Expansion for Enhanced Search on Twitter Data

Author: Bendella Meryem
Quafafou Mohamed
Publication venue: HAL CCSD
Publication date: 25/06/2019
Field of study

HAL AMU

Classification probabiliste des Tweets Suspects

Author: Bendella Meryem
Mohamed Quafafou
Publication venue: HAL CCSD
Publication date: 05/09/2018
Field of study

International audienc

HAL AMU

Expansion de requêtes à base de motifs et de Word Embeddings pour améliorer la recherche de microblogs

Author: Bendella Meryem
Quafafou Mohamed
Publication venue: HAL CCSD
Publication date: 27/03/2019
Field of study

HAL AMU

Geo-FUZZ: Fuzzy-based algorithm for suspicious geo-tagged tweets detection

Author: Almuhisen Feda
Bendella Meryem
Quafafou Mohamed
Publication venue: 'Institute of Electrical and Electronics Engineers (IEEE)'
Publication date: 08/07/2018
Field of study

International audienc

Crossref

HAL AMU

Leveraging uncertainty modeling for suspicious tweets detection

Author: Bendella Meryem
Mekkaoui Saad
Quafafou Mohamed
Publication venue: 'Institute of Electrical and Electronics Engineers (IEEE)'
Publication date: 09/07/2017
Field of study

International audienc

Crossref

HAL AMU