Search CORE

Scientific Publications of the University of Toulouse II Le Mirail

Identification de compatibilités entre tags descripteurs de lieux et apprentissage automatique

Author: Candillier Laurent
Delpech Estelle
Laporte Léa
Phan Samuel
Publication venue: HAL CCSD
Publication date: 01/01/2013
Field of study

International audienceLes travaux présentés dans cet article s'inscrivent dans le paradigme des recherches visant à acquérir des relations sémantiques à partir de folksonomies (ensemble de tags attribués à des ressources par des utilisateurs). Nous expérimentons plusieurs approches issues de l'état de l'art ainsi que l'apport de l'apprentissage automatique pour l'identification de relations entre tags. Nous obtenons dans le meilleur des cas un taux d'erreur de 23,7 % (relations non reconnues ou fausses), ce qui est encourageant au vu de la difficulté de la tâche (les annotateurs humains ont un taux de désaccord de 12%)

Recommandation de séquences d’activités en contexte mobile et dynamique

Author: Calabretto Sylvie
Gensel Jérôme
Laporte Léa
Nurbakova Diana
Publication venue: HAL CCSD
Publication date: 20/11/2015
Field of study

National audienceLa recommandation de séquences d'activités spatio-temporelles (Points d'Intérêts, POIs) est de plus en plus utile et demandée avec la pénétration des systèmes de localisation et des réseaux géo-sociaux dans la vie quotidienne. Nous proposons une approche personnalisée de recommandation de séquences d'activités en contexte mobile et dynamique

Recommandation de séquences d’activités en contexte mobile et dynamique

Author: Calabretto Sylvie
Gensel Jérôme
Laporte Léa
Nurbakova Diana
Publication venue: HAL CCSD
Publication date: 20/11/2015
Field of study

Scientific Publications of the University of Toulouse II Le Mirail

Évaluation de la pertinence dans les moteurs de recherche géoréférencés

Author: Candillier Laurent
Dejean Sébastien
Laporte Léa
Mothe Josiane
Publication venue: HAL CCSD
Publication date: 29/05/2012
Field of study

National audienceLearning to rank documents on a search engine requires relevance judgments. We introduce the results of an innovating study on relevance modeling for local search engines. These search engines present search results on a map or as a list of maps. Each map contains all the attributes of a place (noun, address, phone number, etc). Most of these attributes are links users can click. We model the relevance as the weighted sum of all the clicks on a result. We obtain good results by fixing the same weight for each component of the model. We propose a relative order between clicks to determine the optimal weights.Optimiser le classement des résultats d’un moteur par un algorithme de learning to rank nécessite de connaître des jugements de pertinence entre requêtes et documents. Nous présentons les résultats d’une étude pilote sur la modélisation de la pertinence dans les moteurs de recherche géoréférencés. La particularité de ces moteurs est de présenter les résultats de recherche sous forme de carte géographique ou de liste de fiches. Ces fiches contiennent les caractéristiques du lieu (nom, adresse, téléphone, etc.) dont la plupart sont cliquables par l’utilisateur. Nous modélisons la pertinence comme la somme pondérée des clics sur le résultat. Nous montrons qu’équipondérer les différents éléments du modèle donne de bons résultats et qu’un ordre d’importance entre type de clics peut être déduit pour déterminer les pondérations optimales

HAL-INSA Toulouse

ANASTASIA : recommandation de séquences d'activités spatio-temporelles

Author: CALABRETTO Sylvie
Gensel Jérôme
Laporte Léa
Nurbakova Diana
Publication venue: HAL CCSD
Publication date: 09/03/2016
Field of study

National audienceAs amount of activities available for users and their variety have grown, personalised recommendation of activities sequences has become an important challenge. However, most of recommender systems do not consider temporal constraints of activities, making the recommendation hard for user to follow. In this article, we describe a novel approach for recommendation of competing activities limited in time. It makes use of historical records of users' activities in order to mine users' behavioral patterns, and combines different contextual elements (popularity, demographic and spatio-temporal information). We present an evaluation framework and a dataset that will allow us to evaluate our approach.Avec l’augmentation du nombre et de la variété des activités accessibles par les utilisateurs, la recommandation personnalisée de séquences d’activités devient un enjeu important. Or, la plupart des systèmes de recommandation ne tiennent pas compte des contraintes temporelles liées aux activités, ce qui rend la recommandation difficile à suivre par un utilisateur. Dans cet article, nous décrivons une nouvelle approche pour la recommandation de séquences d’activités limitées dans le temps et concurrentes. Elle s’appuie sur l’historique des activités des utilisateurs pour extraire des motifs comportementaux et intègre différents éléments contextuels (popularité, informations démographiques et spatio-temporelles). Nous présentons un protocole d’évaluation et un jeu de données qui permettra l’évaluation de notre approche

DEvIR: Data Collection and Analysis for the Recommendation of Events and Itineraries

Author: Calabretto Sylvie
Gensel Jerome
Laporte Léa
Nurbakova Diana
Publication venue: AIS Electronic Library (AISeL)
Publication date: 08/01/2019
Field of study

Distributed events such as multi-day festivals and conventions attract thousands of attendees. Their programs are usually very dense, which makes it difficult for users to select activities to perform. Recent works have proposed event and itinerary recommendation algorithms to solve this problem. Although several datasets have been made available for the evaluation of event recommendation algorithms, they do not suit well for the case of distributed events or itinerary recommendation. Based on the study of available online resources, we define dataset attributes required to perform event and itinerary recommendations in the context of distributed events, and discuss the compliance of existing datasets to these requirements. Revealing the lack of publicly available datasets with desired features, we describe a data collection process to acquire the publicly available data from a major comic book convention website. We present the characteristics of the collected data and discuss its usability for evaluating recommendation algorithms

ScholarSpace at University of Hawai'i at Manoa

AIS Electronic Library (AISeL)

Multiple perspectives HMM-based feature engineering for credit card fraud detection

Author: Caelen Olivier
Calabretto Sylvie
Granitzer Michael
He-Guelton Liyun
Laporte Léa
Lucas Yvan
Portier Pierre-Edouard
Publication venue
Publication date: 08/04/2019
Field of study

Machine learning and data mining techniques have been used extensively in order to detect credit card frauds. However, most studies consider credit card transactions as isolated events and not as a sequence of transactions. In this article, we model a sequence of credit card transactions from three different perspectives, namely (i) does the sequence contain a Fraud? (ii) Is the sequence obtained by fixing the card-holder or the payment terminal? (iii) Is it a sequence of spent amount or of elapsed time between the current and previous transactions? Combinations of the three binary perspectives give eight sets of sequences from the (training) set of transactions. Each one of these sets is modelled with a Hidden Markov Model (HMM). Each HMM associates a likelihood to a transaction given its sequence of previous transactions. These likelihoods are used as additional features in a Random Forest classifier for fraud detection. This multiple perspectives HMM-based approach enables an automatic feature engineering in order to model the sequential properties of the dataset with respect to the classification task. This strategy allows for a 15% increase in the precision-recall AUC compared to the state of the art feature engineering strategy for credit card fraud detection.Comment: Presented as a poster in the conference SAC 2019: 34th ACM/SIGAPP Symposium on Applied Computing in April 201

arXiv.org e-Print Archive

Crossref