69 research outputs found

    Prédictions d'activité dans les réseaux sociaux en ligne

    No full text
    National audienceOnline Platforms dedicated to social networking host new social phenomenons. Thus several keywords may suddenly take an unprecedented importance, reflecting the number of dis- cussions they have raised within a short time period. Such bursts in topic discussions are usually referred to as buzz events. We address in this paper the problem of predicting the activity volume associated to a given keyword without a priori knowledge on the underlying social network. To do so, we propose to define social netowrk on a content-centric way. Our approach is evaluated at "industrial scale" on two different social networks: Twitter, a platform with extremely fast dynamics (Kwak et al., 2010), and Tom's Hardware, a worldwide forum network focusing on new technology. The experiments conducted reveal that it is possible to predict activity volume associated to a keyword in social media with high accuracy

    Enrichissement du profil utilisateur à partir de son réseau social dans un contexte dynamique : application d'une méthode de pondération temporelle

    Get PDF
    International audienceLe profil de l’utilisateur est un élément central dans les systèmes d’adaptation de l’information. Les réseaux sociaux numériques représentent une source d'informations très riche sur l’utilisateur. Nous nous intéressons au processus d’enrichissement du profil utilisateur à partir de son réseau social. Ce processus extrait les intérêts de l’utilisateur à partir des individus dans son réseau égocentrique afin de construire la dimension sociale du profil de l'utilisateur. Afin de prendre en compte le caractère dynamique des réseaux sociaux, nous proposons, dans ce travail, de construire cette dimension sociale en intégrant un critère temporel afin de pondérer les intérêts de l’utilisateur. Ce poids "temporel", qui reflète la pertinence d’un intérêt, est calculé, d’une part, à partir de la pertinence des individus du réseau égocentrique de l’utilisateur en prenant en compte la fraicheur de leurs liens avec l’utilisateur et, d’autre part, à partir de la pertinence des informations qu’ils partagent en prenant en compte la fraicheur de ces informations. Les expérimentations sur les réseaux de publicationsscientifiques DBLP et Mendeley ont permis de montrer montrer que notre proposition fournit des résultats plus satisfaisants que ceux du processus existant

    Profils, alerte et vidéo : de l’outre-lecture à la fin de la lecture ?

    Get PDF
    Près de dix ans après avoir écrit « l’outre-lecture », le monde et les pratiques que nous y décrivions semblent avoir complètement changé. Le Web 2.0 n’est pas une mode, c’est tout notre rapport aux réseaux numériques qui a changé et dans le même tourbillon, la lecture au long cours a été emportée et l’outre-lecture elle-même s’est totalement transformée. Malgré l’absence d’enquête similaire à celle du début des années 2000 réalisée pour la BPi et qui aurait permis de proposer un contre-point méthodique, notre observation permanente des usages et des offres nous permet de pointer les éléments-clé de cette nouvelle mutation et de renvoyer dans chaque cas à des indications de prospective pour l’avenir de ce que l’on persiste à appeler le livre électronique, ou le e-book (...)

    Réputation des entreprises : une recherche exploratoire sur l’utilisation des données issues de twitter

    Get PDF
    RÉSUMÉ : La réputation d’une entreprise constitue une importante, voire principale, partie de l’actif immatériel d’une compagnie (De Marcellis-Warin and Teodoresco 2012). La littérature donne de multiples définitions au concept de réputation d’entreprise. Par exemple on peut reprendre celle d’un construit combinant l’image d’entreprise, l’identité d’entreprise et l’identité désirée d’entreprise (Chun 2005). Depuis le début des années 2000, des organisations telles que l’Institut de la Réputation ou encore le magazine Fortune & Money proposent une mesure de la réputation d’entreprise et diffusent annuellement un classement des entreprises selon leur réputation. D’autres organisations s’intéressent à l’évaluation de la valeur de l’image d’entreprise (appelée équité de marque), telles que Brand-Finance, ou Interbrand. Ces dernières diffusent également un classement annuel des entreprises les plus valorisées au monde. Les résultats présentés dans ce mémoire indiquent que les classements produits par ces institutions sont difficilement interprétables et ne semblent pas présenter de lien direct avec l’évolution du cours de bourse d’une entreprise, pourtant la littérature nous indique que la réputation est positivement corrélée avec le cours de bourse d’une entreprise. De plus, le processus menant à la conception de ces classements peut prendre plusieurs mois de compilation de données et d’analyse. C’est donc dans l’optique de réduire le temps écoulé entre l’enregistrement des performances des compagnies et la conception d’une mesure de la réputation que réside la présente opportunité de recherche : existe-t-il un autre moyen de fournir une mesure de la réputation d’entreprise à une fréquence plus rapprochée que celle offerte présentement (fréquence annuelle)? Serait-ce même possible d’en avoir une mesure en temps réel? Les réseaux sociaux se présentent comme étant un canal de recherche afin d’améliorer la mesure de la réputation d’entreprise si les interactions entre les consommateurs et les entreprises peuvent être analysées, pas seulement qualitativement mais également quantitativement. Twitter de par sa nature, son nombre d’utilisateurs exponentiellement croissant, et l’accès plus ou moins libre aux données circulant sur sa plateforme, semble être le réseau social adéquat pour conduire une recherche de ce type. La nouvelle mesure de réputation présentée par ce travail de recherche est donc basée sur les données récoltées sur Twitter. Les résultats obtenus démontrent que le nombre de « followers » d’une entreprise, ainsi que le volume quotidien de « tweets », sont utiles à la création d’un « proxy » de la réputation d’entreprise. À l’inverse, l’analyse de sentiment sur les tweets ne s’avèrent pas être utile dans la création d’un proxy pour la réputation d’entreprise. De plus, la mesure de réputation conçue à partir de Twitter ne peut capter toute l’essence de la réputation d’entreprise, puisqu’une partie non négligeable de la réputation d’entreprise ne peut être captée par les réseaux sociaux : comme par exemple la loyauté des consommateurs composante de l’image de marque, l’identité d’entreprise ou encore l’identité désirée d’entreprise. Cependant, la nouvelle mesure de réputation permet d’observer l’évolution de la réputation d’entreprise au travers du temps et particulièrement la notoriété d’une entreprise. Il s’agit donc d’un outil complémentaire aux évaluations de réputations existantes.----------ABSTRACT : The corporate reputation represents a major part of a company’s intangible assets (De Marcellis-Warin and Teodoresco 2012). The literature review has several definitions of the concept of corporate reputation, such as (Chun 2005) who defines corporate reputation as a construct of corporate image, corporate identity, and corporate desired identity. Since the beginning of the 2000’s, several institutions such as the Reputation Institute or Fortune & Money magazine offer a measure of corporate reputation and present each year rankings of company based on their corporate reputation. Other institutions, such as Brand-Finance or Interbrand, assess the value of a corporate brand (called brand equity) every year and produce also rankings for the company with the highest brand equity. The results presented in this master thesis indicate that all the rankings produced by the institutions mentioned previously, do not seem to be linked with the stock market. Moreover, the analytical process leading to the rankings can take several months because of the time it takes to gather the data from all the firms. Thus, it is in the context of reducing the time between performance recording companies and the process leading to the measure of corporate reputation that lies this current research opportunity: is there a way to provide an assessment of corporate reputation at a lower frequency than the one currently provided (annual)? Would it be possible to have a real time measure of reputation? Social media are presented as a paging channel to improve the measurement of corporate reputation if the interactions between consumers and businesses can be analyzed not only qualitatively but also quantitatively. Twitter seems to be the adequate social media platform to conduct such a research, because of its exponential growing number of users, and more or less easy access to data diffused on it. The new measure of corporate reputation presented through this research is only based on the data Twitter can offer. The results presented in this master thesis indicate on one hand, that the number of followers of a company and the daily number of tweets are useful in creating a proxy of corporate reputation. On the other hand, the results indicate that sentiment analysis on tweets does not seem to provide useful information for the conception of a proxy of corporate reputation. In addition, the new measure of corporate reputation does not pretend to be able to capture the essence of corporate reputation, since a significant part of the corporate reputation cannot be captured by Twitter: including consumer loyalty component of branding, corporate identity or the desired identity of a company. However, the new measure of corporate reputation enables us to observe the evolution of corporate reputation over time and especially the notoriety of a company. It is therefore a complimentary tool for the assessment of existing reputations, and it is absolutely not a self-sufficient tool

    Représentations robustes de documents bruités dans des espaces homogènes

    Get PDF
    In the Information Retrieval field, documents are usually considered as a "bagof-words". This model does not take into account the temporal structure of thedocument and is sensitive to noises which can alter its lexical form. These noisescan be produced by different sources : uncontrolled form of documents in microbloggingplatforms, automatic transcription of speech documents which are errorprone,lexical and grammatical variabilities in Web forums. . . The work presented inthis thesis addresses issues related to document representations from noisy sources.The thesis consists of three parts in which different representations of content areavailable. The first one compares a classical representation based on a term-frequencyrepresentation to a higher level representation based on a topic space. The abstractionof the document content allows us to limit the alteration of the noisy document byrepresenting its content with a set of high-level features. Our experiments confirm thatmapping a noisy document into a topic space allows us to improve the results obtainedduring different information retrieval tasks compared to a classical approach based onterm frequency. The major problem with such a high-level representation is that it isbased on a space theme whose parameters are chosen empirically.The second part presents a novel representation based on multiple topic spaces thatallow us to solve three main problems : the closeness of the subjects discussed in thedocument, the tricky choice of the "right" values of the topic space parameters and therobustness of the topic-based representation. Based on the idea that a single representationof the contents cannot capture all the relevant information, we propose to increasethe number of views on a single document. This multiplication of views generates "artificial"observations that contain fragments of useful information. The first experimentvalidated the multi-view approach to represent noisy texts. However, it has the disadvantageof being very large and redundant and of containing additional variability associatedwith the diversity of views. In the second step, we propose a method based onfactor analysis to compact the different views and to obtain a new robust representationof low dimension which contains only the informative part of the document whilethe noisy variabilities are compensated. During a dialogue classification task, the compressionprocess confirmed that this compact representation allows us to improve therobustness of noisy document representation.Nonetheless, during the learning process of topic spaces, the document is consideredas a "bag-of-words" while many studies have showed that the word position in a7document is useful. A representation which takes into account the temporal structureof the document based on hyper-complex numbers is proposed in the third part. Thisrepresentation is based on the hyper-complex numbers of dimension four named quaternions.Our experiments on a classification task have showed the effectiveness of theproposed approach compared to a conventional "bag-of-words" representation.En recherche d’information, les documents sont le plus souvent considérés comme des "sacs-de-mots". Ce modèle ne tient pas compte de la structure temporelle du document et est sensible aux bruits qui peuvent altérer la forme lexicale. Ces bruits peuvent être produits par différentes sources : forme peu contrôlée des messages des sites de micro-blogging, messages vocaux dont la transcription automatique contient des erreurs, variabilités lexicales et grammaticales dans les forums du Web. . . Le travail présenté dans cette thèse s’intéresse au problème de la représentation de documents issus de sources bruitées.La thèse comporte trois parties dans lesquelles différentes représentations des contenus sont proposées. La première partie compare une représentation classique utilisant la fréquence des mots à une représentation de haut-niveau s’appuyant sur un espace de thèmes. Cette abstraction du contenu permet de limiter l’altération de la forme de surface du document bruité en le représentant par un ensemble de caractéristiques de haut-niveau. Nos expériences confirment que cette projection dans un espace de thèmes permet d’améliorer les résultats obtenus sur diverses tâches de recherche d’information en comparaison d’une représentation plus classique utilisant la fréquence des mots.Le problème majeur d’une telle représentation est qu’elle est fondée sur un espace de thèmes dont les paramètres sont choisis empiriquement.La deuxième partie décrit une nouvelle représentation s’appuyant sur des espaces multiples et permettant de résoudre trois problèmes majeurs : la proximité des sujets traités dans le document, le choix difficile des paramètres du modèle de thèmes ainsi que la robustesse de la représentation. Partant de l’idée qu’une seule représentation des contenus ne peut pas capturer l’ensemble des informations utiles, nous proposons d’augmenter le nombre de vues sur un même document. Cette multiplication des vues permet de générer des observations "artificielles" qui contiennent des fragments de l’information utile. Une première expérience a validé cette approche multi-vues de la représentation de textes bruités. Elle a cependant l’inconvénient d’être très volumineuse,redondante, et de contenir une variabilité additionnelle liée à la diversité des vues. Dans un deuxième temps, nous proposons une méthode s’appuyant sur l’analyse factorielle pour fusionner les vues multiples et obtenir une nouvelle représentation robuste,de dimension réduite, ne contenant que la partie "utile" du document tout en réduisant les variabilités "parasites". Lors d’une tâche de catégorisation de conversations,ce processus de compression a confirmé qu’il permettait d’augmenter la robustesse de la représentation du document bruité.Cependant, lors de l’élaboration des espaces de thèmes, le document reste considéré comme un "sac-de-mots" alors que plusieurs études montrent que la position d’un terme au sein du document est importante. Une représentation tenant compte de cette structure temporelle du document est proposée dans la troisième partie. Cette représentation s’appuie sur les nombres hyper-complexes de dimension appelés quaternions. Nos expériences menées sur une tâche de catégorisation ont montré l’efficacité de cette méthode comparativement aux représentations classiques en "sacs-de-mots"

    Valorisation de l’information sur les marchés financiers par l’utilisation des mégadonnées

    Get PDF
    RÉSUMÉ : La finance 3.0 est encore dans ses balbutiements. Pourtant les mégadonnées représentent une opportunité sans précédent pour l’industrie. À travers cette recherche, nous caractérisons l’impact financier de deux types de messages publiés sur Twitter, notamment sur quatre types de rendements de compagnies inscrites au S&P500. Dans le cas des rendements journaliers, l’influence des messages financiers s’avère significative et peut être prise en compte dans les modèles prédictifs. En ce qui concerne les rendements nocturnes, les deux types de messages peuvent être utilisés (messages financiers et messages mentionnant les noms des compagnies), même si l’impact de ces messages n’est pas de même ampleur. Nous étudions aussi les rendements anormaux de ces compagnies, les volumes d’actions échangées et l’impact de la publication des rapports financiers. Au niveau méthodologique, l’utilisation de modèles économétriques probit a permis de mettre au point des tableaux de contrôle optimisant les opportunités de gain en fonction des jours de la semaine et des types d’industries visés. La deuxième partie de cette étude se penche sur l’analyse du contenu des messages financiers, et l’identification des utilisateurs du réseau. Les mesures de réputation traditionnelles s’avèrent inefficaces pour obtenir un signal nettoyé de tout bruit. À l’inverse, une approche par cartographie permet de mettre en lumière les nœuds sensibles du maillage des utilisateurs en identifiant les éléments clefs à suivre. Finalement, nous proposons une stratégie d’investissement ayant présenté des rendements supérieurs à l’indice de référence, puis nous concluons par des recommandations quant à l’utilisation des médias sociaux pour les investisseurs, les firmes inscrites en bourse, les organismes régulateurs et l’industrie financière en général.----------ABSTRACT : Finance 3.0 is still in its early stages. However, using Big Data represents huge opportunities for the financial industry. In this study, we compare the influence of two kinds of message sent on Twitter (a microblogging social network) over different types of return concerning firms listed on the S&P500. For daily returns, one should consider financial tweet in particular, whereas for overnight returns, both financial texts and messages naming a company could be considered. We investigate the impact of these messages on abnormal returns, on exchange volumes and during the release of quarterly reports. Investment dashboards have been implemented following these findings, allowing one to optimize its gain opportunities depending on the investment day or the industry targetted. The second part of this study explores the content of financial tweets and the description of their senders. Typical reputation measurements could not provide enough insights due to the high level of noise in the data. However, by sketching the network of users, identifying key components was possible. Finally, we propose an efficient trading strategy outperforming the S&P500 index, and we conclude the study by recommandations concerning the use of social media for investors, firms, regulators and the financial industry in general

    La communication marketing à l’ère des réseaux sociaux numériques

    Get PDF
    Nowadays, digital social networks (DSN) are at the heart of marketing communication. This new form of communication allows communicating and sell directly to the target thanks to its interactive features. Moreover, DSNs are becoming a guarantee of efficiency in marketing communication because of the contextual targeting offered by their recommendation systems. The objective of this contribution is to show how the technical recommendation systems of the SNRs promote the relevance of contextual targeting thanks to the development of social recommendations. In this sense, the E-Leader of Opinion and the E-WOM between peers plays a crucial role. Indeed, if the recommendation systems of the SNRs favor marketing targeting, the E-Leader of Opinion and the E-WOM via peers guarantee the virality of marketing communication. In this perspective, this research work entitled "Marketing Communication in the Digital Social Network Era" is based on a review of narrative literature through the mobilization of the theory of media effects, the theory of prescription relationships and the theory of social networks.   Keywords : Marketing communication, Digital social networks, Contextual targeting, E-Leader, E-WOM, Social recommendation. JEL Classification: M37, O35 Type of article: Theoretical article    nouvelle forme de communication permet de communiquer et vendre directement Ă  la cible grâce Ă  ses fonctionnalitĂ©s interactives. D’ailleurs, les R.S.N. deviennent un gage d’efficacitĂ© de la communication marketing en raison du ciblage contextuel offert par leurs systèmes de recommandation. L’objectif de cette contribution est de montrer comment les systèmes de recommandation techniques des R.S.N. favorisent la pertinence du ciblage contextuel grâce au dĂ©veloppement de la recommandation sociale. Dans ce sens, les E-Leader d’Opinion et le E-WOM entre les pairs y jouent un rĂ´le crucial. En effet, si les systèmes de recommandation des R.S.N. favorisent le ciblage marketing, les E-Leader d’Opinion et le E-WOM via les pairs garantissent la viralitĂ© de la communication marketing. Dans cette perspective, ce travail de recherche intitulĂ© «La Communication Marketing Ă€ L’ère Des RĂ©seaux Sociaux NumĂ©riques » repose sur une revue de littĂ©rature narrative Ă  travers la mobilisation de la thĂ©orie des effets des mĂ©dias, la thĂ©orie des rapports de prescription ainsi que la thĂ©orie des rĂ©seaux sociaux.   Mots clĂ©s : Communication marketing, RĂ©seaux sociaux numĂ©riques, Ciblage contextuel, E-Leader d’Opinion, E-WOM, Recommandation sociale. Classification JEL: M37, O35 Type article: Article thĂ©orique &nbsp

    Communication virale dans la publicité au sein des espaces numériques : Approche critique et expérimentale du phénomène

    Get PDF
    Our thesis examines the notion of viral communication in digital social spaces both in general and when applied to online video advertisement. Our research revealed a lack of clarity and coherence in its definition and meaning (Beauvisage et al., 2011) that necessited an effort of standardization before planning to pursue our work. Furthermore, our literature review pointed out the complexity of the viral phenomenon and its comprehension. This complexity is due to the number and different factors originating the viral phenomenon (Beauvisage et al., 2011).In order to highlight one of those factors, we make the first hypothesis that the variations in the quality of the definition (high or standard) of a video have an effect over the evaluation of the video (H1). Corollary, we think that the quality of the definition affects this video sharings (H2). More precisely, we think that a video will be more shared if it is watched in high definition rather than in standard definition. In order to meet those hypotheses, we opted for an experimental approach.Notre thèse interroge la notion de communication virale dans les espaces socionumériques de manière générale et plus particulièrement lorsque ce phénomène s’applique aux vidéos publicitaires en ligne. Nos recherches ont révélé un manque évident de clarté et de cohérence au niveau de sa définition et de son acception (Beauvisage et al., 2011) qu’il a fallu corriger par un travail d’harmonisation avant d’envisager la suite de nos travaux. De plus, notre revue de littérature a mis en avant la complexité du phénomène viral et de son appréhension ; complexité nourrie par le nombre et la nature des facteurs à son origine (Beauvisage et al., 2011). Afin de mettre en avant un de ces facteurs, nous émettons pour première hypothèse que les variations de qualité de la définition (haute ou standard) d’une vidéo influencent l’appréciation de la vidéo (H1). Par corollaire, nous pensons que le partage de cette vidéo est affecté par la qualité de la définition (H2). Plus précisément, nous pensons qu’une même vidéo sera plus partagée si elle est visionnée en haute définition plutôt qu’en définition standard. Pour répondre à ces hypothèses nous avons opté pour une approche expérimentale

    Connexions sociales

    Get PDF
    • …
    corecore