8 research outputs found

    Application des techniques d'apprentissage automatique pour la prédiction de la tendance des titres financiers

    Get PDF
    Ce mémoire examine l'utilisation des algorithmes et des techniques d'apprentissage automatique pour la prédiction de la direction des cours des actifs financiers à très court terme (par exemple, de quelques minutes à quelques heures). L’objectif à la fin est de concevoir un système décisionnel autonome capable d’automatiser la négociation des titres financiers en générant une prédiction de la tendance future du prix, en se basant sur les flux de données des transactions antérieures. Nous avons étudié comment la distribution des mouvements boursiers peut être asymétrique. Ce biais dans les données ajoute plus de complexité à la tâche de prédiction. On a proposé trois méthodes pour faire face à ce problème. Entre autres, le rééchantillonnage des données, la modification des seuils des probabilités qui servent à générer la classification et l’utilisation des coûts pour pénaliser les mauvaises classifications de la classe majoritaire. On a aussi constaté l’existence de dépendances temporelles dans les séries des prix des titres boursiers utilisés. Cette composante devra être considérée lors de la génération de nos ensembles d’entrainement et d’évaluation. En effet, l’exactitude de l’inférence faite à partir des données d’entrainement sur de nouvelles données, dépendra de la similarité des propriétés statistiques des deux ensembles de données. Nous avons aussi illustré que le choix des variables à utiliser, les indicateurs techniques pour ce projet, est une tâche qui nécessite beaucoup de rigueur. Comme nous l’avons démontré, il existe de fortes corrélations entre les indicateurs techniques qui sont dérivés des mêmes séries de données. C’est pourquoi, il faut être prudent dans le choix de ces indicateurs. Utiliser des indicateurs qui reflètent la même information, risque d’introduire beaucoup de bruit dans nos modèles et affecter leurs performances. Nous avons expliqué comment on peut faire face à ce problème et comment on peut réduire la dimensionnalité de nos données ainsi que l’interaction entre les variables explicatives. L’existence des dérives conceptuelles dans les séries temporelles financières est un phénomène courant. En comparant des données sur des fenêtres temporelles différentes, on peut observer comment la distribution de la variable cible change. Une solution que nous proposons dans ce projet consiste à utiliser une technique d’évaluation dynamique, où chaque nouvelle instance sera prédite à partir d’un historique de données qui est dynamique. À chaque fois, la valeur collectée la plus récente est comparée à notre prédiction et intégrée dans nos données d’entrainement. À la fin de ce projet nous avons illustré qu’il est possible de prédire les mouvements des titres boursiers en utilisant les techniques d’apprentissage automatique. La performance de nos prédictions était significativement plus élevée que si on suppose que le mouvement boursier suit une marche aléatoire. Nous avons aussi montré qu’il est possible d’implémenter des stratégies de négociation gagnantes basées sur l’apprentissage automatique et qui génèrent beaucoup plus de profits, que si on opte pour une gestion passive

    MĂ©trologie des graphes de terrain, application Ă  la construction de ressources lexicales et Ă  la recherche d'information

    Get PDF
    This thesis is organized in two parts : the first part focuses on measures of similarity (or proximity) between vertices of a graph, the second part on clustering methods for bipartite graph. A new measure of similarity between vertices, based on short time random walks, is introduced. The main advantage of the method is that it is insensitive to the density of the graph. A broad state of the art of similarities between vertices is then proposed, as well as experimental comparisons of these measures. This is followed by the proposal of a robust method for comparing graphs sharing the same set of vertices. This measure is shown to be applicable to the comparison and merging of synonymy networks. Finally an application for the enrichment of lexical resources is presented. It consists in providing candidate synonyms on the basis of already existing links. In the second part, a parallel between formal concept analysis and clustering of bipartite graph is established. This parallel leads to the particular case where a partition of one of the vertex groups can be determined whereas there is no corresponding partition on the other group of vertices. A simple method that addresses this problem is proposed and evaluated. Finally, a system of automatic classification of search results (Kodex) is presented. This system is an application of previously seen clustering methods. An evaluation on a collection of two million web pages shows the benefits of the approach and also helps to understand some differences between clustering methods.Cette thèse s'organise en deux parties : une première partie s'intéresse aux mesures de similarité (ou de proximité) définies entre les sommets d'un graphe, une seconde aux méthodes de clustering de graphe biparti. Une nouvelle mesure de similarité entre sommets basée sur des marches aléatoires en temps courts est introduite. Cette méthode a l'avantage, en particulier, d'être insensible à la densité du graphe. Il est ensuite proposé un large état de l'art des similarités entre sommets, ainsi qu'une comparaison expérimentale de ces différentes mesures. Cette première partie se poursuit par la proposition d'une méthode robuste de comparaison de graphes partageant le même ensemble de sommets. Cette méthode est mise en application pour comparer et fusionner des graphes de synonymie. Enfin une application d'aide à la construction de ressources lexicales est présentée. Elle consiste à proposer de nouvelles relations de synonymie à partir de l'ensemble des relations de synonymie déjà existantes. Dans une seconde partie, un parallèle entre l'analyse formelle de concepts et le clustering de graphe biparti est établi. Ce parallèle conduit à l'étude d'un cas particulier pour lequel une partition d'un des groupes de sommets d'un graphe biparti peut-être déterminée alors qu'il n'existe pas de partitionnement correspondant sur l'autre type de sommets. Une méthode simple qui répond à ce problème est proposée et évaluée. Enfin Kodex, un système de classification automatique des résultats d'une recherche d'information est présenté. Ce système est une application en RI des méthodes de clustering vues précédemment. Une évaluation sur une collection de deux millions de pages web montre les avantages de l'approche et permet en outre de mieux comprendre certaines différences entre méthodes de clustering

    Application des techniques d'apprentissage automatique pour la prédiction de la tendance des titres financiers

    Get PDF
    Ce mémoire examine l'utilisation des algorithmes et des techniques d'apprentissage automatique pour la prédiction de la direction des cours des actifs financiers à très court terme (par exemple, de quelques minutes à quelques heures). L’objectif à la fin est de concevoir un système décisionnel autonome capable d’automatiser la négociation des titres financiers en générant une prédiction de la tendance future du prix, en se basant sur les flux de données des transactions antérieures. Nous avons étudié comment la distribution des mouvements boursiers peut être asymétrique. Ce biais dans les données ajoute plus de complexité à la tâche de prédiction. On a proposé trois méthodes pour faire face à ce problème. Entre autres, le rééchantillonnage des données, la modification des seuils des probabilités qui servent à générer la classification et l’utilisation des coûts pour pénaliser les mauvaises classifications de la classe majoritaire. On a aussi constaté l’existence de dépendances temporelles dans les séries des prix des titres boursiers utilisés. Cette composante devra être considérée lors de la génération de nos ensembles d’entrainement et d’évaluation. En effet, l’exactitude de l’inférence faite à partir des données d’entrainement sur de nouvelles données, dépendra de la similarité des propriétés statistiques des deux ensembles de données. Nous avons aussi illustré que le choix des variables à utiliser, les indicateurs techniques pour ce projet, est une tâche qui nécessite beaucoup de rigueur. Comme nous l’avons démontré, il existe de fortes corrélations entre les indicateurs techniques qui sont dérivés des mêmes séries de données. C’est pourquoi, il faut être prudent dans le choix de ces indicateurs. Utiliser des indicateurs qui reflètent la même information, risque d’introduire beaucoup de bruit dans nos modèles et affecter leurs performances. Nous avons expliqué comment on peut faire face à ce problème et comment on peut réduire la dimensionnalité de nos données ainsi que l’interaction entre les variables explicatives. L’existence des dérives conceptuelles dans les séries temporelles financières est un phénomène courant. En comparant des données sur des fenêtres temporelles différentes, on peut observer comment la distribution de la variable cible change. Une solution que nous proposons dans ce projet consiste à utiliser une technique d’évaluation dynamique, où chaque nouvelle instance sera prédite à partir d’un historique de données qui est dynamique. À chaque fois, la valeur collectée la plus récente est comparée à notre prédiction et intégrée dans nos données d’entrainement. À la fin de ce projet nous avons illustré qu’il est possible de prédire les mouvements des titres boursiers en utilisant les techniques d’apprentissage automatique. La performance de nos prédictions était significativement plus élevée que si on suppose que le mouvement boursier suit une marche aléatoire. Nous avons aussi montré qu’il est possible d’implémenter des stratégies de négociation gagnantes basées sur l’apprentissage automatique et qui génèrent beaucoup plus de profits, que si on opte pour une gestion passive

    Modèles de prédiction de krachs boursiers issus de bulles économiques

    Get PDF
    L'effondrement des marchés boursiers est un phénomène de plus en plus fréquent et affecte plus ou moins directement la population entière de la planète. Il est donc primordial de développer des outils afin de modéliser et de prévoir de tels événements. Mais pourquoi alors n'avons-nous pas encore proposé de solution ultime à un problème aussi important? Quelles sont les problématiques principales qui nous en empêchent? C'est dans cet ordre d'idées que nous exposerons divers modèles proposés par des experts de référence dans leurs domaines respectifs et que nous identifierons les diverses problématiques qui surviennent lors de l'étude de ces modèles. Une étude plus approfondie de l'un des modèles actuels les plus présomptueux sera effectuée : il s'agit du modèle LPPL (ou Log periodic power-law), suggéré pour la première fois en 1996 par Sornette, Johansen et Bouchaud [60]. Ces derniers suggèrent notamment que les prix d'une action en présence d'une bulle économique soient modélisés selon la formule : lnp(t) = A + B(t[indice inférieur c] - t)[indice supérieur beta]{1 +C cos([omega]ln(t[indice inférieur c] - t) + [phi])}. Enfin, un dernier chapitre sera consacré à la correction d'une prépublication récemment soumise à arXiv par Lin et Sornette [32] qui propose deux nouveaux modèles purement stochastiques. Note intéressante : le premier de ces modèles englobe sous forme de cas particulier la formule de Black-Scholes

    La production de l’urbain durable. L’enrôlement des concepteurs et des habitants par l’intégration des contradictions

    Get PDF
    The influence of neoliberalism on the production of urban spaces results in the commodification of spaces, the competition between cities, and the metropolisation process. It also generates the spread of watchwords, among which “project”, “sustainable urban development”, “participation” and “social diversity” are the most common.This creates contradictions between the rhetorical and practical aspects of the urban production: the opposition between the theoretically infinite horizon of the urban project on one side, and its realization in timed operations on the other side ; the gap between the values of sustainable urban development, and its achievements dictated by economic imperatives ; the contradiction between the injunction to participate and urban planning as a practice that remains top down ; the gap between advocated social diversity and socially selective urbanization.These contradictions are identified by both designers and inhabitants. However, despite their criticism, the level of conflict in contemporary urban production remains low. Therefore, this work aims to understand and explain which function these contradictions occupy, since they do not lead to an opposition.To achieve this objective, the thesis bases itself on structural constructivism, and the use of representations. Access to the representations of inhabitants and designers is achieved through the collection and analysis of their discourses on two emblematic projects, that are approached as mediation apparatuses of their representations: Bottière-Chénaie in Nantes and Confluence in Lyon.The analysis shows that the contradictions that were identified are integrated into the production mode. Their function is to mobilize: they are part of the enrollment of designers and inhabitants in the contemporary urban production.La production de l’espace urbain vise à la fois l’établissement d’une réalité matérielle, et la transmission de valeurs. Celle-ci s’effectue à travers les réalisations matérielles, et la diffusion de discours théoriques et pratiques sur la ville et l’espace. Chaque époque se caractérise par son mode de spatialisation qui reflète l’idéologie dominante et influence les représentations des acteurs, parmi lesquels ses concepteurs et ses habitants. La production contemporaine de l’urbain est ainsi marquée par le néolibéralisme. Cela se traduit par deux phénomènes, d’une part, la marchandisation des espaces au service des intérêts des villes, en concurrence à l’échelle mondiale, et le processus de métropolisation qui concentre les valeurs dans, et autour, des plus grosses d’entre elles. Cela se traduit, d’autre part, par la diffusion généralisée de certains mots d’ordre. Les plus répandus sont le projet, le développement urbain durable, la participation et la mixité sociale. Ce contexte et ces mots d’ordre introduisent des contradictions entre la rhétorique et la pragmatique de la production de l’urbain. Quatre sont principalement identifiées : l’opposition entre l’horizon théoriquement infini du projet, et sa concrétisation dans des opérations au temps limité et cadré ; le décalage entre les valeurs associées au développement urbain durable, et des réalisations dictées par des impératifs économiques ; la contradiction entre l’injonction à la participation, et une pratique de l’urbanisme demeurant descendante ; l’écart entre une mixité prônée, et une urbanisation socialement sélective.Bien que concepteurs et habitants identifient ces contradictions, et tiennent des discours critiques vis-à-vis de cette production, peu de conflictualité, sinon pas, émerge et en résulte. Partant de l’idée que si elles ne conduisent pas à l’opposition, ou au conflit, ces contradictions occupent une autre fonction, l’objectif de ce travail est de la mettre à jour, de l’interroger et de l’expliquer. Il en découle le jeu d’hypothèses suivant. La première est que cette fonction est d’ordre relationnelle, la deuxième est qu’il est possible de la rendre intelligible par l’étude dialectique, des représentations des deux groupes sociaux, de projets emblématiques, et la troisième est que celles-ci sont accessibles par les discours. À partir de ces hypothèses, et d’un positionnement critique sont développées les approches épistémologique, théorique, et méthodologique de la thèse. Elle s’appuie sur une épistémologie constructivo-structuraliste, et sur l’outil conceptuel que sont les représentations. Ces choix conduisent à modéliser le projet urbain comme un dispositif de médiation des représentations des concepteurs et des habitants. Puis, ils définissent les conditions qui rendent possible le fait à la saisie par les discours. Aussi, la méthode inhérente au travail est double : des visites libres et des entretiens semi directifs ; le couplage d’outils d’analyse de discours, et de contenu.L’examen des propos, recueillis auprès des acteurs des projets d’écoquartiers de Bottière-Chénaie (Nantes), et de Confluence (Lyon), montre que les contradictions mises en évidence sont intégrées au mode de production. Ainsi, elles n’occupent, non pas une fonction oppositionnelle mais mobilisationelle puisqu’elles participent, par différentes logiques, à enrôler concepteurs et habitants, consolidant ainsi la production contemporaine de l’urbain

    Le goût pour le Moyen Âge dans les fictions post-catastrophiques contemporaines : Une lecture mésocritique

    Get PDF
    Cette thèse a pour objectif de comprendre l’engouement pour le Moyen Âge dans la culture de genres contemporaine et, plus spécifiquement, dans les fictions post-catastrophiques. Ces fictions, dans la mesure où elles témoignent d’une appréciation négative du monde contemporain qui les a vues naître, appellent pour les analyser une herméneutique soucieuse d’examiner les relations qu’elles entretiennent avec la société d’où elles émergent. En raison de leur caractère utopique, de telles fictions opèrent une lecture symptômale de la conjoncture présente et proposent en retour une alternative (une contrepartie améliorative) sous la forme d’une société autre, sise dans un espace-temps autre. Nombre d’entre elles, produites dans les dernières décennies du XXe s. et au début du XXIe s., ont ceci de particulier qu’elles traitent moins d’organisations sociales que d’un écoumène, d’une part – un terme qui désigne l’ensemble des milieux humains vus comme les relations techniques et symboliques qu’une société entretient avec son environnement (Berque 2000b) – ainsi que des modalités de l’habiter en cet écoumène, d’autre part. L’hypothèse de départ de cette thèse est la suivante : le goût pour le Moyen Âge dans la culture de genres contemporaine témoigne moins d’une affinité des producteurs et des récepteurs d’œuvres médiévalistes avec cette période historique qu’avec l’écoumène et l’habiter qui la caractérisent – ou du moins ceux que la culture de genres contemporaine lui impute –, mais aussi d’un rejet symétrique de l’écoumène et de l’habiter contemporains. En d’autres termes, il est question ici d’un malaise de l’habiter. En vue d’atteindre l’objectif que nous nous sommes fixé, une perspective soucieuse d’examiner la représentation de l’écoumène et de l’habiter dans les fictions post-catastrophiques d’inspiration médiévale sera proposée, la mésocritique, de même qu’une méthode qui lui est propre, l’analyse mésogrammatique. Une fois cette perspective et cette méthode définies, elles seront appliquées à un corpus composé de la pentalogie romanesque The Maze Runner, de James Dashner, des franchises transmédiatiques Dead Rising, de Capcom, et Enslaved: Odyssey to the West, de Ninja Theory, ainsi que du roman Cloud Atlas, de David Mitchell
    corecore