6 research outputs found

    Méthodes spatio-temporelles de fouilles des données de cartes à puce en transport urbain

    Get PDF
    RÉSUMÉ: Les données des cartes à puce du système de transport en commun sont utiles pour comprendre le comportement des usagers du réseau du transport en commun. De nombreuses recherches pertinentes ont déjà été menées concernant : (1) l'utilisation de données de cartes à puce, (2) les techniques de fouille de données et (3) l'utilisation de la fouille de données avec des données de cartes à puce. Dans ces recherches, la classification des comportements des usagers est basée sur des déplacements pour lesquels les classifications temporelles et spatiales sont considérées comme des processus séparés. Nos partenaires de recherche ont exprimé le souhait de pouvoir examiner les comportements des usagers en considérant simultanément les dimensions spatiales et temporelles. Dans cette thèse, nous développons des méthodes, basées sur les comportements quotidiens des usagers, prenant en compte à la fois les comportements spatiaux et temporels. La méthodologie développée pour classifier les comportements des utilisateurs de cartes à puce s’appuie sur la méthode de distance corrélation croisée (cross correlation distance, ou CCD), sur la déformation temporelle dynamique (dynamic time warping ou DTW), sur la classification hiérarchique et sur l'échantillonnage. De plus, une méthode basée sur la densité est aussi abordée. Cette thèse est contribuée de quatre articles plus d’autre résultats présentés dans un chapitre distinct: (1) Afin de commencer la classification temporelle, une comparaison entre CCD et DTW est faite en vue de choisir la meilleure métrique et développer une méthode de classification des séries temporelles en utilisant la classification hiérarchique, et CCD a été prouvé meilleur dans ce cas-ci. Avec cette méthode proposée, un morceau des comportements temporels peut être classifié. (2) Afin de réaliser la classification temporelle pour les données massives, une méthode d’échantillonnage permettant de traiter les grands volumes de données provenant des systèmes de cartes à puce de transport en commun ainsi qu’un indicateur de calibration de cette méthode sont proposés. Cette méthode d’échantillonnage nous permet de classifier tous les comportements temporels d’usagers dans un réseau de transports en commun, et cet indicateur nous permet de choisir les meilleurs paramètres dans l’algorithme. (3) Afin de regrouper les comportements spatiaux et spatio-temporels d’usagers en transport en commun, des méthodes de classification spatiale et spatio-temporelle de comportements des usagers en ajustant l’algorithme de DTW sont développées, et des méthodes de visualisation des résultats en appliquant un graphique spatio-temporel en 3 dimensions sont aussi développées, en vue de montrer l'efficacité de l'algorithme. La visualisation des résultats nous montre l’effectivité de ces deux méthodes. (4) Afin de tester si la méthode de classification développée dans une ville s’applique dans une autre ville, nous développons une méthode de reconnaissance et de comparaison des comportements de deux villes entre le Canada et le Chile. Les résultats montent qu’environ 66% de comportements temporelles peuvent être reconnu donné un profile de transaction d’un jour, et l’exactitude de reconnaissance est environ 70%. (5) Afin d’analyser les résultats de les classifications spatiale et spatio-temporelle plus profonde, des analyses sont faits incluant la proportion de métro, le moyen et la déviation de trajectoire espace-temps etc, et ces analyse nous permet d’identifier les différences de demande entre les groupes obtenus. (6) En outre, des méthodes de classification de zones géographiques basées sur la densité pour la mesure du changement de comportements des usagers sont développés. Afin de tester ces méthodes, des données massives provenant des systèmes de perception automatique de la Société de Transport l’Outaouais (STO) de Gatineau et de TranSantiago de Santiago (Chili) sont utilisées. Concernant l’implémentation, les méthodes proposées sont programmées en Python. Les résultats des méthodes, non seulement permettent de regrouper les profils des usagers du transport en commun en quelques groupes et de mieux connaître les caractéristiques de chacun, mais aussi de développer une série de méthodes de visualisation, avec lesquelles les données peuvent être traitées automatiquement pour que des graphiques soient générés. Grâce à ces graphiques, les autorités de transport en commun peuvent traduire les données recueillies automatiquement pour illustrer la demande de transport. Par conséquent, des chercheurs espèrent ces contributions aideront les autorités pour planifier les transports en commun afin de mieux répondre aux demandes des citoyens.----------ABSTRACT: Transit smart card data is useful for understanding the behavior of transit users. Numerous relevant research has been conducted on: (1) the use of smart card data, (2) data mining techniques and (3) the use of data mining with smart card data. In this research, the classification of user behavior is based on travel in which temporal and spatial classifications are considered as separate processes. We develop methods, based on the daily behaviors of users, taking into account both spatial and temporal behaviors. The methodology developed to classify the behavior of smart card users is based on the cross correlation distance (CCD) method, dynamic time warping (DTW), hierarchical classification and sampling method. In addition, the density-based method is also affected. This thesis is presented with four articles plus other results in a separate chapter: (1) In order to start the temporal classification, a comparison between CCD and DTW is made in order to choose the best metric and develop a method of classification of time series using hierarchical classification. CCD has been proved better in this case. A piece of temporal behaviors can be classified with this proposed method. (2) In order to achieve temporal classification for Big Data, a sampling method for processing large volumes of data from transit smart card systems and a calibration indicator for this method are proposed. This sampling method allows us to classify all the users’ temporal behaviors in a public transport network, and this indicator allows us to choose the best parameters in the algorithm. (3) In order to classify the spatial and spatio-temporal behavior of users in public transport, methods of spatial and spatio-temporal classification of user behaviors by adjusting the DTW algorithm is developed, and a method of visualization of the results by applying a 3-dimensional spatio-temporal graph is also developed, to show the efficiency of the algorithm. The visualization of the results shows us the effectiveness of these two methods. (4) In order to test whether the classification method developed in one city applies in another city, we develop a method to recognize and compare the behavior of two cities between Canada and Chile. The results show that about 66% of temporal behaviors can be recognized given one-day transaction profiles of two cities, and the recognition accuracy is about 70%. (5) For a deeper view of the spatio-temporal classifications results, analyzes are made including the proportion of metro utilisation, the mean and the deviation of space-time trajectory etc, and these analyses allow us to identify the differences of demands between the clusters obtained. (6) In addition, density-based geographic classification methods for measuring the change of user behavior are developed. To test these methods, massive data from the Automated Collection System of the la Société de Transport l’Outaouais (STO) and the TranSantiago of Santiago de Chile are used. Regarding the implementation, the proposed methods are programmed in python. The result of these methods not only allows the profiles of transit users to be grouped in a few groups and better understand the characteristics of each, but also creates a series of visualization approaches with which data can be directly transferred to the graphs. With these graphs, transit authorities can translate automatically collected data into traveler demand. As a result, researchers hope that these contributions help the authorities to plan public transit by better meeting the demands of citizens

    Les treillis de Galois et leurs applications dans la classification textuelle

    Get PDF

    Une approche d'ingénierie ontologique pour l'acquisition et l'exploitation des connaissances à partir de documents textuels : vers des objets de connaissances et d'apprentissage

    Full text link
    Thèse numérisée par la Division de la gestion de documents et des archives de l'Université de Montréal

    Les industries lithiques du Protomagdalénien à partir des données nouvelles du site du Blot à Cerzat (Haute-Loire)

    Get PDF
    After a first part concerning the methodology used in this study (typology, quantitative methods), the second part recalls the data from the regional context, chronological and archaeological. The third part presents the results of the study of archaeological duprotomagdalenien blot: site description and stratigraphy, from raw materials, descriptive study of tools and characters typological and finally spatial analysis of habitat structures. The last part puts the results in the protomagdalenien: typological comparisons, technical study of microliths search operating chains of shaping chisels and characterization of the attributes of retouching "protomagdalenienne".Après une première partie concernant la méthodologie utilisée dans cette étude (typologie, méthodes quantitatives), la deuxième partie rappelle les données issues du contexte régional, chronologique et archéologique. La troisième partie présente les résultats de l'étude archéologique du Protomagdalénien du Blot : description du site et de la stratigraphie, provenance des matières premières, étude descriptive des outillages et caractères typologiques et enfin analyse spatiale des structures d'habitat. La dernière partie replace ces résultats dans le cadre duProtomagdalénien : comparaisons typologiques, étude technique des microlithes, recherche des chaines opératoires de façonnage des burins et caractérisation des attributs de la retouche "protomagdalénienne"

    Réponse démographique des Néandertaliens face aux pressions environnementales du stade isotopique 3 (approche par modélisation écologique)

    Get PDF
    Les Néandertaliens, dont l'évolution a eu lieu en Europe sur environ 300kans, disparaissent vers 30kans. Les déterminants de cette disparition restent encore aujourd'hui très discutés et plusieurs hypothèses tentent d'en expliquer les causes. Parmi celles privilégiées à ce jour on peut citer l'influence du climat, d'une compétition avec Homo sapiens, d'une épidémie ou de modifications démographiques. Cette recherche doctorale revisite ces différentes hypothèses par le biais de la modélisation mathématique. Cette approche originale synthétise et potentialise les données de la paléontologie classique afin de mieux comprendre les phénomènes associés à l'extinction des Néandertaliens. Après avoir réalisé une étude démographique à l'aide de modèle classiques, nous avons conçu des modèles déterministes spécifiques pour analyser les Néandertaliens et la chaine alimentaire à laquelle ils sont associés. Une fois ces modèles testés et validés, nous les avons utilisés pour analyser l'évolution démographique de la population néandertalienne au cours du stade isotopique 3 et nous avons comparés nos résultats avec les données des études préhistoriques, archéozoologiques ou encore paléoanthropologiques. Suite à notre analyse, nous suggérons d'exclure certaines hypothèses souvent avancées comme la compétition pour la ressource, les oscillations climatiques ou encore les épidémies. Une modification des caractéristiques intrinsèques de la population (fécondité et/ou vitesse de maturation) nous semble être une hypothèse bien plus plausible pour expliquer la disparition des Néandertaliens.The Neanderthal population lived and thrived in Europe during about 300ky in Middle Pleistocene. The causes of their disappearance about 30ky ago are strongly debated. Among the current hypotheses developed to explain this demographical crisis, competition with Modern humans, climate changes, epidemic diseases or demographical changes have often been evoked. The aim of this thesis was to re-analyse these assumptions and their determinants by using mathematical modelling. Models are used here to synthesize the data obtained by classical paleoanthropological studies and try to understand the complex and unknown phenomenon relative to the dramatic demographic fluctuation observed in Neanderthal populations during OIS3. Classical mathematical models are firstly used to analyse the influence of both demographical parameters and environmental stresses on the Neanderthal population. Next, we created new deterministic models more specified to the Neanderthal population. After checking the relevance of these models, we used them to analyse the demographical crisis of OIS3 and the information given by modelling have been checked with the information supplied by classical paleoanthropological, zooarchaeological and prehistorical studies. Our results allowed us to exclude the assumption of an epidemic disease or a climate change or even a resource competition as a cause of Neanderthal extinction whereas competition in a broad sense and above all demographic change could have led, under specific conditions, to Neanderthal demise. A demographic modification in the Neanderthal population across the time, in terms of fecundity or maturation speed, could be the reason of Neanderthals disappearance.AIX-MARSEILLE2-Bib.electronique (130559901) / SudocSudocFranceF
    corecore