1,781 research outputs found

    Modellierung der Zugänglichkeit zu öffentlichen Verkehrsmitteln auf der Grundlage von Raumbewegungsdaten

    Get PDF
    The thesis serves three objectives: 1) exploration of biking distances at individual transit stations from trajectory and smart card data, 2) investigation of transit catchment area to raise the public awareness of the transit accessibility at a general level, and 3) inspection of accessibility constrained by crowdedness at a fine-grained level.Die Dissertation hat drei Ziele: 1) Untersuchung der Fahrraddistanzen an den einzelnen Transitstationen anhand von Trajektorien- und Smartcard-Daten, 2) Untersuchung des Transit-Einzugsgebietes zur Sensibilisierung der Öffentlichkeit für die Zugänglichkeit des Transits auf allgemeiner Ebene und 3) Untersuchung der durch Überfüllung eingeschränkten Zugänglichkeit auf Detailebene

    Origin–destination matrices from smartphone apps for bus networks

    Get PDF
    The knowledge of passenger flows between each origin–destination (OD) pair is a main requirement in public transport for service planning, design, operation, and monitoring, and is represented by OD matrices. Although they can be determined by traditional approaches (e.g., surveys, ride-check counts, and/or smartcard-based methods), the availability of new technologies and the proliferation of portable devices triggers an emerging interest in building OD matrices from the apps of bus operators. This research proposes the first framework for the estimation of OD matrices on transit networks by processing smartphone app call detail records (SACDRs). The framework is experimentally tested on a sample of 30 workdays of an Italian bus operator. The results are represented by easy-to-read control dashboards based on maps, which help quantify and visualise the OD matrices in the metropolitan area of Cagliari (Italy). The experimentation shows that the framework can properly estimate the number of trips for both origin and destination w.r.t. OD matrices built from household surveys: the mean absolute error is on average lower than five movements for 90% of the origins and 85% of the destinations

    Spatiotemporal dynamics of public transport demand: a case study of Riga

    Get PDF
    Sustainable urban mobility remains an emerging research topic during last decades. In recent years, the smart card data collection systems have become widespread and many studies have been focused on usage of anonymized data from these systems for better understanding of mobility patterns of Public Transport (PT) passengers. Data-driven mobility patterns can benefit transport planners at strategic, tactical, and operational levels. A particular point of interest is a spatiotemporal dynamics of mobility patterns that highlights transformation of the PT passenger flows over the time continuously or in response to modifications of the PT system and policies. This study is aimed to estimation and analysis of the spatiotemporal dynamics of PT passenger flows in Riga (Latvia). A multi-stage methodology was proposed and includes three main stages: (1) estimation of individual trip vectors, (2) clustering of trip vectors into spatiotemporal mobility patterns, and (3) further analysis of mobility patterns’ dynamics. The best practice methods are applied at every stage of the proposed methodology: the smart card validation flow is used for extracting information on boarding locations; the trip chain approach is used for estimation of individual trip destinations; vector-based clustering algorithms are utilised for identification of mobility patterns and discovering their dynamics. The resulting methodology provides an advanced tool for observing and managing of PT demand fluctuation on a daily basis. The methodology was applied for mining of a large smart card data set (124 million records) for year 2018. Most important empirical results include obtained daily mobility patterns in Riga, their clusters, and within-cluster dynamics over the year. Obtained daily mobility patterns allows estimation of a city-level PT origin–destination matrix that is useful in many applied areas, e.g., dynamic passenger flow assignment models. Mobility pattern-based clustering of days allows effective comparison and flexible tuning of the PT system for different days of a week, public holidays, extreme weather conditions, and large events. Dynamics of mobility patterns allows estimating the effect of implementing changes (e.g., fare increase or road maintenance) and demand forecasting for user-focused development of PT system. First published online 6 January 202

    Full Issue 17(2)

    Get PDF

    Leveraging data from a smart card automatic fare collection system for public transit planning

    Get PDF
    RÉSUMÉ Le système de transport en commun est une créature artificielle et complexe. L’interaction spatio-temporelle entre l’offre de service par les opérateurs et la demande des usagers est difficile à mesurer et évolue constamment. C’est dans ce contexte que de nombreux efforts sont mis à la recherche de l’information et de la méthodologie qui peuvent contribuer à révéler et à comprendre cette relation dynamique afin que les services répondent aux besoins des voyageurs. Récemment, des changements aux paradigmes remodèlent ce processus. D’une part, les opérateurs de transport en commun adoptent une orientation axée sur la performance et le client. Ceci demande des données qui ne sont pas recueillies par des enquêtes traditionnelles. D’autre part, l’avancement des systèmes automatiques de collecte de données et leur adoption par les opérateurs génèrent une abondance de données dans un environnement où la collecte de données était auparavant limitée. Les systèmes d’analyse et de planification sont souvent adaptés à ces réalités et sont inadéquats pour exploiter de nouvelles sources de données. Au confluent de ces évolutions, se retrouvent un défi et une opportunité : apprivoiser les nouvelles technologies informationnelles dans le but de les réconcilier avec les besoins grandissants de données dans le domaine de transport en commun. Cette recherche se fonde sur un jeu de données de validation provenant d’un système de perception par carte à puce (CAP). Le but de la recherche est de développer de nouvelles méthodologies d’exploitation des données, notamment au niveau de leur traitement, de leur enrichissement et de leur analyse afin de mieux connaître la demande de transport en commun, d’améliorer la planification opérationnelle, de raffiner la gestion du système et de comprendre les comportements de déplacement. Le jeu de données principal provient du système de perception par CAP de la Société de transport de l’Outaouais (STO). Le système est muni de GPS et le jeu contient toutes les validations désagrégées pour le mois de février 2005. Les technologies informationnelles, incluant la base de données relationnelle, le système d’information géographique (SIG), les statistiques spatiales, le data mining et les visualisations, sont des principaux outils de traitement et d’analyse.----------ABSTRACT Public transit system is an artificial and complex creature. The interaction between operators’ supply and users’ demand is at the same time spatial and temporal. It is also difficult to measure and in constant evolution. There is a continuous quest for information and methodology that can help reveal and facilitate the understanding of this dynamic relationship, so that public transit services can be better organized to suit travelers’ needs. Recent paradigm shifts have contributed the reshaping of this process. On the one hand, public transit service has become more performance-driven and customer-oriented. These require data not covered by traditional survey methods. On the other hand, advances in passive data collection methods and their adoption by transit operators progressively transform the industry from data-poor to data-rich. Traditional analysis and planning tools are adapted to past conditions and are not suited to fully leverage new sources of data. At the confluence of these evolutions lies opportunity and challenge: to embrace the data-rich environment with the view of reconciling with the increasingly demanding data needs in public transit. The research is based on a set of validations data from a smart card automatic fare collection (AFC) system. The goal of the research is to develop new methods in data processing, data enrichment and data analysis in order to better quantify transit demand, enhance operations planning, improve system management and understand travel behaviour. The primary dataset comes from the smart card AFC of the Société de transport de l’Outaouais (STO). The system is equipped with GPS and the dataset contains all fare validations in a disaggregate form for the month of February 2005. Information technologies, including relational database, geographic information system (GIS), spatial statistics, data mining and visualization are the main data processing and analysis tools. Three overall principles guide the research: the information-based (data-driven) approach, the totally disaggregated approach and the object-oriented approach. Combined with multi-day smart card data, these principles lead to the multi-day information approach, a new concept used in the proposed data processing and enrichment procedures. The assumption is that each day of data represent partial information of the universe and may contain errors. By synthesizing the correct information from each day, it is possible to reconstruct complete knowledge. The latter is in turn used as a reference to analyze and interpret multi-day data

    Automated inference of full passenger journeys using fare-transaction and vehicle-location data

    Get PDF
    Thesis (M.C.P.)--Massachusetts Institute of Technology, Dept. of Urban Studies and Planning; and, (S.M. in Transportation)--Massachusetts Institute of Technology, Dept. of Civil and Environmental Engineering, 2012.This electronic version was submitted by the student author. The certified thesis is available in the Institute Archives and Special Collections.Cataloged from student-submitted PDF version of thesis.Includes bibliographical references (p. 147-155).Urban public transport providers have historically planned and managed their networks and services with limited knowledge of their customers' travel patterns. While ticket gates and bus fareboxes yield counts of passenger activity in specific stations and vehicles, the relationships between these transactions-the origins, interchanges, and destinations of individual passengers-have typically been acquired only through costly and therefore small and infrequent rider surveys. Building upon recent work on the utilization of automated fare-collection and vehicle-location systems for passenger-behavior analysis, this thesis presents methods for inferring the full journeys of all riders on a large public transport network. Using complete daily sets of data from London's Oyster farecard and iBus vehicle-location system, boarding and alighting times and locations are inferred for individual bus passengers, interchanges are inferred between passenger trips of various public modes, and full-journey origin-interchange-destination matrices are constructed, which include the estimated flows of non-farecard passengers. The outputs are validated against surveys and traditional origin-destination matrices, and the software implementation demonstrates that the procedure is efficient enough to be performed daily, enabling transport providers to observe travel behavior on all services at all times.by Jason B. Gordon.S.M.in TransportationM.C.P

    IEEE Access Special Section Editorial: Big Data Technology and Applications in Intelligent Transportation

    Get PDF
    During the last few years, information technology and transportation industries, along with automotive manufacturers and academia, are focusing on leveraging intelligent transportation systems (ITS) to improve services related to driver experience, connected cars, Internet data plans for vehicles, traffic infrastructure, urban transportation systems, traffic collaborative management, road traffic accidents analysis, road traffic flow prediction, public transportation service plan, personal travel route plans, and the development of an effective ecosystem for vehicles, drivers, traffic controllers, city planners, and transportation applications. Moreover, the emerging technologies of the Internet of Things (IoT) and cloud computing have provided unprecedented opportunities for the development and realization of innovative intelligent transportation systems where sensors and mobile devices can gather information and cloud computing, allowing knowledge discovery, information sharing, and supported decision making. However, the development of such data-driven ITS requires the integration, processing, and analysis of plentiful information obtained from millions of vehicles, traffic infrastructures, smartphones, and other collaborative systems like weather stations and road safety and early warning systems. The huge amount of data generated by ITS devices is only of value if utilized in data analytics for decision-making such as accident prevention and detection, controlling road risks, reducing traffic carbon emissions, and other applications which bring big data analytics into the picture

    Full Issue 19(4)

    Get PDF

    Forestogram: Biclustering Visualization Framework with Applications in Public Transport and Bioinformatics

    Get PDF
    RÉSUMÉ : Dans de nombreux problèmes d’analyse de données, les données sont exprimées dans une matrice avec les sujets en ligne et les attributs en colonne. Les méthodes de segmentations traditionnelles visent à regrouper les sujets (lignes), selon des critères de similitude entre ces sujets. Le but est de constituer des groupes de sujets (lignes) qui partagent un certain degré de ressemblance. Les groupes obtenus permettent de garantir que les sujets partagent des similitudes dans leurs attributs (colonnes), il n’y a cependant aucune garantie sur ce qui se passe au niveau des attributs (les colonnes). Dans certaines applications, un regroupement simultané des lignes et des colonnes appelé biclustering de la matrice de données peut être souhaité. Pour cela, nous concevons et développons un nouveau cadre appelé Forestogram, qui permet le calcul de ce regroupement simultané des lignes et des colonnes (biclusters)dans un mode hiérarchique. Le regroupement simultané des lignes et des colonnes de manière hiérarchique peut aider les praticiens à mieux comprendre comment les groupes évoluent avec des propriétés théoriques intéressantes. Forestogram, le nouvel outil de calcul et de visualisation proposé, pourrait être considéré comme une extension 3D du dendrogramme, avec une fusion orthogonale étendue. Chaque bicluster est constitué d’un groupe de lignes (ou de sujets) qui déplie un schéma fortement corrélé avec le groupe de colonnes (ou attributs) correspondantes. Cependant, au lieu d’effectuer un clustering bidirectionnel indépendamment de chaque côté, nous proposons un algorithme de biclustering hiérarchique qui prend les lignes et les colonnes en même temps pour déterminer les biclusters. De plus, nous développons un critère d’information basé sur un modèle qui fournit un nombre estimé de biclusters à travers un ensemble de configurations hiérarchiques au sein du forestogramme sous des hypothèses légères. Nous étudions le cadre suggéré dans deux perspectives appliquées différentes, l’une dans le domaine du transport en commun, l’autre dans le domaine de la bioinformatique. En premier lieu, nous étudions le comportement des usagers dans le transport en commun à partir de deux informations distinctes, les données temporelles et les coordonnées spatiales recueillies à partir des données de transaction de la carte à puce des usagers. Dans de nombreuses villes, les sociétés de transport en commun du monde entier utilisent un système de carte à puce pour gérer la perception des tarifs. L’analyse de cette information fournit un aperçu complet de l’influence de l’utilisateur dans le réseau de transport en commun interactif. À cet égard, l’analyse des données temporelles, décrivant l’heure d’entrée dans le réseau de transport en commun est considérée comme la composante la plus importante des données recueillies à partir des cartes à puce. Les techniques classiques de segmentation, basées sur la distance, ne sont pas appropriées pour analyser les données temporelles. Une nouvelle projection intuitive est suggérée pour conserver le modèle de données horodatées. Ceci est introduit dans la méthode suggérée pour découvrir le modèle temporel comportemental des utilisateurs. Cette projection conserve la distance temporelle entre toute paire arbitraire de données horodatées avec une visualisation significative. Par conséquent, cette information est introduite dans un algorithme de classification hiérarchique en tant que méthode de segmentation de données pour découvrir le modèle des utilisateurs. Ensuite, l’heure d’utilisation est prise en compte comme une variable latente pour rendre la métrique euclidienne appropriée dans l’extraction du motif spatial à travers notre forestogramme. Comme deuxième application, le forestogramme est testé sur un ensemble de données multiomiques combinées à partir de différentes mesures biologiques pour étudier comment l’état de santé des patientes et les modalités biologiques correspondantes évoluent hiérarchiquement au cours du terme de la grossesse, dans chaque bicluster. Le maintien de la grossesse repose sur un équilibre finement équilibré entre la tolérance à l’allogreffe foetale et la protection mécanismes contre les agents pathogènes envahissants. Malgré l’impact bien établi du développement pendant les premiers mois de la grossesse sur les résultats à long terme, les interactions entre les divers mécanismes biologiques qui régissent la progression de la grossesse n’ont pas été étudiées en détail. Démontrer la chronologie de ces adaptations à la grossesse à terme fournit le cadre pour de futures études examinant les déviations impliquées dans les pathologies liées à la grossesse, y compris la naissance prématurée et la prééclampsie. Nous effectuons une analyse multi-physique de 51 échantillons de 17 femmes enceintes, livrant à terme. Les ensembles de données comprennent des mesures de l’immunome, du transcriptome, du microbiome, du protéome et du métabolome d’échantillons obtenus simultanément chez les mêmes patients. La modélisation prédictive multivariée utilisant l’algorithme Elastic Net est utilisée pour mesurer la capacité de chaque ensemble de données à prédire l’âge gestationnel. En utilisant la généralisation empilée, ces ensembles de données sont combinés en un seul modèle. Ce modèle augmente non seulement significativement le pouvoir prédictif en combinant tous les ensembles de données, mais révèle également de nouvelles interactions entre différentes modalités biologiques. En outre, notre forestogramme suggéré est une autre ligne directrice avec l’âge gestationnel au moment de l’échantillonnage qui fournit un modèle non supervisé pour montrer combien d’informations supervisées sont nécessaires pour chaque trimestre pour caractériser les changements induits par la grossesse dans Microbiome, Transcriptome, Génome, Exposome et Immunome réponses efficacement.----------ABSTRACT : In many statistical modeling problems data are expressed in a matrix with subjects in row and attributes in column. In this regard, simultaneous grouping of rows and columns known as biclustering of the data matrix is desired. We design and develop a new framework called Forestogram, with the aim of fast computational and hierarchical illustration of biclusters. Often in practical data analysis, we deal with a two-dimensional object known as the data matrix, where observations are expressed as samples (or subjects) in rows, and attributes (or features) in columns. Thus, simultaneous grouping of rows and columns in a hierarchical manner helps practitioners better understanding how clusters evolve. Forestogram, a novel computational and visualization tool, could be thought of as a 3D expansion of dendrogram, with extended orthogonal merge. Each bicluster consists of group of rows (or samples) that unfolds a highly-correlated schema with their corresponding group of columns (or attributes). However, instead of performing two-way clustering independently on each side, we propose a hierarchical biclustering algorithm which takes rows and columns at the same time to determine the biclusters. Furthermore, we develop a model-based information criterion which provides an estimated number of biclusters through a set of hierarchical configurations within the forestogram under mild assumptions. We study the suggested framework in two different applied perspectives, one in public transit domain, another one in bioinformatics field. First, we investigate the users’ behavior in public transit based on two distinct information, temporal data and spatial coordinates gathered from smart card. In many cities, worldwide public transit companies use smart card system to manage fare collection. Analysis of this information provides a comprehensive insight of user’s influence in the interactive public transit network. In this regard, analysis of temporal data, describing the time of entering to the public transit network is considered as the most substantial component of the data gathered from the smart cards. Classical distance-based techniques are not always suitable to analyze this time series data. A novel projection with intuitive visual map from higher dimension into a three-dimensional clock-like space is suggested to reveal the underlying temporal pattern of public transit users. This projection retains the temporal distance between any arbitrary pair of time-stamped data with meaningful visualization. Consequently, this information is fed into a hierarchical clustering algorithm as a method of data segmentation to discover the pattern of users. Then, the time of the usage is taken as a latent variable into account to make the Euclidean metric appropriate for extracting the spatial pattern through our forestogram. As a second application, forestogram is tested on a multiomics dataset combined from different biological measurements to study how patients and corresponding biological modalities evolve hierarchically in each bicluster over the term of pregnancy. The maintenance of pregnancy relies on a finely-tuned balance between tolerance to the fetal allograft and protective mechanisms against invading pathogens. Despite the well-established impact of development during the early months of pregnancy on long-term outcomes, the interactions between various biological mechanisms that govern the progression of pregnancy have not been studied in details. Demonstrating the chronology of these adaptations to term pregnancy provides the framework for future studies examining deviations implicated in pregnancy-related pathologies including preterm birth and preeclampsia. We perform a multiomics analysis of 51 samples from 17 pregnant women, delivering at term. The datasets include measurements from the immunome, transcriptome, microbiome, proteome, and metabolome of samples obtained simultaneously from the same patients. Multivariate predictive modeling using the Elastic Net algorithm is used to measure the ability of each dataset to predict gestational age. Using stacked generalization, these datasets are combined into a single model. This model not only significantly increases the predictive power by combining all datasets, but also reveals novel interactions between different biological modalities. Furthermore, our suggested forestogram is another guideline along with the gestational age at time of sampling that provides an unsupervised model to show how much supervised information is necessary for each trimester to characterize the pregnancy-induced changes in Microbiome, Transcriptome, Genome, Exposome, and Immunome responses effectively

    Estimation of transit origin destination matrices using smart card fare data

    Get PDF
    • …
    corecore