5 research outputs found

    A low-latency, big database system and browser for storage, querying and visualization of 3D genomic data

    Get PDF
    Recent releases of genome three-dimensional (3D) structures have the potential to transform our understanding of genomes. Nonetheless, the storage technology and visualization tools need to evolve to offer to the scientific community fast and convenient access to these data. We introduce simultaneously a database system to store and query 3D genomic data (3DBG), and a 3D genome browser to visualize and explore 3D genome structures (3DGB). We benchmark 3DBG against state-of-the-art systems and demonstrate that it is faster than previous solutions, and importantly gracefully scales with the size of data. We also illustrate the usefulness of our 3D genome Web browser to explore human genome structures. The 3D genome browser is available at http://3dgb.cs.mcgill.c

    Nanometer-scale mapping of irreversible electrochemical nucleation processes on solid Li-ion electrolytes

    Get PDF
    Electrochemical processes associated with changes in structure, connectivity or composition typically proceed via new phase nucleation with subsequent growth of nuclei. Understanding and controlling reactions requires the elucidation and control of nucleation mechanisms. However, factors controlling nucleation kinetics, including the interplay between local mechanical conditions, microstructure and local ionic profile remain inaccessible. Furthermore, the tendency of current probing techniques to interfere with the original microstructure prevents a systematic evaluation of the correlation between the microstructure and local electrochemical reactivity. In this work, the spatial variability of irreversible nucleation processes of Li on a Li-ion conductive glass-ceramics surface is studied with ~30 nm resolution. An increased nucleation rate at the boundaries between the crystalline AlPO4 phase and amorphous matrix is observed and attributed to Li segregation. This study opens a pathway for probing mechanisms at the level of single structural defects and elucidation of electrochemical activities in nanoscale volumes

    American Gut: an Open Platform for Citizen Science Microbiome Research

    Get PDF
    McDonald D, Hyde E, Debelius JW, et al. American Gut: an Open Platform for Citizen Science Microbiome Research. mSystems. 2018;3(3):e00031-18

    Data visualization and crowdsourcing approaches for complex data analysis

    No full text
    State-of-the-art machine learning algorithms (e.g., convolution neural networks, long short term memory recurrent networks) have allowed human-driven analysis to become completely automated. However, there is an increasing need for human supervision and intuition when automating these analyses. The objective of this thesis is to analyze crowdsourcing and human computation in Human-Computer Interaction (HCI) systems, which engage human participants to efficiently solve problems that are hard for computers but intuitive for humans. This thesis addresses questions related to problems of data decomposition, visualization, and interpretation from the perspective of HCI. Solution assembly strategies, as well as user motivation, will also be explored.First, to inform the design of HCI systems, data visualization techniques are explored. The goal of this project is to design HCI systems that are convenient for humans and allow data to be easily interpreted. Genomics was a natural choice for this study as the field explore complex data sets (e.g., Hi-C and Experimental ChIP-Sequencing data) that require advance visualization to allow a user to interpret the data. Here, we describe 3DGB, an interactive web-based 3D genome browser that is capable of visualizing and exploring 3D genome structures. 3DGB provides the user with a simplified tool set that improves the interpretability for complex 3D genomic data (like Hi-C), regardless of a user’s background knowledge in genomics.Next, we address the problem of large-scale human collaboration by designing and implementing a multiplayer, real-time simulation, called the 'Market game'. This game-with-a-purpose creates a market simulation to investigate a competitive, yet collaborative, environment for players to solve classical graph theory problem. 'Market game' simulations have allowed us to develop multiple tools that promote and enhance collaboration within a large-scale HCI system.Finally, an application of HCI techniques in cluster analysis is explored. Here, a mobile online human computing game, called `Colony B’, is used to collect human annotations of 2D clustering problems. Our work then characterizes the collection of human-perceived 2D clusters relative to standard automated clustering techniques. The results of this experiment demonstrate the specificity of aggregated human annotations and show that these clusters are approximately the same quality as those produced by clustering algorithms. Colony B is designed to accommodate high dimensionality problems and allows us to address the curse of dimensionality. Finally, we propose two crowdsourcing multidimensional clustering algorithms that partially or entirely rely on aggregated human answers and benchmark them against state-of-the-art fully-automated clustering algorithms.Des algorithmes d’apprentissage automatique de pointe (réseaux de neurones de convolution, réseaux récurrents à mémoire à court et long terme, par exemple) ont permis à l’analyse de données manuelle de devenir complètement automatisée. Cependant, on observe un besoin croissant de supervision humaine et d'intuition lors de l'automatisation de ces analyses. L'objectif de cette thèse est d'analyser le crowdsourcing et le calcul humain dans les systèmes d'interaction homme-machine (IHM), qui engagent les participants humains à résoudre efficacement des problèmes difficiles pour les ordinateurs mais intuitifs pour les humains. Cette thèse aborde des questions liées aux problèmes de décomposition, de visualisation et d’interprétation des données du point de vue de HCI. Les stratégies d'assemblage de solutions, ainsi que la motivation des utilisateurs, seront également explorées.Tout d'abord, pour se familiariser avec la conception des systèmes HCI, nous avons exploré les techniques de visualisation des données. Le but de ce projet est de concevoir des systèmes HCI qui conviennent aux humains et permettent d’interpréter facilement les données. La génomique était un choix naturel pour cette étude, car ce domaine couvre des ensembles de données complexes (par exemple, des données de séquençage PIP et Hi-C expérimentales) qui nécessitent une visualisation avancée pour permettre aux utilisateurs d'interpréter les données. Nous décrivons ici 3DGB, un navigateur Web interactif pour le génome 3D, capable de visualiser et d’explorer les structures du génome 3D. 3DGB fournit aux utilisateurs un ensemble d'outils simplifiés qui améliorent l'interprétation des données génomiques 3D complexes (telles que Hi-C), quelles que soient les connaissances de base de l'utilisateur en génomique.Nous abordons ensuite le problème de la collaboration humaine à grande échelle en concevant et en mettant en œuvre une simulation multijoueur en temps réel, appelée le «jeu du marché». Ce jeu de calcul (GWAP) crée une simulation de marché pour étudier un environnement concurrentiel, mais collaboratif, permettant aux joueurs de résoudre un problème classique de la théorie des graphes. Les simulations de «jeux de marché» nous ont permis de développer de multiples outils qui favorisent et améliorent la collaboration au sein d'un système HCI à grande échelle.Enfin, nous finissons par une application des techniques HCI en analyse par grappe. Ici, un jeu mobile en ligne d’informatique humaine, appelé «Colony B», est utilisé pour collecter des annotations, écrites par l’homme, de problèmes de classification 2D. Notre travail caractérise ensuite la collection de clusters 2D perçus par l'homme par rapport aux techniques de clustering automatisées standards. Les résultats de cette expérience démontrent la spécificité des annotations humaines agrégées et montrent que ces grappes ont approximativement la même qualité que celles produites par les algorithmes de groupement. Colony B est conçu pour prendre en charge les problèmes de haute dimensionnalité et nous permet de faire face à la malédiction de la dimensionnalité. En conclusion, nous proposons deux algorithmes de clustering multidimensionnels en crowdsourcing qui reposent partiellement ou entièrement sur des réponses humaines agrégées et les comparons à des algorithmes de clustering de pointe entièrement automatisés
    corecore