76 research outputs found

    Multivariate Approaches to Classification in Extragalactic Astronomy

    Get PDF
    Clustering objects into synthetic groups is a natural activity of any science. Astrophysics is not an exception and is now facing a deluge of data. For galaxies, the one-century old Hubble classification and the Hubble tuning fork are still largely in use, together with numerous mono-or bivariate classifications most often made by eye. However, a classification must be driven by the data, and sophisticated multivariate statistical tools are used more and more often. In this paper we review these different approaches in order to situate them in the general context of unsupervised and supervised learning. We insist on the astrophysical outcomes of these studies to show that multivariate analyses provide an obvious path toward a renewal of our classification of galaxies and are invaluable tools to investigate the physics and evolution of galaxies.Comment: Open Access paper. http://www.frontiersin.org/milky\_way\_and\_galaxies/10.3389/fspas.2015.00003/abstract\>. \<10.3389/fspas.2015.00003 \&g

    Киберязык: многоязыковой электронный лексикографический проект

    Get PDF
    The Cyber-speak is an ongoing electronic lexicographic project that is based on the study of the late XX – early XXI century European languages vocabulary integral dynamics within the emergent computer technology framework. A methodology of computer vocabulary innovative elements phenomenological features identification is introduced supplying the template for a new study field – phenomenological neology and neography. The study approach provides for the innovative computer logosphere definition and stock inventory in terms of its integrity as a macro-body of phenomenological and dynamic specificity. Computer logosphere macrostructure is the bulk of innovative vocabulary units as a reference system to cyberreality substancial dimensions. Meaningful and formal boundaries, phenomenological and substantial features of innovative computer logosphere microstructure constituent – innovative computer terminos – are defined.Cyber-Speak - это продолжающийся электронный лексикографический проект, основанный на изучении интегральной динамики словарного запаса европейских языков конца XX - начала XXI века в рамках возникающих компьютерных технологий. Представлена ​​методология выявления феноменологических особенностей инновационных элементов компьютерной лексики, которая является шаблоном для нового направления исследований - феноменологической неологии и неографии. Подход к исследованию предусматривает инновационное компьютерное определение логосферы и инвентаризацию ее целостности как макро-тела феноменологической и динамической специфики. Макроструктура компьютерной логосферы представляет собой основную часть инновационных словарных единиц в качестве справочной системы для существенных измерений киберреальности. Определены содержательные и формальные границы, феноменологические и содержательные особенности инновационной составляющей микроструктуры компьютерной логосферы - инновационных компьютерных терминов.Cyber-Speak - це електронний лексикографічний проект, який базується на вивченні інтегральної динаміки словникового запасу європейських мов кінця XX - початку XXI століття в рамках нових комп'ютерних технологій. Впроваджено методологію ідентифікації феноменологічних ознак інноваційних елементів комп’ютерної лексики, що забезпечує шаблон для нового напрямку дослідження - феноменологічної неології та неографії. Підхід дослідження передбачає інноваційне визначення комп’ютерної логосфери та запас запасів з точки зору її цілісності як макросукупності феноменологічної та динамічної специфічності. Макроструктура комп’ютерної логосфери - це основна частина інноваційних словникових запасів як система відліку основних вимірів кіберреальності. Визначено змістовні та формальні межі, феноменологічні та суттєві особливості інноваційної складової мікроструктури логосфери комп’ютера - інноваційні комп’ютерні терміни

    Management of Scientific Images: An approach to the extraction, annotation and retrieval of figures in the field of High Energy Physics

    Get PDF
    El entorno de la información en la primera década del siglo XXI no tiene precedentes. Las barreras físicas que han limitado el acceso al conocimiento están desapareciendo a medida que los métodos tradicionales de acceso a información se reemplazan o se mejoran gracias al uso de sistemas basados en computador. Los sistemas digitales son capaces de gestionar colecciones mucho más grandes de documentos, confrontando a los usuarios de información con la avalancha de documentos asociados a su tópico de interés. Esta nueva situación ha creado un incentivo para el desarrollo de técnicas de minería de datos y la creación de motores de búsqueda más eficientes y capaces de limitar los resultados de búsqueda a un subconjunto reducido de los más relevantes. Sin embargo, la mayoría de los motores de búsqueda en la actualidad trabajan con descripciones textuales. Estas descripciones se pueden extraer o bien del contenido o a través de fuentes externas. La recuperación basada en el contenido no textual de documentos es un tema de investigación continua. En particular, la recuperación de imágenes y el desentrañar la información contenida en ellas están suscitando un gran interés en la comunidad científica. Las bibliotecas digitales se sitúan en una posición especial dentro de los sistemas que facilitan el acceso al conocimiento. Actúan como repositorios de documentos que comparten algunas características comunes (por ejemplo, pertenecer a la misma área de conocimiento o ser publicados por la misma institución) y como tales contienen documentos considerados de interés para un grupo particular de usuarios. Además, facilitan funcionalidades de recuperación sobre las colecciones gestionadas. Normalmente, las publicaciones científicas son las unidades más pequeñas gestionadas por las bibliotecas digitales científicas. Sin embargo, en el proceso de creación científica hay diferentes tipos de artefactos, entre otros: figuras y conjuntos de datos. Las figuras juegan un papel particularmente importante en el proceso de publicación científica. Representan los datos en una forma gráfica que nos permite mostrar patrones sobre grandes conjuntos de datos y transmitir ideas complejas de un modo fácilmente entendible. Los sistemas existentes para bibliotecas digitales facilitan el acceso a figuras, pero solo como parte de los ficheros sobre los que se serializa la publicación entera. El objetivo de esta tesis es proponer un conjunto de métodos ytécnicas que permitan transformar las figuras en productos de primera clase dentro del proceso de publicación científica, permitiendo que los investigadores puedan obtener el máximo beneficio a la hora de realizar búsquedas y revisiones de bibliografía existente. Los métodos y técnicas propuestos están orientados a facilitar la adquisición, anotación semántica y búsqueda de figuras contenidas en publicaciones científicas. Para demostrar la completitud de la investigación se han ilustrado las teorías propuestas mediante ejemplos en el campo de la Física de Partículas (también conocido como Física de Altas Energías). Para aquellos casos en los que se han necesitadoo en las figuras que aparecen con más frecuencia en las publicaciones de Física de Partículas: los gráficos científicos denominados en inglés con el término plots. Los prototipos que propuestas más detalladas han desarrollado para esta tesis se han integrado parcialmente dentro del software Invenio (1) para bibliotecas digitales, así como dentro de INSPIRE, una de las mayores bibliotecas digitales en Física de Partículas mantenida gracias a la colaboración de grandes laboratorios y centros de investigación como son el CERN, SLAC, DESY y Fermilab. 1). http://invenio-software.org

    Лингвофилософские параметры англоязычных инноваций в техносфере

    Get PDF
    The monograph researches the aspects of the English vocabulary development processes in the sphere of new computer technologies. The primary supposition of cyber word-stock terminological nature leads into the study of both linguistic (morphological and semantic) and ontological paradigmatic parameters of innovative cyber-vocabulary of the English language.Розглянуто проблему термінологічності лінгвальних інновацій англійської мови у сфері новітніх технологій. Розглянуто онтологічні (часо-просторові) аспекти технодійсності в їх лексико-фразеологічному висвітленні, детально досліджено феномен людини, її комплексне лінквокатегоріальне позиціювання в межах ексизстенційної техносфери. Проаналізовано засади антропоцентричності технократичного буття.Рассмотрена проблема терминологичности лингвальных инноваций английского языка в сфере новейших технологий. Рассмотрены онтологические (временно-пространственные) аспекты технодействительности в их лексико-фразеологическом освещении, датально исследован феномен человека, его комплексное лингвокатегориальное позиционирование в пределах экзистенциальной техносферы. Проанализированы основы антропоцентричности технократического бытия

    Translating Harbourscapes:Site-specific Design Approaches in Contemporary European Harbour Transformation

    Get PDF

    Dwelling on ontology - semantic reasoning over topographic maps

    Get PDF
    The thesis builds upon the hypothesis that the spatial arrangement of topographic features, such as buildings, roads and other land cover parcels, indicates how land is used. The aim is to make this kind of high-level semantic information explicit within topographic data. There is an increasing need to share and use data for a wider range of purposes, and to make data more definitive, intelligent and accessible. Unfortunately, we still encounter a gap between low-level data representations and high-level concepts that typify human qualitative spatial reasoning. The thesis adopts an ontological approach to bridge this gap and to derive functional information by using standard reasoning mechanisms offered by logic-based knowledge representation formalisms. It formulates a framework for the processes involved in interpreting land use information from topographic maps. Land use is a high-level abstract concept, but it is also an observable fact intimately tied to geography. By decomposing this relationship, the thesis correlates a one-to-one mapping between high-level conceptualisations established from human knowledge and real world entities represented in the data. Based on a middle-out approach, it develops a conceptual model that incrementally links different levels of detail, and thereby derives coarser, more meaningful descriptions from more detailed ones. The thesis verifies its proposed ideas by implementing an ontology describing the land use ‘residential area’ in the ontology editor Protégé. By asserting knowledge about high-level concepts such as types of dwellings, urban blocks and residential districts as well as individuals that link directly to topographic features stored in the database, the reasoner successfully infers instances of the defined classes. Despite current technological limitations, ontologies are a promising way forward in the manner we handle and integrate geographic data, especially with respect to how humans conceptualise geographic space