8,653 research outputs found

    BlogForever D2.6: Data Extraction Methodology

    Get PDF
    This report outlines an inquiry into the area of web data extraction, conducted within the context of blog preservation. The report reviews theoretical advances and practical developments for implementing data extraction. The inquiry is extended through an experiment that demonstrates the effectiveness and feasibility of implementing some of the suggested approaches. More specifically, the report discusses an approach based on unsupervised machine learning that employs the RSS feeds and HTML representations of blogs. It outlines the possibilities of extracting semantics available in blogs and demonstrates the benefits of exploiting available standards such as microformats and microdata. The report proceeds to propose a methodology for extracting and processing blog data to further inform the design and development of the BlogForever platform

    Disentangled Ontology Embedding for Zero-Shot Learning

    Get PDF

    Can humain association norm evaluate latent semantic analysis?

    Get PDF
    This paper presents the comparison of word association norm created by a psycholinguistic experiment to association lists generated by algorithms operating on text corpora. We compare lists generated by Church and Hanks algorithm and lists generated by LSA algorithm. An argument is presented on how those automatically generated lists reflect real semantic relations

    Enhancing the ELECTRE decision support method with semantic data

    Get PDF
    Prendre una decisió quan les opcions es defineixen mitjançant un conjunt divers de criteris no és fàcil. Aqueta tesi es centra en ampliar la metodologia ELECTRE, que és el mètode del tipus "outranking" més utilitzat. En aquesta tesi ens centrem en problemes de decisió que involucren informació no numèrica, tal com els criteris semàntics multivaluats, que poden prendre com a valors els conceptes d'una ontologia de domini determinada. Primer proposo una nova manera de manipular els criteris semàntics per evitar l'agregació de les puntuacions numèriques abans del procediment de classificació. Aquest mètode, anomenat ELECTRE-SEM, segueix els mateixos principis que el clàssic ELECTRE però, en aquest cas, els índexs de concordança i discordança es defineixen en termes de la comparació per parelles de les puntuacions que indiquen l'interès de l'usuari sobre diferents conceptes de l'ontologia. En segon lloc, proposo crear un perfil d'usuari semàntic mitjançant el emmagatzemant de puntuacions de preferències a l'ontologia. Es vincula una puntuació d'interès numèrica als conceptes més específics, això permet distingir millor les preferències de l'usuari, i també s'incorpora un procediment d'agregació per inferir les preferències de l'usuari considerant les relacions taxonòmiques entre conceptes. La metodologia proposada s'ha aplicat en dos casos d’estudi: l'avaluació de plantes de generació d'energia i la recomanació d'activitats turístiques a Tarragona.Tomar una decisión cuando las opciones se definen sobre un conjunto diverso de criterios no es fácil. Esta tesis se centra en ampliar la metodología ELECTRE, que es el método del tipo "outranking" más utilizado. En esta tesis nos centramos en problemas de decisión que involucren información no numérica, tal como los criterios semánticos multi-valuados, que pueden tomar como valores los conceptos de una ontología de dominio determinada. Primero propongo una nueva forma de manejar los criterios semánticos para evitar la agregación de puntuaciones numéricas antes del procedimiento de clasificación. Este método, llamado ELECTRE-SEM, sigue los mismos principios que el clásico ELECTRE, pero en este caso los índices de concordancia y discordancia se definen en términos de la comparación por pares de unas puntuaciones que indican el interés del usuario sobre distintos conceptos de la ontología. En segundo lugar, propongo crear un perfil de usuario semántico mediante el almacenamiento de puntuaciones de preferencias en la ontología. Se asocian puntuaciones numéricas a los conceptos más específicos, lo cual permite distinguir mejor las preferencias del usuario, y se incorpora un proceso de agregación para inferir las preferencias del usuario mediante las relaciones taxonómicas entre conceptos. La metodología propuesta ha sido aplicada en dos casos de estudio: la evaluación de las plantas de generación de energía y la recomendación de actividades turísticas en Tarragona.Reach a decision when options are defined on a set of diverse criteria is not easy. This thesis is focused on improving the methodology ELECTRE, which is the most used outranking-based method. In this dissertation, we focus on decision problems involving non-numerical information, such as multi-valued semantic criteria, which may take as values the concepts of a given domain ontology. First, I propose a new way of handling semantic criteria to avoid the aggregation of the numerical scores before the ranking procedure. This method, called ELECTRE-SEM, follows the same principles than the classic ELECTRE but in this case the concordance and discordance indices are defined in terms of the pairwise comparison of the interest scores. Second, I also propose to create a semantic user profile by storing preference scores into the ontology. The numerical interest score attached to the most specific concepts permits to distinguish better the preferences of the user, improving the quality of the decision by the incorporation of an aggregation methodology to infer the user's preferences by considering taxonomic relations between concepts. The proposed methodology has been applied in two case studies: the assessment of power generation plants and the recommendation of touristic activities in Tarragona

    CHORUS Deliverable 2.2: Second report - identification of multi-disciplinary key issues for gap analysis toward EU multimedia search engines roadmap

    Get PDF
    After addressing the state-of-the-art during the first year of Chorus and establishing the existing landscape in multimedia search engines, we have identified and analyzed gaps within European research effort during our second year. In this period we focused on three directions, notably technological issues, user-centred issues and use-cases and socio- economic and legal aspects. These were assessed by two central studies: firstly, a concerted vision of functional breakdown of generic multimedia search engine, and secondly, a representative use-cases descriptions with the related discussion on requirement for technological challenges. Both studies have been carried out in cooperation and consultation with the community at large through EC concertation meetings (multimedia search engines cluster), several meetings with our Think-Tank, presentations in international conferences, and surveys addressed to EU projects coordinators as well as National initiatives coordinators. Based on the obtained feedback we identified two types of gaps, namely core technological gaps that involve research challenges, and “enablers”, which are not necessarily technical research challenges, but have impact on innovation progress. New socio-economic trends are presented as well as emerging legal challenges
    corecore