1 research outputs found

    Repurposing Social Tagging Data for Extraction of Domain-level Concepts

    No full text
    The World Wide Web, the world驴s largest resource for information, has evolved from organizing information using controlled, top-down taxonomies to a bottom up approach that emphasizes assigning meaning to data via mechanisms such as the Social Web (Web 2.0). Tagging adds meta-data, (weak semantics) to the content available on the web. This research investigates the potential for repurposing this layer of meta-data. We propose a multi-phase approach that exploits user-defined tags to identify and extract domain-level concepts. We operationalize this approach and assess its feasibility by application to a publicly available tag repository. The paper describes insights gained from implementing and applying the heuristics contained in the approach, as well as challenges and implications of repurposing tags for extraction of domain-level concepts.La World Wide Web, el recurso m谩s grande del mundo de la informaci贸n, ha pasado de taxonom铆as controladas de arriba abajo a un enfoque de abajo arriba que hace hincapi茅 en la asignaci贸n de significado a los datos a trav茅s de mecanismos tales como la web social (web 2.0). El etiquetado a帽ade meta-datos (sem谩ntica d茅bil) a los contenidos disponibles en la web. Esta investigaci贸n estudia las posibilidades de reutilizaci贸n de esta capa de meta-datos. Nosotros proponemos un enfoque de m煤ltiples fases que explota las etiquetas definidas por el usuario para identificar y extraer los conceptos de nivel de dominio. Ponemos en pr谩ctica este enfoque y evaluamos su viabilidad mediante la aplicaci贸n a un repositorio de etiquetas a disposici贸n del p煤blico. El documento describe los conocimientos adquiridos a partir de la implementaci贸n y aplicaci贸n de la heur铆stica que figura en el enfoque, as铆 como los retos y las implicaciones de reutilizaci贸n de etiquetas para la extracci贸n de los conceptos de nivel de dominio.La World Wide Web, el recurs m茅s gran del m贸n de la informaci贸, ha passat de taxonomies controlades de dalt a baix a un enfocament de baix a dalt que posa 猫mfasi en l'assignaci贸 de significat a les dades a trav茅s de mecanismes tals com la web social (web 2.0). L'etiquetatge afegeix metadades (sem脿ntica d猫bil) als continguts disponibles a la web. Aquesta investigaci贸 estudia les possibilitats de reutilitzaci贸 d'aquesta capa de metadades. Nosaltres proposem un enfocament de m煤ltiples fases que explota les etiquetes definides per l'usuari per identificar i extreure els conceptes de nivell de domini. Posem en pr脿ctica aquest enfocament i avaluem la seva viabilitat mitjan莽ant l'aplicaci贸 a un repositori d'etiquetes a disposici贸 del p煤blic. El document descriu els coneixements adquirits a partir de la implementaci贸 i aplicaci贸 de l'heur铆stica que consta a l'enfocament, aix铆 com els reptes i implicacions de reutilitzaci贸 d'etiquetes per l'extracci贸 dels conceptes de nivell de domini
    corecore