5 research outputs found

    Búsqueda de sitios web con autoridad en un tema

    Get PDF
    La búsqueda de recursos – páginas o sitios web – que son referentes (o autoridades) en un tema particular es una tarea básica que ayuda a construir o mejorar distintos servicios de información. No obstante, es posible plantear el concepto de autoridad desde un nivel de abstracción mayor teniendo en cuenta el contenido de las páginas, para evaluar desde otro punto de vista si éstas son relevantes en un tópico particular. En este trabajo se propone un método simple que utiliza las capacidades de los motores de consulta existentes a los efectos de obtener – de manera automática – listas de sitios web que son autoridades temáticas. Los resultados muestran que el método es eficiente, obteniendo una precisión entre 0.66 y 1.00 para los diferentes experimentos. Si bien aún se encuentra en una primera etapa, se propone su utilización como un filtro a incorporar a los motores de consultas, donde existan listas predefinidas de sitios a incluir o excluir de una consulta.Eje: Arquitectura, redes y sistemas operativosRed de Universidades con Carreras en Informática (RedUNCI

    Búsqueda de sitios web con autoridad en un tema

    Get PDF
    La búsqueda de recursos – páginas o sitios web – que son referentes (o autoridades) en un tema particular es una tarea básica que ayuda a construir o mejorar distintos servicios de información. No obstante, es posible plantear el concepto de autoridad desde un nivel de abstracción mayor teniendo en cuenta el contenido de las páginas, para evaluar desde otro punto de vista si éstas son relevantes en un tópico particular. En este trabajo se propone un método simple que utiliza las capacidades de los motores de consulta existentes a los efectos de obtener – de manera automática – listas de sitios web que son autoridades temáticas. Los resultados muestran que el método es eficiente, obteniendo una precisión entre 0.66 y 1.00 para los diferentes experimentos. Si bien aún se encuentra en una primera etapa, se propone su utilización como un filtro a incorporar a los motores de consultas, donde existan listas predefinidas de sitios a incluir o excluir de una consulta.Eje: Arquitectura, redes y sistemas operativosRed de Universidades con Carreras en Informática (RedUNCI

    Web Tarayıcılarında Tohum URL Seçimi ve Performans Analizi: Kapsamlı Bir İnceleme

    Get PDF
    Web, İnternet üzerinde yayınlanan çeşitli türden bilgilerin bulunduğu bir veri deposudur. Bu bilgileri üzerinde bulunduran ve birbirlerine köprülerle bağlı olan yapılara web sayfaları denir. Web tarayıcıları, web sayfaları üzerindeki köprüleri kullanarak Web’i tarayan ve sayfaları indiren programlardır. Bir arama motorunun performansı da web tarayıcısının performansına bağlıdır. Web tarayıcılarının performans metrikleri, kapsamı ve tohum URL seçim yöntemleri performansı etkileyen en önemli faktörlerdir. Bu çalışmada, genel, odaklanmış, artırılmış, gizli, mobil ve dağıtılmış olmak üzere altı kategoride sınıflandırdığımız web tarayıcılarının performansları, kapsamları ve tohum URL kullanım yöntemleri hakkında kapsamlı bir inceleme ve analiz yapılmıştır. Ayrıca her bir tarayıcının çeşitli çalışmalarda yapılmış performans ölçütleri karşılaştırılmıştır

    Web modelling for web warehouse design

    Get PDF
    Tese de doutoramento em Informática (Engenharia Informática), apresentada à Universidade de Lisboa através da Faculdade de Ciências, 2007Users require applications to help them obtaining knowledge from the web. However, the specific characteristics of web data make it difficult to create these applications. One possible solution to facilitate this task is to extract information from the web, transform and load it to a Web Warehouse, which provides uniform access methods for automatic processing of the data. Web Warehousing is conceptually similar to Data Warehousing approaches used to integrate relational information from databases. However, the structure of the web is very dynamic and cannot be controlled by the Warehouse designers. Web models frequently do not reflect the current state of the web. Thus, Web Warehouses must be redesigned at a late stage of development. These changes have high costs and may jeopardize entire projects. This thesis addresses the problem of modelling the web and its influence in the design of Web Warehouses. A model of a web portion was derived and based on it, a Web Warehouse prototype was designed. The prototype was validated in several real-usage scenarios. The obtained results show that web modelling is a fundamental step of the web data integration process.Os utilizadores da web recorrem a ferramentas que os ajudem a satisfazer as suas necessidades de informação. Contudo, as características específicas dos conteúdos provenientes da web dificultam o desenvolvimento destas aplicações. Uma aproximação possível para a resolução deste problema é a integração de dados provenientes da web num Armazém de Dados Web que, por sua vez, disponibilize métodos de acesso uniformes e facilitem o processamento automático. Um Armazém de Dados Web é conceptualmente semelhante a um Armazém de Dados de negócio. No entanto, a estrutura da informação a carregar, a web, não pode ser controlada ou facilmente modelada pelos analistas. Os modelos da web existentes não são tipicamente representativos do seu estado presente. Como consequência, os Armazéns de Dados Web sofrem frequentemente alterações profundas no seu desenho quando já se encontram numa fase avançada de desenvolvimento. Estas mudanças têm custos elevados e podem pôr em causa a viabilidade de todo um projecto. Esta tese estuda o problema da modelação da web e a sua influência no desenho de Armazéns de Dados Web. Para este efeito, foi extraído um modelo de uma porção da web, e com base nele, desenhado um protótipo de um Armazém de Dados Web. Este protótipo foi validado através da sua utilização em vários contextos distintos. Os resultados obtidos mostram que a modelação da web deve ser considerada no processo de integração de dados da web.Fundação para Computação Científica Nacional (FCCN); LaSIGE-Laboratório de Sistemas Informáticos de Grande Escala; Fundação para a Ciência e Tecnologia (FCT), (SFRH/BD/11062/2002
    corecore