Web Scraping de los Perfiles y Publicaciones de una Afiliación en Google Scholar utilizando Aplicaciones Web e implementando un Algoritmo en R

Murillo, Danny; Saavedra, Dalys

oai:revistas.utp.ac.pa:article/1465

Web Scraping de los Perfiles y Publicaciones de una Afiliación en Google Scholar utilizando Aplicaciones Web e implementando un Algoritmo en R

Authors: Danny Murillo
Dalys Saavedra
Publication date: 25 July 2017
Publisher: 'Universidad Tecnologica de Panama'

Abstract

El objetivo de este artículo es hacer uso de la técnica Web Scraping para extraer datos de Google Scholar a través de diferentes métodos. El Web Scraping es una forma de minería de datos no estructurada, que permite extraer información de páginas web, escanear su código HTML y generar patrones de extracción de datos. El artículo muestra las pruebas realizadas de estos métodos para medir la velocidad de extracción de los datos y buscar la mejor forma de extraer los datos de GS de forma estructurada. El artículo también muestra el análisis y desarrollo de un algoritmo en el lenguaje R, para comparar la velocidad de extracción de los datos y la eficiencia en el formato de salida de los datos

Similar works

Full text

Open in the Core reader

Download PDF

Portal de Revistas Académicas UTP (Universidad Tecnológica de Panamá)

oai:revistas.utp.ac.pa:article...

Last time updated on 30/10/2019

This paper was published in Portal de Revistas Académicas UTP (Universidad Tecnológica de Panamá).

Having an issue?

Is data on this page outdated, violates copyrights or anything else? Report the problem now and we will take corresponding actions after reviewing your request.