    Measuring the Importance of User-Generated Content to Search Engines

    Search engines are some of the most popular and profitable intelligent technologies in existence. Recent research, however, has suggested that search engines may be surprisingly dependent on user-created content like Wikipedia articles to address user information needs. In this paper, we perform a rigorous audit of the extent to which Google leverages Wikipedia and other user-generated content to respond to queries. Analyzing results for six types of important queries (e.g. most popular, trending, expensive advertising), we observe that Wikipedia appears in over 80% of results pages for some query types and is by far the most prevalent individual content source across all query types. More generally, our results provide empirical information to inform a nascent but rapidly-growing debate surrounding a highly-consequential question: Do users provide enough value to intelligent technologies that they should receive more of the economic benefits from intelligent technologies?Comment: This version includes a bibliography entry that was missing from the first version of the text due to a processing error. This is a preprint of a paper accepted at ICWSM 2019. Please cite that version instea

    The Influence of Multilingualism and Mutual Intelligibility on Wikipedia Reading Behaviour: A Research Proposal

    Given the important role of Wikipedia in our everyday lives, a better understanding of how language skills affect Wikipedia usage is needed. If content is not available in a reader’s native language or a language that she can readily understand, access barriers and knowledge gaps are created, threatening Wikimedia’s goal to create knowledge equity among all its projects and their consumers. This article argues for research on the effects of multilingualism and mutual intelligibility on Wikipedia reading behaviour, focusing on the Nordic countries, Denmark, Norway, and Sweden. Initial exploratory analysis shows that while residents of these countries use the native language editions quite frequently, they rely strongly on English Wikipedia, too. Research questions and methods for future work in this area are presented

    Scaling up search engine audits: Practical insights for algorithm auditing

    Algorithm audits have increased in recent years due to a growing need to independently assess the performance of automatically curated services that process, filter and rank the large and dynamic amount of information available on the Internet. Among several methodologies to perform such audits, virtual agents stand out because they offer the ability to perform systematic experiments, simulating human behaviour without the associated costs of recruiting participants. Motivated by the importance of research transparency and replicability of results, this article focuses on the challenges of such an approach. It provides methodological details, recommendations, lessons learned and limitations based on our experience of setting up experiments for eight search engines (including main, news, image and video sections) with hundreds of virtual agents placed in different regions. We demonstrate the successful performance of our research infrastructure across multiple data collections, with diverse experimental designs, and point to different changes and strategies that improve the quality of the method. We conclude that virtual agents are a promising venue for monitoring the performance of algorithms across long periods of time, and we hope that this article can serve as a basis for further research in this area

    Search engine optimization: συγκριτική μελέτη για την κατάταξη των online φαρμακείων στα οργανικά αποτελέσματα των μηχανών αναζήτησης

    Διπλωματική εργασία--Πανεπιστήμιο Μακεδονίας, Θεσσαλονίκη, 2019.Η αγορά των ηλεκτρονικών φαρμακείων παρουσιάζει αλματώδη ανάπτυξη τα τελευταία χρόνια παγκοσμίως αλλά και ειδικότερα στην Ελλάδα. Η υψηλή κατάταξη των ιστοσελίδων και των ηλεκτρονικών καταστημάτων στα αποτελέσματα των μηχανών αναζήτησης, ειδικά σε μια τόσο ανταγωνιστική κατηγορία, κρίνεται απαραίτητη. Όσο υψηλότερες θέσεις καταλαμβάνει το ηλεκτρονικό κατάστημα, τόσο μεγαλύτερη επισκεψιμότητα αποκτά. Αυτό έχει ως αποτέλεσμα την ενδυνάμωση του εμπορικού της σήματος (brand name) καθώς επίσης και την αύξηση των πωλήσεων του. Η υψηλή κατάταξη των ιστοσελίδων επιτυγχάνεται με την διαδικασία της βελτιστοποίησης τους στις μηχανές αναζήτησης ,όχι για τις πληρωμένες διαφημίσεις, αλλά για τα οργανικά αποτελέσματα. Στη συγκεκριμένη διπλωματική εργασία, πραγματοποιήθηκε βιβλιογραφική διερεύνηση για την επιλογή των πιο σημαντικών κριτηρίων – παραγόντων και αναλύθηκε το κάθε ένα ξεχωριστά. Σκοπός της παρούσας μελέτης είναι η διερεύνηση του βαθμού που έχουν συμμορφωθεί τα ηλεκτρονικά φαρμακεία με τους κανόνες βελτιστοποίησης και τις επιπτώσεις που παρατηρούνται στις κατατάξεις στα αποτελέσματα των μηχανών αναζήτησης. Για αυτό τον σκοπό επιλέχθηκαν 11 online φαρμακεία – ηλεκτρονικά καταστήματα και χρησιμοποιήθηκαν 23 κριτήρια- παράγοντες. Τα κριτήρια χωρίζονται σε 5 ομάδες ( HTML, Content, Links, Architecture, Trust). Οι ιστότοποι βαθμολογήθηκαν, αρχικά, ανά κατηγορία για κάθε ένα από τα κριτήρια από το 1 έως το 5 σύμφωνα την κλίμακα Likert, για το επίπεδο συμφωνίας τους με όσα ορίζουν τα κριτήρια. Έπειτα, αθροίστηκαν όλες οι επιμέρους βαθμολογίες και παρατέθηκαν σε έναν ενιαίο πίνακα σε φθίνουσα σειρά. Ακόμα, αναζητήθηκε σε συγκεκριμένες λέξεις-φράσεις η κατάταξη των συγκεκριμένων online φαρμακείων στην μηχανή αναζήτησης της Google και καταγράφηκαν τα αποτελέσματα. Τέλος, πραγματοποιήθηκε σύγκριση των αποτελεσμάτων. Μετά την ανάλυση των δεδομένων προέκυψε το συμπέρασμα πως οι εταιρείες που έλαβαν συνολικά την υψηλότερη βαθμολογία, σύμφωνα με την έρευνα, κατατάσσονται και στην πρώτη σελίδα αποτελεσμάτων της μηχανής αναζήτησης της Google