9 research outputs found

    Avaliação multilíngue e de localização de motores de busca de sites e busca por palavras-chave

    Get PDF
    Os motores de busca estão competindo para serem vistos como universais, coerentes e independentes do idioma. Em princípio, os usuários que buscam informação através da Internet devem obter informações consistentes independentemente da linguagem e das palavras que estão usando, e independentemente da língua correspondent e aos documentos pertinentes. No entanto, a linguagem deve afetar a sequência ou a ordem de classificação dos resultados obtidos. Neste projeto, várias ferramentas são construídas para avaliar palavras e demonstrações em vários idiomas. Os resultados são a valiados e comparados para possível correlação. Outra ferramenta é construída para rastrear sites de diferentes idiomas e locais, a fim de avaliar vários aspectos desses sites. Os resultados de ambos os estudos mostraram que, embora pareça que os motores de busca populares fazem progressos muito bons para a construção de motores independentes de idioma e local, no entanto, existem algumas limitações e situações em que a busca por resultados pode ser tendenciosa em direção à popularidade da linguagem e/ou localização do site.Search engines are competing to be seen as universal, consistent and language independent. In principle, users searching for information through the Internet should get consistent information regardless of the language of the words they are searching for and regardless of the language of the matching or the relevant documents. Nevertheless, the language should affect the sequence or the ranking of the retrieved results. In this project, several tools are built to evaluate words and statements in several languages. Results are evaluated and compared for possible correlation. Another tool is built to crawl websites from different languages and locations in order to measure several aspects of those websites. Results from both studies showed that while it seems that popular search engines are making very good progress toward building search engines that are language and location independent, however, there are some limitations and situations where search for results can be biased toward the popularity of the website language and/or location


    No full text
    Os motores de busca estão competindo para serem vistos como universais, coerentes e independentes do idioma. Em princípio, os usuários que buscam informação através da Internet devem obter informações consistentes independentemente da linguagem e das palavras que estão usando, e independentemente da língua correspondente aos documentos pertinentes. No entanto, a linguagem deve afetar a sequência ou a ordem de classificação dos resultados obtidos. Neste projeto, várias ferramentas são construídas para avaliar palavras e demonstrações em vários idiomas. Os resultados são avaliados e comparados para possível correlação. Outra ferramenta é construída para rastrear sites de diferentes idiomas e locais, a fim de avaliar vários aspectos desses sites. Os resultados de ambos os estudos mostraram que, embora pareça que os motores de busca populares fazem progressos muito bons para a construção de motores independentes de idioma e local, no entanto, existem algumas limitações e situações em que a busca por resultados pode ser tendenciosa em direção à popularidade da linguagem e/ou localização do site

    OLAWSDS: An Online Arabic Web Spam Detection System

    No full text
    Abstract—For marketing purposes, Some Websites designers and administrators use illegal Search Engine Optimization (SEO) techniques to optimize the ranking of their Web pages and mislead the search engines. Some Arabic Web pages use both content and link features, to increase artificially the rank of their Web pages in the Search Engine Results Pages (SERPs). This study represents an enhancement to previous work in this field. It includes the design and implementation of an online Arabic Web spam detection system, based on algorithms and mathematical foundations, which can detect the Arabic content and link web spam depending on the tree of the spam detection conditions, beside depending on the user’s feedback through a custom Web browser. The users can participate in making the decision about any Web page, through their feedbacks, so they judge if the Arabic Web pages in the browser are relevant fo

    Arabic Sentiment Polarity Identification Using a Hybrid Approach

    No full text
    Recent years witness a significant increase in research related to knowledge extraction from web social networks or media. The enormous volume of posted comments, and related media can be a rich source of information. In Middle East and the Arab world in particular, social media websites continue to be the top visited websites especially with the current social and political changes in this part of the world. Sentiment analysis and opinion mining focus on identifying and evaluating positive and negative opinions and comments. This study aims to identify the sentiment polarity for collected comments or posts from Twitter using a hybrid approach and a modest dataset of Arabic (Text and audio) comments. Two machine learning classification techniques are used to perform the required classification to identify the polarity of the collected opinions. We extended the evaluation of prediction algorithms and enhance them using Bagging and Boosting algorithms. We extracted a unified dataset of texts, audios and images and applied processing methods to extract final sentiment opinions. We noticed that some special expressions specially in recoding (such as laughing, yelling, etc. within the recording) have a negative effect on the accuracy of the automatic sentiment prediction system

    A comprehensive survey of arabic sentiment analysis

    No full text

    Additional file 4 of Mapping age- and sex-specific HIV prevalence in adults in sub-Saharan Africa, 2000–2018

    No full text
    Additional file 4: Supplemental results.1. README. 2. Prevalence range across districts. 3. Prevalence range between sexes. 4. Prevalence range between ages. 5. Age-specific district ranges