162 research outputs found

    Wikipedia vandalism detection: combining natural language, metadata, and reputation features

    Get PDF
    Wikipedia is an online encyclopedia which anyone can edit. While most edits are constructive, about 7% are acts of vandalism. Such behavior is characterized by modifications made in bad faith; introducing spam and other inappropriate content. In this work, we present the results of an effort to integrate three of the leading approaches to Wikipedia vandalism detection: a spatio-temporal analysis of metadata (STiki), a reputation-based system (WikiTrust), and natural language processing features. The performance of the resulting joint system improves the state-of-the-art from all previous methods and establishes a new baseline for Wikipedia vandalism detection. We examine in detail the contribution of the three approaches, both for the task of discovering fresh vandalism, and for the task of locating vandalism in the complete set of Wikipedia revisions.The authors from Universitat Politècnica de València thank also the MICINN research project TEXT-ENTERPRISE 2.0 TIN2009-13391-C04-03 (Plan I+D+i). UPenn contributions were supported in part by ONR MURI N00014-07-1-0907. This research was partially supported by award 1R01GM089820-01A1 from the National Institute Of General Medical Sciences, and by ISSDM, a UCSC-LANL educational collaboration.Adler, BT.; Alfaro, LD.; Mola Velasco, SM.; Rosso, P.; West, AG. (2011). Wikipedia vandalism detection: combining natural language, metadata, and reputation features. En Computational Linguistics and Intelligent Text Processing. Springer Verlag (Germany). 6609:277-288. https://doi.org/10.1007/978-3-642-19437-5_23S2772886609Wikimedia Foundation: Wikipedia (2010) [Online; accessed December 29, 2010]Wikimedia Foundation: Wikistats (2010) [Online; accessed December 29, 2010]Potthast, M.: Crowdsourcing a Wikipedia Vandalism Corpus. In: Proc. of the 33rd Intl. ACM SIGIR Conf. (SIGIR 2010). ACM Press, New York (July 2010)Gralla, P.: U.S. senator: It’s time to ban Wikipedia in schools, libraries, http://blogs.computerworld.com/4598/u_s_senator_its_time_to_ban_wikipedia_in_schools_libraries [Online; accessed November 15, 2010]Olanoff, L.: School officials unite in banning Wikipedia. Seattle Times (November 2007)Mola-Velasco, S.M.: Wikipedia Vandalism Detection Through Machine Learning: Feature Review and New Proposals. In: Braschler, M., Harman, D. (eds.) Notebook Papers of CLEF 2010 LABs and Workshops, Padua, Italy, September 22-23 (2010)Adler, B., de Alfaro, L., Pye, I.: Detecting Wikipedia Vandalism using WikiTrust. In: Braschler, M., Harman, D. (eds.) Notebook Papers of CLEF 2010 LABs and Workshops, Padua, Italy, September 22-23 (2010)West, A.G., Kannan, S., Lee, I.: Detecting Wikipedia Vandalism via Spatio-Temporal Analysis of Revision Metadata. In: EUROSEC 2010: Proceedings of the Third European Workshop on System Security, pp. 22–28 (2010)West, A.G.: STiki: A Vandalism Detection Tool for Wikipedia (2010), http://en.wikipedia.org/wiki/Wikipedia:STikiWikipedia: User: AntiVandalBot – Wikipedia, http://en.wikipedia.org/wiki/User:AntiVandalBot (2010) [Online; accessed November 2, 2010]Wikipedia: User:MartinBot – Wikipedia (2010), http://en.wikipedia.org/wiki/User:MartinBot [Online; accessed November 2, 2010]Wikipedia: User:ClueBot – Wikipedia (2010), http://en.wikipedia.org/wiki/User:ClueBot [Online; accessed November 2, 2010]Carter, J.: ClueBot and Vandalism on Wikipedia (2008), http://www.acm.uiuc.edu/~carter11/ClueBot.pdf [Online; accessed November 2, 2010]Rodríguez Posada, E.J.: AVBOT: detección y corrección de vandalismos en Wikipedia. NovATIca (203), 51–53 (2010)Potthast, M., Stein, B., Gerling, R.: Automatic Vandalism Detection in Wikipedia. In: Macdonald, C., Ounis, I., Plachouras, V., Ruthven, I., White, R.W. (eds.) ECIR 2008. LNCS, vol. 4956, pp. 663–668. Springer, Heidelberg (2008)Smets, K., Goethals, B., Verdonk, B.: Automatic Vandalism Detection in Wikipedia: Towards a Machine Learning Approach. In: WikiAI 2008: Proceedings of the Workshop on Wikipedia and Artificial Intelligence: An Evolving Synergy, pp. 43–48. AAAI Press, Menlo Park (2008)Druck, G., Miklau, G., McCallum, A.: Learning to Predict the Quality of Contributions to Wikipedia. In: WikiAI 2008: Proceedings of the Workshop on Wikipedia and Artificial Intelligence: An Evolving Synergy, pp. 7–12. AAAI Press, Menlo Park (2008)Itakura, K.Y., Clarke, C.L.: Using Dynamic Markov Compression to Detect Vandalism in the Wikipedia. In: SIGIR 2009: Proc. of the 32nd Intl. ACM Conference on Research and Development in Information Retrieval, pp. 822–823 (2009)Chin, S.C., Street, W.N., Srinivasan, P., Eichmann, D.: Detecting Wikipedia Vandalism with Active Learning and Statistical Language Models. In: WICOW 2010: Proc. of the 4th Workshop on Information Credibility on the Web (April 2010)Zeng, H., Alhoussaini, M., Ding, L., Fikes, R., McGuinness, D.: Computing Trust from Revision History. In: Intl. Conf. on Privacy, Security and Trust (2006)McGuinness, D., Zeng, H., da Silva, P., Ding, L., Narayanan, D., Bhaowal, M.: Investigation into Trust for Collaborative Information Repositories: A Wikipedia Case Study. In: Proc. of the Workshop on Models of Trust for the Web (2006)Adler, B., de Alfaro, L.: A Content-Driven Reputation System for the Wikipedia. In: WWW 2007: Proceedings of the 16th International World Wide Web Conference. ACM Press, New York (2007)Belani, A.: Vandalism Detection in Wikipedia: a Bag-of-Words Classifier Approach. Computing Research Repository (CoRR) abs/1001.0700 (2010)Potthast, M., Stein, B., Holfeld, T.: Overview of the 1st International Competition on Wikipedia Vandalism Detection. In: Braschler, M., Harman, D. (eds.) Notebook Papers of CLEF 2010 LABs and Workshops, Padua, Italy, September 22-23 (2010)Hall, M., Frank, E., Holmes, G., Pfahringer, B., Reutemann, P., Witten, I.: The WEKA Data Mining Software: An Update. SIGKDD Explorations 11(1) (2009)Breiman, L.: Random Forests. Machine Learning 45(1), 5–32 (2001)Davis, J., Goadrich, M.: The relationship between Precision-Recall and ROC curves. In: ICML 2006: Proc. of the 23rd Intl. Conf. on Machine Learning (2006

    Análise do movimento do herbicida tebutiuron, por simulação, na cultura da cana-de-açúcar em área de recarga do aquífero Botucatu, Ribeirão Preto/SP.

    Get PDF
    Com o objetivo de conhecer o comportamento do herbicida Tebutiuron, em área de agricultura intensiva de cana-de-açúcar, localizada na região de Ribeirão Preto, SP, utilizou-se o simulador CMLS-94 - "Chemical Movement in Layered Soils" (Nofziger & Hornsby, 1994). O cenário das simulações foi baseado na data de plantio de cana, 20 de setembro, com aplicação inicial do produto um mês após o plantio, na dose de 1,1 Kg/ha, para um período de simulação de quatro anos. Os resultados mostraram que o Tebutiuron, simulado em solos LR, Transição LR para LE, LE e AQ chega a atingir 30 metros de profundidade no solo AQ, fornecendo indícios de contaminação do lençol freático

    Inferências e estimativas de incertezas utilizando técnicas de krigeagem não linear.

    Get PDF
    Propriedades ambientais são dados importantes para modelagens desenvolvidas em ambiente de Sistemas de Informação Geográfica. As técnicas geoestatísticas de inferência, conhecidas por krigeagem, consideram os atributos ambientais como variáveis aleatórias o que possibilita a modelagem das incertezas associadas as inferências. Neste contexto, o presente trabalho explora o uso da técnica de krigeagem não linear, a krigeagem por indicação, para inferências a partir de amostras observadas pontualmente. O trabalho apresenta, também, alternativas de cálculos de incertezas para propriedades ambientais de natureza numérica e temática. Por fim, o trabalho mostra e analisa os resultados da aplicação da krigeagem por indicação sobre amostras de textura de solo

    Integração de geoestatística e sistemas de informação geográfica: uma necessidade.

    Get PDF
    Este trabalho tem como objetivo enfatizar a importância da integração Geoestatística e Sistemas de Informação Geográfica (SIG). A plataforma de integração é o Sistema de Processamento de Informações Georreferenciadas (SPRING), de propriedade do Instituto Nacional de Pesquisas Espaciais, desenvolvido na Divisão de Processamento de Imagens (DPI). A base conceitual deste trabalho esta fundamentada em técnicas geoestatísticas, as quais são derivadas da Teoria das Variáveis Regionalizadas e formalizadas por Matheron (1971). Um exemplo é apresentado. Através de procedimentos geoestatísticos uma análise espacial do teor de argila é realizada, nos solos da Fazenda Canchim em São Carlos - SP, e os resultados são apresentados e discutidos

    As relações de trabalho dos fisioterapeutas na cidade de Salvador, Bahia

    Get PDF
    As transformações socioeconômicas decorrentes da reorganização do sistema vigente e da conformação do Estado neoliberal têm conduzido à precarização do mundo do trabalho. O processo de reestruturação produtiva, oriundo do setor industrial, tem acarretado um forte impacto no campo da saúde e, consequentemente, na fisioterapia. Este artigo analisa as relações de trabalho dos fisioterapeutas que atuam em clínicas particulares na cidade de Salvador, correlacionando-as com o processo de reestruturação do mundo do trabalho. Trata-se de um estudo exploratório, de natureza qualitativa, com base no referencial teórico da sociologia do trabalho. Foram realizadas entrevistas semiestruturadas com oito fisioterapeutas. A abordagem utilizada foi a análise de conteúdo por categorias temáticas, previamente identificadas pelos autores, a saber: centralidade do trabalho, conjuntura socioeconômica, precarização do trabalho, formação acadêmica e organização sindical. A análise compreensiva revelou a centralidade que o trabalho ocupa na vida dos fisioterapeutas. Na análise da conjuntura socioeconômica, foram identificados os processos que influenciam a atuação profissional e como eles moldam o perfil do trabalhador. Quanto à precarização do trabalho, foram caracterizados os vínculos empregatícios, as condições de trabalho, a estabilidade e a remuneração. A formação acadêmica foi vinculada à reprodução da lógica do capital, acompanhada pela expansão, sem planejamento e regulação, do Ensino Superior privado. Já a organização sindical mostrou-se distante do fisioterapeuta. A análise das correlações entre forças socioeconômicas que influenciam a prática profissional indicou que as relações de trabalho dos fisioterapeutas entrevistados mostraram-se precárias e instáveis

    Institutionalisation of Social Movements: Co-option And Democratic Policy-making

    Get PDF
    Over the past 30 years, urban policy in Brazil has undergone a major transformation, both in terms of regulatory frameworks and the involvement of citizens in the process of policy-making. As an intense process of institutional innovation and mobilisation for decent publicservices took place, academics started to consider the impact of institutionalisation on the autonomy of social movements. Using empirical evidence from a city in the northeast of Brazil, this article addresses the wider literature on citizen participation and social movements to examine specifically the problem with co-optation. I examine the risks linked to co-optation, risks that can undermine the credibility of social movements as agents of change, and explore the tensions that go beyond the ‘co-optation versus autonomy’ divide, an issue frequently found in the practices of social movements, in their dealings with those in power. In particular, this article explores the learning processes and contentious relationships between mainly institutionally oriented urban movements and local government. This study found that the learning of deliberative skills not only led to changes in the objectives and repertoires of housing movements, but also to the inclusion of new components in their objectives that provide room for creative agency and which, in some cases, might allow them to maintain their autonomy from the state
    corecore