7,340 research outputs found

    Metric for seleting the number of topics in the LDA Model

    Get PDF
    The latest technological trends are driving a vast and growing amount of textual data. Topic modeling is a useful tool for extracting information from large corpora of text. A topic template is based on a corpus of documents, discovers the topics that permeate the corpus and assigns documents to those topics. The Latent Dirichlet Allocation (LDA) model is the main, or most popular, of the probabilistic topic models. The LDA model is conditioned by three parameters: two Dirichlet hyperparameters (α and β ) and the number of topics (K). Determining the parameter K is extremely important and not extensively explored in the literature, mainly due to the intensive computation and long processing time. Most topic modeling methods implicitly assume that the number of topics is known in advance, thus considering it demands an exogenous parameter. That is annoying, leaving the technique prone to subjectivities. The quality of insights offered by LDA is quite sensitive to the value of the parameter K, and perhaps an excess of subjectivity in its choice might influence the confidence managers put on the techniques results, thus undermining its usage by firms. This dissertation’s main objective is to develop a metric to identify the ideal value for the parameter K of the LDA model that allows an adequate representation of the corpus and within a tolerable elapsed time of the process. We apply the proposed metric alongside existing metrics to two datasets. Experiments show that the proposed method selects a number of topics similar to that of other metrics, but with better performance in terms of processing time. Although each metric has its own method for determining the number of topics, some results are similar for the same database, as evidenced in the study. Our metric is superior when considering the processing time. Experiments show this method is effective.As tendências tecnológicas mais recentes impulsionam uma vasta e crescente quantidade de dados textuais. Modelagem de tópicos é uma ferramenta útil para extrair informações relevantes de grandes corpora de texto. Um modelo de tópico é baseado em um corpus de documentos, descobre os tópicos que permeiam o corpus e atribui documentos a esses tópicos. O modelo de Alocação de Dirichlet Latente (LDA) é o principal, ou mais popular, dos modelos de tópicos probabilísticos. O modelo LDA é condicionado por três parâmetros: os hiperparâmetros de Dirichlet (α and β ) e o número de tópicos (K). A determinação do parâmetro K é extremamente importante e pouco explorada na literatura, principalmente devido à computação intensiva e ao longo tempo de processamento. A maioria dos métodos de modelagem de tópicos assume implicitamente que o número de tópicos é conhecido com antecedência, portanto, considerando que exige um parâmetro exógeno. Isso é um tanto complicado para o pesquisador pois acaba acrescentando à técnica uma subjetividade. A qualidade dos insights oferecidos pelo LDA é bastante sensível ao valor do parâmetro K, e pode-se argumentar que um excesso de subjetividade em sua escolha possa influenciar a confiança que os gerentes depositam nos resultados da técnica, prejudicando assim seu uso pelas empresas. O principal objetivo desta dissertação é desenvolver uma métrica para identificar o valor ideal para o parâmetro K do modelo LDA que permita uma representação adequada do corpus e dentro de um tempo de processamento tolerável. Embora cada métrica possua método próprio para determinação do número de tópicos, alguns resultados são semelhantes para a mesma base de dados, conforme evidenciado no estudo. Nossa métrica é superior ao considerar o tempo de processamento. Experimentos mostram que esse método é eficaz

    Estudo da Demanda de Mercado em Sites de Anúncios de Emprego e Estágio para as Áreas de Engenharia de Produção

    Get PDF
    Finalidade: Este artigo tem por finalidade pesquisar as áreas e subáreas de Engenharia de Produção, definidas pela ABEPRO, mais requisitadas nos anúncios de sites de emprego e estágio de engenheiro de produção.   Método: Os dados foram coletados em sites de anúncios de estágio e emprego em engenharia de produção utilizando amostragem aleatória simples para definir o tamanho da amostra. Os dados foram analisados através de gráficos e tabelas. Os anúncios foram escolhidos em três sites seguindo os critérios de número de acesso e gratuidade, levando em consideração as características necessárias para atuar como engenheiro de produção no mercado de trabalho, segundo as áreas da ABEPRO.   Implicação: Serão analisados nas descrições dos anúncios as habilidades mais requisitadas, que são necessárias para a atuação de un engenheiro de produção.   Resultado: Através de uma amostragem de anúncios de estágio e emprego, de três dos principais sites especializados, os resultados apontam para as áreas tradicionais da Engenharia de Produção e destaca as habilidades no campo das ciências sociais na atuação do profissional

    How will global agriculture and food security respond to future socioeconomic shocks?

    Get PDF
    The present work uses a static partial equilibrium model for global agriculture that incorporates into the analysis the effects of economic responses to scarcity affecting regional and global agricultural production and land use

    Considerações acerca da leitura em livros didáticos de química: uma análise a partir de textos complementares

    Get PDF
    AbstractTe use of different textual genres has been seen as fundamental in the formation of flexible readers. In this sense, textbooks with a didactic character have an important role once that it is allowed introducing other textual genres as complementary texts. In Brazil, they are called “complementary texts” as those whose format is different from that of the original text (with different type and size of fonts, written in boxes, or sections enhanced). Te present work investigates some aspects presented by texts of this type in chemistry textbooks, such as its number, sources and activities proposed. Te number of texts is a positive aspect in most of the textbooks. However, a wider range of textual genres and of texts sources, as well as reading strategies that take into account interactive and socio-cognitive role of reading, would be important to increase the quality of pedagogical actions taken from these texts.ResumenEl uso de diferentes géneros de textos es visto como fundamental para la formación de lectores versátiles. En este sentido, los libros de texto didácticos juegan un papel importante por su inserción como textos complementarios. En Brasil se llaman “textos complementarios” aquellos que tienen un formato diferente al texto original (un diferente tipo y tamaño de letra, escritos en cuadros de texto o secciones destacadas). Esta investigación estudió algunos aspectos de estos textos en libros didácticos de química, tales como su cantidad, fuentes citadas y actividades propuestas. El número de textos es un aspecto positivo en la mayor parte de las obras. No obstante, para enriquecer las propuestas pedagógicas del uso de estos textos, se requiere que consideren más diversidad de géneros y fuentes de información, así como estrategias de lectura que consideren el papel interactivo y socio-cognitivo de la lectura

    High occurrence of giardiasis in children living on a 'landless farm workers' settlement in Araras, São Paulo, Brazil

    Get PDF
    Enteric parasitosis remains an important public health problem in many areas around the world including in Brazil, and it is frequently associated with poverty and lack of sanitation facilities. Research carried out over the course of a year revealed that 96.6% (28/29) of children randomly selected from a 'landless farm workers' settlement in Araras, São Paulo, aged 4 - 15 years, presented Giardia intestinalis cysts. After referral to the neighborhood Health Office, all the children received tinidazole, given as a single dose of 50 mg/kg and 12 months later, new fecal samples were collected and analyzed. Despite the low adherence to the study, a high percentage (64.3% - 9/14) of the children remained positive for the parasite. This study showed a high positivity of giardiasis in child residents of the settlement, even after treatment; adults were not sensitized to the study and did not collected and/or deliver children fecal samples. The precarious living conditions are consistent with a high susceptibility to parasitic diseases, suggesting that the treatment of the infected individuals without identifying and eradicating the means of contamination is simply a palliative measure.Enteroparasitoses continuam a ser um importante problema de saúde pública em muitas áreas ao redor do mundo, bem como no Brasil, e está frequentemente associada com a pobreza e à falta de saneamento básico. Pesquisa realizada em um ano revelou que 96,6% (28/29) das crianças com idades entre quatro e 15 anos, recrutadas aleatoriamente no Assentamento Sem Terra em Araras, São Paulo, apresentaram cistos de Giardia intestinalis. Após o encaminhamento ao Posto de Saúde do bairro, todos receberam tinidazol, dose única de 50 mg/kg. Após 12 meses, novas amostras de fezes foram coletadas e analisadas. Apesar da baixa adesão ao estudo, um percentual elevado (64,3% - 9/14) de crianças permaneceu positivo para o protozoário. Este estudo mostrou alta positividade de giardíase nas crianças moradoras do assentamento, mesmo após o tratamento; indivíduos adultos não se mostraram sensibilizados com o estudo e não coletaram e/ou entregaram amostras fecais dos filhos; e o tratamento dos indivíduos infectados, sem identificação e erradicação das formas de contaminação, só funciona como medida paliativa

    Educar pela pesquisa: ensaio sobre a articulação das atividades práticas desenvolvidas no laboratório de ciências

    Get PDF
    This production presents a brief account of the experience of using research skills and the importance of scientific practices in the context of the pedagogical and learning activities used at the Josefa Alves Bezerra EEMTI, and in particular the activities adopted in the Science Educational Laboratory. To construct the report, academic research tools appropriate to the objectives of the work were used. The aim is to study how teaching through research is reflected in the educational practice of EEMTI Josefa Alves Bezerra. The study was constructed by investigating the state of the art in pedagogical practice, seeking to reflect on its importance as a learning method. To present the results, qualitative research was used to investigate the quality of the results observed and the construction of the students' scientific trajectory in the productions developed at the school and presented at scientific events. Based on the findings, it is possible to reflect on the need to strengthen research practices with financial and personnel support, produce scientific knowledge to debate teaching and learning, strengthen practice and technological knowledge, as well as recognizing the skills and competences already developed and which justify the presence of scientific research in the school life of the institution.A produção apresenta um breve ensaio da experiência da utilização das habilidades de pesquisa e a importância das práticas científicas no contexto das atividades pedagógicas e de aprendizagens utilizadas na EEMTI Josefa Alves Bezerra e em especial nas atividades adotadas no Laboratório educacional de ciências. Para a construção do relato, foram utilizadas as ferramentas de pesquisa acadêmica adequadas aos objetivos do trabalho. O objetivo é estudar como o ensino pela pesquisa se reflete na prática educativa da EEMTI Josefa Alves Bezerra. O estudo se construiu por meio de uma investigação do estado da arte sobre a prática pedagógica buscando refletir acerca da sua importância como método de aprendizagem. Para a apresentação dos resultados, utilizou-se da pesquisa qualitativa por meio da investigação da qualidade dos resultados observados e da construção da trajetória cientifica dos alunos nas produções desenvolvidas na escola e apresentadas nos eventos científicos. A partir das constatações é possível refletir sobre as necessidades de fortalecimento das práticas investigativas com apoio financeiro e de pessoal, produzir conhecimento científico para debater o ensino-aprendizagem, fortalecer a prática e o conhecimento tecnológico, além de reconhecer habilidades e competências já desenvolvidas e que justificam a presença da pesquisa cientifica na vida escolar da instituição

    “South-to-South” Dialogues: Comparative Literature as a Decolonizing Power

    Get PDF
    The article proposes that south-to-south dialogues could act as deconstructive acts that undermine the centrality power disposed on post-colonial relations Discussing the implications of decolonial theories to the understanding and the articulation of these deconstructions the article investigates both the notion of invention of the other and of the same as proposed by Jacques Derrida Basing the analyses of the colonial structure in the invention of the truth through language the article proposes the reading of other inventions other rationalities and other relations through an approximate analysis of Barren lives Vidas Secas by the Brazilian writer Graciliano Ramos and Sleepwalking land Terra Son mbula by Mozambican literate Mia Couto In both books what interest us is the invention of the hinterland sert o and savana and how they portrait identities that relate to otherness configuring a south-to-south decolonial dialogu
    corecore