10 research outputs found

    Estimativa de demanda potencial de matrículas em ensino superior usando dados públicos e múltiplos modelos de regressão

    Get PDF
    Este artigo apresenta uma proposta de aplicação de múltiplos modelos de regressão (ensembles) para prever a demanda potencial por vagas de ensino superior no ensino público brasileiro. Foram utilizadas variáveis socioeconômicas e educacionais disponibilizadas por MEC, INEP e IBGE para construir modelos de regressão que prevêem a quantidade atual de alunos matriculados em cada município brasileiro. Em seguida, pode-se comparar a quantidade de alunos prevista pelos modelos com a quantidade real; a diferença entre esses valores é interpretada como indicador da demanda potencial de cada município. Este trabalho em andamento (i) reforça as possibilidades de exploração de grandes volumes de dados públicos por modelos de aprendizado de máquina que geram indicadores que ajudam a aprimorar procedimentos e processos de gestão pública no Brasil, além de (ii) chamar a atenção para o fato de que métodos de aprendizado por ensembles são úteis também em tarefas de regressão, embora a literatura seja fortemente enviesada para tarefas de classificação, e (iii) ressaltar a utilidade de modelos de regressão para aplicações em que se está interessado na informação contida no erro da predição, e não somente na predição em si

    Clinical and Laboratorial Features That May Differentiate 46,XY DSD due to Partial Androgen Insensitivity and 5α-Reductase Type 2 Deficiency

    Get PDF
    The aim of this study was to search for clinical and laboratorial data in 46,XY patients with ambiguous genitalia (AG) and normal testosterone (T) synthesis that could help to distinguish partial androgen insensitivity syndrome (PAIS) from 5α-reductase type 2 deficiency (5α-RD2) and from cases without molecular defects in the AR and SRD5A2 genes. Fifty-eight patients (51 families) were included. Age at first evaluation, weight and height at birth, consanguinity, familial recurrence, severity of AG, penile length, LH, FSH, T, dihydrotestosterone (DHT), Δ4-androstenedione (Δ4), and T/DHT and T/Δ4 ratios were evaluated. The AR and SRD5A2 genes were sequenced in all cases. There were 9 cases (7 families) of 5α-RD2, 10 cases (5 families) of PAIS, and 39 patients had normal molecular analysis of SRD5A2 and AR genes. Age at first evaluation, birth weight and height, and T/DHT ratio were lower in the undetermined group, while penile length was higher in this group. Consanguinity was more frequent and severity of AG was higher in 5α-RD2 patients. Familial recurrence was more frequent in PAIS patients. Birth weight and height, consanguinity, familial recurrence, severity of AG, penile length, and T/DHT ratio may help the investigation of 46,XY patients with AG and normal T synthesis

    Traumatismo Renal: Análise Retrospetiva de 5 Anos de um Centro de Trauma de Nível 1

    Get PDF
    Introduction: Renal trauma accounts for about 1% to 5% of all trauma patients, the majority of which are due to blunt trauma. Based on the American Association for the Surgery of Trauma (AAST) classification we can classify renal trauma into five grades of injury, which can help choosing the adequate treatment and anticipate the outcome. Management of renal trauma is evolving to a more conservative approach, avoiding surgery when it is possible.Our objective was to analyse our 5-year experience of renal trauma at a level 1 trauma center and report the patterns of injury, management and complications.   Methods: Retrospective analysis of patients diagnosed with renal trauma at a level 1 trauma center between January 2017 and December 2021. Data were collected from electronic patient records.   Results: During this period of time, we identified 29 patients, 93.1% male, admitted due to renal trauma. Median age was 48 years old. The majority had a blunt trauma (89.7%). The distribution of injury grade according to the AAST classification was: 6.9% grade I, 13.8% grade II, 41.4% grade III, 31% grade IV and 6.9% grade V. No patient died due to this trauma. A percentage of 43.3% of patients were treated conservatively, 6.7% with embolization by interventional radiology, 30.0% with a double J ureteral stent and 20.0% with nephrectomy. Early complications were observed in 34.4% of the patients.   Conclusion: The vast majority of renal injuries were due to blunt trauma, as expected. At this moment, management of renal trauma is trending to a more conservative approach, but in our sample, half of the patients needed intervention, mainly due to urinary extravasation but also because active bleeding and unfavourable clinical evolution. Nephrectomies were performed almost exclusively in grade 4 or 5 of injury. Early complications were more frequent than expected, mainly due to infection, in spite of empiric antibiotic therapy have been done in all patients.Introdução: O trauma renal compreende entre 1% a 5% de todos os doentes de trauma, a maioria por trauma contuso. Baseada na classificação da American Association for the Surgery of Trauma (AAST), podemos classificar o trauma renal em 5 graus, o que ajuda a escolher o melhor tratamento e a prever o desfecho de cada caso. Cada vez mais, o tratamento do trauma renal está a evoluir para um tratamento mais conservador, evitando a cirurgia sempre que possível. O nosso objetivo foi analisar os doentes com trauma renal durante 5 anos no nosso centro e reportar quais os padrões de lesão, o seu tratamento e complicações. Método: Análise retrospetiva dos doentes diagnosticados com trauma renal no Centro Hospitalar Universitário de Lisboa Central, entre Janeiro de 2017 e Setembro de 2021. Os dados foram obtidos através do processo clínico dos doentes. Resultados: Durante este período de tempo, foram identificados 29 doentes, 93,1% do sexo masculino, admitidos por trauma renal. A idade média foi de 48 anos e a grande maioria apresentava um trauma contuso (89,7%). A distribuição dos graus de trauma de acordo com a AAST foi: 6,9% grau I, 13,8% grau II, 41,4% grau III, 31% grau IV e 6,9% grau V. Não se registaram óbitos devido a trauma renal. Foram tratados conservadoramente 43,3%, com embolização pela radiologia de intervenção 6,7%, com a colocação de um stent duplo J 30,0% e com nefrectomia 20,0%. Apresentaram complicações precoces, 34,4%. Conclusão: Tal como expectável, a maioria dos doentes foram admitidos devido a trauma contuso. Atualmente, o tratamento é tendencialmente mais conservador, apesar de na nossa amostra metade dos doentes terem necessitado de uma intervenção, maioritariamente devido a extravasão urinária mas também por hemorragia ativa ou uma evolução clínica desfavorável. As nefrectomias ocorreram quase exclusivamente em lesões de grau IV ou V. As complicações precoces, principalmente infeciosas, foram mais frequentes que o expectável, apesar de todos os doentes terem realizado antibioterapia empírica

    Identificação e caracterização de campanhas de spam a partir de honeypots

    No full text
    Exportado OPUSMade available in DSpace on 2019-08-14T06:04:44Z (GMT). No. of bitstreams: 1 ciencomputacao_pedrohenriquecalaisguerra_dissertacao.pdf: 4783560 bytes, checksum: 0f275c26c4afd618cfee6be3d83cf2cc (MD5) Previous issue date: 9Este trabalho apresenta uma metodologia para caracterização de estratégias de disseminação de spams a partir da identificação de campanhas. Para entender com profundidade como spammers abusam os recursos da rede e constróem suas mensagens, uma análise agregada das mensagens de spam não é suficiente. O agrupamento de mensagens de spam em suas respectivas campanhas permite revelar comportamentos que não poderiam ser percebidos ao considerar o conjunto de mensagens como um todo. Este trabalho propõe uma técnica para identificação de campanhas de spam baseada na construção de uma Árvore de Padrões Frequentes, capaz de capturar os invariantes no conteúdo das mensagens e detectar mensagens que diferem apenas por características ofuscadas e variadas aleatoriamente por spammers. A técnica foi capaz de agrupar um conjunto de 350 milhões de mensagens em 57.851 campanhasdistintas. Em seguida, essas campanhas foram caracterizadas em termos de seus conteúdos e da forma como exploram recursos da rede. A partir da aplicação de algoritmos de mineração de regras de associação, foi possível determinar co-ocorrência de atributos das campanhas que revelam diferentes estratégias de disseminação de spams. Em particular, foram determinadas relações significativas entre a origem do spam e a forma como ele é disseminado na rede,entre sistemas operacionais e tipos de abuso e na forma como spammers encadeiam abusos entre máquinas na rede para entregar mensagens enquanto mantém anonimato. Os dados utilizados no trabalho foram coletados a partir de honeypots de baixa-interatividade que emulam proxies e relays abertos, comumente abusados por spammers. A coleta dos dados por esses emuladores estabeleceu uma visão do tráfego de spams antes que as mensagens fossem entregues aos destinatários, o que permitiu a determinação das diferentes estratégias de entrega de mensagens empregadas por spammers.This work presents a methodology for the characterization of spamming strategies based on the identification of spam campaigns. To deeply understand how spammers abuse network resources and obfuscate their messages, an aggregated analysis of spam messages is not enough. Grouping spam messages into campaigns is important to unveil behaviors that cannot be noticed when looking at the whole set of spams collected. We propose a spam identification technique based on a frequent pattern tree, which naturally captures the invariants on message content and detect messages that differ only due to obfuscated fragments. The technique was able to group 350 million messages into 57,851 distinct campaigns. After that, we characterize these campaigns both in terms of content obfuscation and exploitation of networkresources. Our methodology includes the use of attribute association analysis: by applying an association rule mining algorithm, we were able to determine co-occurrence of campaign attributes that unveil different spamming strategies. In particular, we found strong relationsbetween the origin of the spam and how the network was abused, between operating systems and types of abuse and patterns that describe how spammers chain machines over the Internetto conceal their identities. Data was collected from low-interaction honeypots emulating open proxies and open relays, traditionally abused by spammers. The data collected from these emulators created a vantage point of spams from inside the network, before the messages were delivered to recipients, and that allowed the determination of the different strategies adopted by spammers to deliver their messages

    Sentiment analysis on multipolarized social networks

    No full text
    Exportado OPUSMade available in DSpace on 2019-08-13T00:03:54Z (GMT). No. of bitstreams: 1 pedrohenriquecalais.pdf: 3352237 bytes, checksum: 372181ed5be9275a4f95777814152964 (MD5) Previous issue date: 24Uma significativa fração de debates em mídias sociais está concentrado em temas que induzem polarização na sociedade que é o processo pelo qual um grupo social se divide em dos sub-grupos com visões opostas sobre um tema. Observamos debates polarizados em uma grande gama de temas amplos e relevantes para a sociedade, como Política, esportes e políticas públicas. Nesta tese de doutorado, desenvolvemos contribuições em três direções: 1. Primeiramente, medimos a intensidade da polarização em redes sociais online que debatem um tema específico. Em particular demonstramos que a métrica de ciência de rede mais coumumente empregada para este tipo de análise (modularidade) não é adequada para discriminar polarização da ausência de polarização; ebtão propomos e avaliamos duas métricas adicionais baseadas na estrutura da rede que, como demonstraremos, capturam mais precisamente o fenômenos social de polarização. 2. Oferecemos novos métodos para processar e interpretar opiniões expressadas em discussões polarizadas online a partir do emprego de teorias bem-estabelecidas na literatura de psicologia social que descrevem como as pessoas formam as suas opiniões. Usamos estas teorias como fundações para novas sinais que habilitam métodos de análise de sentimento em cenários em que as opiniões chegam na forma de fluxos sociais um fluxo de opiniões evolutivo e dinâmico. 3. A terceira contribuição está relacionada ao fato de que, em muitos domínios, mais do que dois lados estão em conflito em relação a um tópico, como em sistemas políticos multipartidários. Diferentemente do caso clássico de bipolarização, em redes sociais multipolarizadas observamos relações mais complexas, além da dualidade concordância e antagonismo. Além de demonstrar as inconsistências que não são percebidas em análises de redes sociais bipolarizadas, propomos um algoritmo que infere relações de antagonismo entre comunidades neste cenário.We witness polarized debate in a wide range of relevant topics for the society, such as Politics, Sports and Public Issues. In fact, a significant fraction of debate in social media is concentrated on issues that induce polarization in the society. In this dissertation, we develop contributions on three main directions that analyze and make sense of 'online battles'' fought on social media networks over polarizing topics: We start by (1) measuring the strength of polarization on (online) social networks with respect to a given topic discussion, then, in the context of polarized topics, we (2) offer new methods for processing and interpreting opinions expressed on online polarized debate by uncovering from the social psychology literature well-established social theories that describe how people form their opinions on polarized discussions, and finally we (3) study multipolarized social networks, when more than two viewpoints are in conflict with respect to a topic

    Sentiment Analysis on Evolving Social Streams: How Self-Report Imbalances Can Help ABSTRACT

    No full text
    Real-time sentiment analysis is a challenging machine learning task, due to scarcity of labeled data and sudden changes in sentiment caused by real-world events that need to be instantly interpreted. In this paper we propose solutions to acquire labels and cope with concept drift in this setting, by using findings from social psychology on how humans prefer to disclose some types of emotions. In particular, we use findings that humans are more motivated to report positive feelings rather than negative feelings and also prefer to report extreme feelings rather than average feelings. We map each of these self-report imbalances on two machine learning sub-tasks. The preference on the disclosure of positive feelings can be explored to generate labeled data on polarizing topics, where a positive event for one group usually induces negative feelings from the opposing group, generating an imbalance on user activity that unveils the current dominant sentiment. Based on the knowledge that extreme experiences are more reported than average experiences, we propose a feature representation strategy that focus on terms which appear at spikes in the social stream. When comparing to a static text representation (TF-IDF), we found that our feature representation is more capable of detecting new informative features that capture the sudden changes on sentiment stream caused by real-world events. We show that our social psychology-inspired framework produces accuracies up to 84 % while analyzing live reactions in the debate of two popular sports on Twitter – soccer and football – despite requiring no human effort in generating supervisory labels

    A Measure of Polarization on Social Media Networks Based on Community Boundaries

    No full text
    Polarization in social media networks is a fact in several scenarios such as political debates and other contexts such as same-sex marriage, abortion and gun control. Understanding and quantifying polarization is a longterm challenge to researchers from several areas, also being a key information for tasks such as opinion analysis. In this paper, we perform a systematic comparison between social networks that arise from both polarized and non-polarized contexts. This comparison shows that the traditional polarization metric – modularity – is not a direct measure of antagonism between groups, since non-polarized networks may be also divided into fairly modular communities. To bridge this conceptual gap, we propose a novel polarization metric based on the analysis of the boundary of a pair of (potentially polarized) communities, which better captures the notions of antagonism and polarization. We then characterize polarized and non-polarized social networks according to the concentration of high-degree nodes in the boundary of communities, and found that polarized networks tend to exhibit low concentration of popular nodes along the boundary. To demonstrate the usefulness of our polarization measures, we analyze opinions expressed on Twitter on the gun control issue in the United States, and conclude that our novel metrics help making sense of opinions expressed on online media.

    Social Data: Biases, Methodological Pitfalls, and Ethical Boundaries

    No full text
    corecore