9 research outputs found

    Desenvolvimento de uma gramática para construção automática de arquiteturas de deep learning aplicado à classificação de imagens dermatoscópicas

    Get PDF
    O melanoma é um tumor maligno originário nas células produtoras de pigmentos naturais da pele, a melanina. Causado pela produção excessiva da melanina, costuma ter forma de lesões pigmentadas sobre a pele. Trata-se de um dos mais perigosos tipos de câncer de pele. O número crescente de incidentes e causas de mortes fez com que surgisse uma maior busca por soluções de detecção da doença especialmente em seus estágios iniciais, onde ela frequentemente se mostra falha, principalmente quando o profissional que analisa a lesão não é experiente. Por essa razão, é de grande importância o uso de ferramentas computacionais para o auxílio na análise das lesões, de forma que os resultados se tornem mais precisos e confiáveis, viabilizando, assim, a correta identificação do tumor. Outro aspecto importante é a democratização do diagnóstico disponibilizando conhecimento anteriormente limitado a especialistas. O deep learning é uma área de pesquisa em alta nos últimos anos devido à sua aplicação bem-sucedida em diversos domínios, como visão computacional e reconhecimento de imagem. Sua técnica mais proeminente é a rede neural convolutiva, que permite a rede o aprendizado de representações automaticamente. No entanto, a técnica tem algumas limitações, projetar essas redes não é uma tarefa fácil e o domínio requer bastante conhecimento. Neste trabalho, apresentamos o uso do algoritmo genético associado à programação genética baseada em gramática para otimizar arquiteturas de redes neurais convolutivas. É apresentada uma gramática capaz de explorar o espaço de busca do problema de forma a viabilizar a criação de indivíduos válidos capazes de serem qualitativamente analisados. Para avaliação da abordagem proposta, foi utilizado um conjunto de imagens do International Skin Imaging Collaboration (ISIC) durante a validação da evolução das arquiteturas produzidas, usando a métrica da acurácia para avaliar o desempenho de classificação no conjunto de dados de teste. Os resultados demonstram que o método usando programação genética baseada em gramática pode facilmente produzir arquiteturas CNN otimizadas que são competitivas e alcançam resultados de alta precisão, se mostrando superior em comparação com técnicas do estado da arte.Melanoma is a type of cancer originated in the pigment-producing melanocytes of the skin and caused by over production of melanin pigments by melanocytes. It is also known as malignant melanoma and often resembles moles or pigmented skin lesions. Melanoma is the most dangerous type of skin cancer. The continuous increase in incidence rates and melanoma mortality have guided searchs aiming to help specially on early detections, where physicists usually fail on detecting and the diagnosis is most efficient. Therefore, the use of computational tools helping the analysis of skin lesions is very important. These tools can increase the accuracy and precision of the correct diagnosis of the lesion. Another important aspect that should be considered is the democratization of the disease diagnosis sharing knowledge that used to be limited to specialized people. Deep Learning is a research area under the spotlight in recent years due to its successful application to many domains, such as computer vision and image recognition. The most prominent technique derived from Deep Learning is Convolutional Neural Network, which allows the network to learn representations needed for detection or classification tasks automatically. Deep learning convolutional neural networks (CNN) may facilitate melanoma detection. However, CNN have some limitations, as designing these networks are not easy to master and require expertise and insight. In this work, we present the use of genetic algorithm associated to grammar-based genetic programming to optimize convolution neural network architectures. It is presented a grammar capable of exploring a search space from the problem. The search using the grammar ensure the criation of valid individuos that can be qualitatively analized. To evaluate our proposed approach, we adopted images from ISIC dataset to validate the evolution of the generated architectures, using the metric of accuracy to evaluate its classification performance in the test dataset. The results demonstrate that our method using grammar-based genetic programming can easily produce optimized CNN architectures that are competitive and achieve high accuracy results, showing superior results in comparison with the state-of-the-art methods

    Communication patterns abstractions for programming SDN to optimize high-performance computing applications

    Get PDF
    Orientador : Luis Carlos Erpen de BonaCoorientadores : Magnos Martinello; Marcos Didonet Del FabroTese (doutorado) - Universidade Federal do Paraná, Setor de Ciências Exatas, Programa de Pós-Graduação em Informática. Defesa: Curitiba, 04/09/2017Inclui referências : f. 95-113Resumo: A evolução da computação e das redes permitiu que múltiplos computadores fossem interconectados, agregando seus poderes de processamento para formar uma computação de alto desempenho (HPC). As aplicações que são executadas nesses ambientes processam enormes quantidades de informação, podendo levar várias horas ou até dias para completar suas execuções, motivando pesquisadores de varias áreas computacionais a estudar diferentes maneiras para acelerá-las. Durante o processamento, essas aplicações trocam grandes quantidades de dados entre os computadores, fazendo que a rede se torne um gargalo. A rede era considerada um recurso estático, não permitindo modificações dinâmicas para otimizar seus links ou dispositivos. Porém, as redes definidas por software (SDN) emergiram como um novo paradigma, permitindoa ser reprogramada de acordo com os requisitos dos usuários. SDN já foi usado para otimizar a rede para aplicações HPC específicas mas nenhum trabalho tira proveito dos padrões de comunicação expressos por elas. Então, o principal objetivo desta tese é pesquisar como esses padrões podem ser usados para ajustar a rede, criando novas abstrações para programá-la, visando acelerar as aplicações HPC. Para atingir esse objetivo, nós primeiramente pesquisamos todos os níveis de programabilidade do SDN. Este estudo resultou na nossa primeira contribuição, a criação de uma taxonomia para agrupar as abstrações de alto nível oferecidas pelas linguagens de programação SDN. Em seguida, nós investigamos os padrões de comunicação das aplicações HPC, observando seus comportamentos espaciais e temporais através da análise de suas matrizes de tráfego (TMs). Concluímos que as TMs podem representar as comunicações, além disso, percebemos que as aplicações tendem a transmitir as mesmas quantidades de dados entre os mesmos nós computacionais. A segunda contribuição desta tese é o desenvolvimento de um framework que permite evitar os fatores da rede que podem degradar o desempenho das aplicações, tais como, sobrecarga imposta pela topologia, o desbalanceamento na utilização dos links e problemas introduzidos pela programabilidade do SDN. O framework disponibiliza uma API e mantém uma base de dados de TMs, uma para cada padrão de comunicação, anotadas com restrições de largura de banda e latência. Essas informações são usadas para reprogramar os dispositivos da rede, alocando uniformemente as comunicações nos caminhos da rede. Essa abordagem reduziu o tempo de execução de benchmarks e aplicações reais em até 26.5%. Para evitar que o código da aplicação fosse modificado, como terceira contribuição, desenvolvemos um método para identificar automaticamente os padrões de comunicação. Esse método gera texturas visuais di_erentes para cada TM e, através de técnicas de aprendizagem de máquina (ML), identifica as aplicações que estão usando a rede. Em nossos experimentos, o método conseguiu uma taxa de acerto superior a 98%. Finalmente, nós incorporamos esse método ao framework, criando uma abstração que permite programar a rede sem a necessidade de alterar as aplicações HPC, diminuindo em média 15.8% seus tempos de execução. Palavras-chave: Redes Definidas por Software, Padrões de Comunicação, Aplicações HPC.Abstract: The evolution of computing and networking allowed multiple computers to be interconnected, aggregating their processing powers to form a high-performance computing (HPC). Applications that run in these computational environments process huge amounts of information, taking several hours or even days to complete their executions, motivating researchers from various computational fields to study different ways for accelerating them. During the processing, these applications exchange large amounts of data among the computers, causing the network to become a bottleneck. The network was considered a static resource, not allowing dynamic adjustments for optimizing its links or devices. However, Software-Defined Networking (SDN) emerged as a new paradigm, allowing the network to be reprogrammed according to users' requirements. SDN has already been used to optimize the network for specific HPC applications, but no existing work takes advantage of the communication patterns expressed by those applications. So, the main objective of this thesis is to research how these patterns can be used for tuning the network, creating new abstractions for programming it, aiming to speed up HPC applications. To achieve this goal, we first surveyed all SDN programmability levels. This study resulted in our first contribution, the creation of a taxonomy for grouping the high-level abstractions offered by SDN programming languages. Next, we investigated the communication patterns of HPC applications, observing their spatial and temporal behaviors by analyzing their traffic matrices (TMs). We conclude that TMs can represent the communications, furthermore, we realize that the applications tend to transmit the same amount of data among the same computational nodes. The second contribution of this thesis is the development of a framework for avoiding the network factors that can degrade the performance of applications, such as topology overhead, unbalanced links, and issues introduced by the SDN programmability. The framework provides an API and maintains a database of TMs, one for each communication pattern, annotated with bandwidth and latency constraints. This information is used to reprogram network devices, evenly placing the communications on the network paths. This approach reduced the execution time of benchmarks and real applications up to 26.5%. To prevent the application's source code to be modified, as a third contribution of our work, we developed a method to automatically identify the communication patterns. This method generates different visual textures for each TM and, through machine learning (ML) techniques, identifies the applications using the network. In our experiments the method succeeded with an accuracy rate over 98%. Finally, we incorporate this method into the framework, creating an abstraction that allows programming the network without changing the HPC applications, reducing on average 15.8% their execution times. Keywords: Software-Defined Networking, Communication Patterns, HPC Applications

    Génération automatique de résumés par analyse sélective

    Full text link
    Thèse numérisée par la Direction des bibliothèques de l'Université de Montréal

    Open Educational Resources: A Catalyst for Innovation

    Get PDF
    Foreword: Open educational resources (OER) are rapidly becoming a major phenomenon in education across OECD countries and beyond. Initiated largely at the level of institutions by pioneers and technology advocates, the OER community has grown considerably over the past ten years and the impact of OER on educational systems has become an issue of public policy. The open education community is increasingly well organised and enjoys support from various institutions and foundations. National governments have developed, or are in the process of developing, open policies to support access to and use of OER. It is the task of the OECD Centre for Educational Research and Innovation (CERI) and the OECD Directorate for Education to help policy makers and other stakeholders to confront challenges and benefit from new developments in the educational domain for better policies on improving teaching and learning. This report follows earlier work by CERI on OER, which resulted in the publication Giving Knowledge for Free in 2007, and an OECD country questionnaire on OER-related policy and activities in 2012. It seeks to provide a state of the art review of evidence on OER practice and impacts, and evaluate the remaining challenges for OER entering the mainstream of educational practice

    Digital agriculture: research, development and innovation in production chains.

    Get PDF
    Digital transformation in the field towards sustainable and smart agriculture. Digital agriculture: definitions and technologies. Agroenvironmental modeling and the digital transformation of agriculture. Geotechnologies in digital agriculture. Scientific computing in agriculture. Computer vision applied to agriculture. Technologies developed in precision agriculture. Information engineering: contributions to digital agriculture. DIPN: a dictionary of the internal proteins nanoenvironments and their potential for transformation into agricultural assets. Applications of bioinformatics in agriculture. Genomics applied to climate change: biotechnology for digital agriculture. Innovation ecosystem in agriculture: Embrapa?s evolution and contributions. The law related to the digitization of agriculture. Innovating communication in the age of digital agriculture. Driving forces for Brazilian agriculture in the next decade: implications for digital agriculture. Challenges, trends and opportunities in digital agriculture in Brazil.Translated by Beverly Victoria Young and Karl Stephan Mokross

    Digital agriculture: research, development and innovation in production chains.

    Get PDF
    Digital transformation in the field towards sustainable and smart agriculture. Digital agriculture: definitions and technologies. Agroenvironmental modeling and the digital transformation of agriculture. Geotechnologies in digital agriculture. Scientific computing in agriculture. Computer vision applied to agriculture. Technologies developed in precision agriculture. Information engineering: contributions to digital agriculture. DIPN: a dictionary of the internal proteins nanoenvironments and their potential for transformation into agricultural assets. Applications of bioinformatics in agriculture. Genomics applied to climate change: biotechnology for digital agriculture. Innovation ecosystem in agriculture: Embrapa?s evolution and contributions. The law related to the digitization of agriculture. Innovating communication in the age of digital agriculture. Driving forces for Brazilian agriculture in the next decade: implications for digital agriculture. Challenges, trends and opportunities in digital agriculture in Brazil

    Binary operators in multimidia data base

    No full text
    Os atuais gerenciadores de banco de dados não são adequados para manipulação de dados complexos; e entre eles destacamos os dados multimídia que, para agilizar as consultas usam a operação de igualdade sobre as estruturas de indexação.Operações de igualdade são pouco utilizadas em operações que envolvem dados complexos, uma vez que, a existência de dois elementos extremamente iguais é rara. Uma classe de operadores que se adequa melhor para manipulação desses dados são os operadores por similaridade. Exemplo de operadores de seleção por similaridade são a consulta por abrangência (range queries) e consulta aos vizinhos mais próximos. Exemplificando, o operador de seleção aos vizinhos mais próximos responde a consultas como, ?selecione as cinco proteínas mais parecidas pelo alinhamento da proteína Sparc (responsável pelo câncer de pele)?. Existem muitos trabalhos desenvolvidos no sentido de prover operadores de seleção por similaridade envolvendo estruturas baseadas em árvores. Entretanto, poucos estudos têm sido realizados envolvendo a utilização de operadores diferentes da seleção, por exemplo, a junção. Um operador de junção compara pares de objetos de elementos pertencentes ao domínio dos dados, ao passo que um operador de seleção recebe uma constante para a comparação dos elementos. Podemos ter assim, três operadores de junção por similaridade: operadores de junção por abrangência, por vizinhos mais próximos e sobre os pares de vizinhos mais próximos. Exemplificando, uma consulta utilizando junção por abrangência responde a consultas do tipo: ?Selecione as proteínas contidas no vírus da Hepatite B que diferem em até duas unidades de alinhamento das contidas no vírus da Hepatite C?. Este trabalho apresenta um novo método de acesso métrico em extrema quantidade de dados bem como, formas de implementação das formas de junção em estruturas métricasThe present databases managers are not adequated for complex data manipulation and among them we point out the multimedia data that to speed up the query use the equality operation on the index structure. Equality operations are not much used in operations that involve complex data sence the presence of two elements extremely equal is rare. An operator class that better manipulates these data are the similarity operators. Selection operators by similarity are the range query and the nearest neighbors query. For example, the selection operator to the nearest neighbors answers the queries like: ?select five proteins more similar by the alignment of the Sparc protein (responsible for the skin cancer)?. There are many works developed to provide similarity by selection operators envvolving structures based in trees. However, few studies have been done involving the use of different operators selection, for example, the join. A join operator compares pairs of objects of the elements belonging to the domain of the data, whereas a selection operator receives a constant to make the comparison of the elements. We can have three similarity join operators: the range join operators, the nearest neighbor and the closest neighbors pair. For instance, a query using the range join answers these kind of queries: ?Select the proteins restrained in the Hepatitis B virus that differ up to two unities from the alignment of the protein found in the Heapatitis C virus?. This work presents a new metric access method with an extreme amount of data as well as implementations forms of the join in metric structure
    corecore