8,885 research outputs found

    DeepPermNet: Visual Permutation Learning

    Full text link
    We present a principled approach to uncover the structure of visual data by solving a novel deep learning task coined visual permutation learning. The goal of this task is to find the permutation that recovers the structure of data from shuffled versions of it. In the case of natural images, this task boils down to recovering the original image from patches shuffled by an unknown permutation matrix. Unfortunately, permutation matrices are discrete, thereby posing difficulties for gradient-based methods. To this end, we resort to a continuous approximation of these matrices using doubly-stochastic matrices which we generate from standard CNN predictions using Sinkhorn iterations. Unrolling these iterations in a Sinkhorn network layer, we propose DeepPermNet, an end-to-end CNN model for this task. The utility of DeepPermNet is demonstrated on two challenging computer vision problems, namely, (i) relative attributes learning and (ii) self-supervised representation learning. Our results show state-of-the-art performance on the Public Figures and OSR benchmarks for (i) and on the classification and segmentation tasks on the PASCAL VOC dataset for (ii).Comment: Accepted in IEEE International Conference on Computer Vision and Pattern Recognition CVPR 201

    Estratégias para uso de redes industriais sem fio do tipo TSCH em aplicações de mobilidade

    Get PDF
    A utilização de redes sem fio para aplicações industriais surge como uma alternativa para os sistemas cabeados por apresentarem características como flexibilidade de ampliação ou atualização de dispositivos na rede e facilidade de instalação e manutenção. Protocolos de comunicação para redes sem fio industriais, como WirelessHART, foram desenvolvidos para atender a requisitos de operação do setor industrial garantindo entrega de mensagens em tempo real, segurança e confiabilidade. O protocolo WirelessHART foi desenvolvido para atender aplicações de automação de processos, onde as variáveis do processo são alteradas de forma lenta. Quando inseridos elementos de alta dinamicidade, como a presença de dispositivos móveis ou intermitentes, como nos processos de automação fabril, há um impacto negativo no desempenho destas redes devido à rápida mudança de topologia que não é prevista neste protocolo, e que resultam na redução da taxa de sucesso de transmissões. Dentro deste contexto, este trabalho apresenta a análise dos requisitos e a implementação de dispositivos móveis ou intermitentes e gerenciadores de rede em conformidade com a técnica TSCH (Time Synchronized Channel Hopping), como a empregada no WirelessHART. São propostas modificações em procedimentos do protocolo utilizado como base, visando fornecer o suporte a dispositivos móveis que incluem técnicas para agilizar o processo de conexão e desconexão e manter a conectividade do dispositivo enquanto ele se movimenta pela área de cobertura da rede. Os resultados revelam a viabilidade das técnicas propostas, porém, em detrimento de algumas características fundamentais, tais como segurança e baixo consumo de energia. Para mitigar os problemas gerados, são apresentadas propostas a serem implementadas em trabalhos futuros.The use of wireless networks for industrial applications appears as an alternative for wired systems due to its characteristics such as flexibility to add or remove devices on the network and ease of maintenance and installation. Communication protocols for industrial wireless networks, such as WirelessHART, were developed to meet the operating requirements of the industrial sector ensuring real-time communications, security and reliability. The WirelessHART protocol was developed to operate in process automation applications, where process variables are changed slowly. When high dynamics elements are inserted in these networks, such as the presence of mobile or intermittent devices, as seen in factory automation processes, there is a negative impact on the performance of these networks due to the fast topology change that is not supported in this protocol, resulting in the reduction of success rate of transmissions. In this context, this work presents the analysis of requirements and the implementation of mobile or intermittent devices and network managers in accordance with the TSCH (Time Synchronized Channel Hopping) technique, which is used in WirelessHART. Modifications to the procedures of the protocol used as a basis are proposed, aiming to provide support for mobile devices including techniques to reduce time in processes as connection and disconnection and maintain the connectivity of the device while it moves through the network coverage area. The results show the feasibility of the proposed techniques, however, to the detriment of some fundamental characteristics, such as safety and low energy consumption. In order to mitigate the problems generated, proposals are presented to be implemented in future works

    Zero-Shot Verified Image Generation: from Natural Language to Visual Prompts

    Get PDF
    Text-to-image generation methods (T2I) are popular in generating art and other creative artifacts. While visual hallucinations can be a positive factor in scenarios where creativity is appreciated, such artifacts are poorly suited for cases where the generated image needs to be grounded in complex natural language without explicit visual elements. In this thesis, we propose to strengthen the consistency property of T2I methods in the presence of natural complex language, which often breaks the limits of T2I methods by including non-visual information and textual elements that require external knowledge. To address these phenomena, we propose a Natural Language to Verified Image generation approach (NL2VI) that converts a natural prompt into a visual prompt, which is more suitable for image generation. A T2I model generates an image for the visual prompt, which is verified with visual question answering algorithms. Experimentally, aligning natural prompts with image generation can improve the consistency of the generated images by up to 11% over the state-of-the-art. Moreover, improvements can generalize to challenging domains like cooking and DIY tasks, where the correctness of the generated images is crucial to illustrate actions. Our NL2VI approach was implemented in the TWIZ conversational agent, the winner of the "Alexa Prize TaskBot Challenge 2 1". Alexa Prize TaskBot is a multimodal challenge focused on developing agents that assist customers in completing tasks that require multiple steps and decisions. Our NL2VI algorithm allowed us to faithfully illustrate a vast array of real-world complex tasks shown to thousands of Alexa customers.Os métodos de geração de texto para imagem (T2I) são comuns na criação de arte e outros artefatos criativos. Embora alucinações visuais possam ser um fator positivo em cenários onde a criatividade é apreciada, tais artefatos são inadequados para casos onde a imagem gerada precisa de estar fundamentada em linguagem natural sem elementos visuais explícitos. Nesta tese propomos fortalecer a propriedade de consistência dos métodos T2I na presença de linguagem natural complexa, que muitas vezes ultrapassa os limites dos métodos T2I por incluir informações não visuais e elementos textuais que requerem conhecimento externo. Para resolver estes problemas, propomos uma novo método de geração: Linguagem Natural para Imagem Verificada (NL2VI), que converte um prompt natural num prompt visual, que é mais adequado para a geração de imagens. Um modelo T2I gera então uma imagem para o prompt visual, que é depois verificada com algoritmos de visual question answering. Experimentalmente alinhar prompts naturais com a geração de imagens pode melhorar a consistência das imagens geradas em até 11% em comparação com o estado da arte. Além disso, melhorias podem generalizar para domínios desafiadores como culinária e tarefas do tipo "faça você mesmo"(DIY), onde a correção das imagens geradas é crucial para ilustrar ações. O nosso método NL2VI foi implementado no agente conversational TWIZ, o vencedor do desafio "Alexa Prize TaskBot Challenge 2 2". Alexa Prize TaskBot é um desafio multimo- dal focado no desenvolvimento de agentes que assistem os clientes a completar uma tarefa que requer múltiplos passos e decisões. O nosso algoritmo NL2VI permitiu-nos ilustrar fielmente uma vasta gama de tarefas complexas do mundo real que foram mostradas a milhares de clientes da Alexa

    Limitaciones al derecho de huelga en Chile: los servicios esenciales, el reemplazo de trabajadores y los servicios mínimos en el contexto de la reforma laboral

    Get PDF
    The right to strike is a fundamental right. The purpose is to ensure that there is sufficient protection for organizations that want to organize, especially with the possibility that eventually workers can negotiate on equal conditions with their employers. However, like any right recognized in law, it should merge and interact in the legal system with various rights, since in a pluralistic and democratic systems, limited rights do not exist. Thus, the right to strike is subject to limits and restrictions, these limits & restrictions can take affect only before extraordinary and authorized situations. For example in a serious national crisis or in the case of public service or essential services, in the strict sense term, limits can occur.No cabe duda que el derecho de huelga es un derecho fundamental, cuyo propósito es garantizar una adecuada protección al ejercicio del derecho de organización que gozan los trabajadores, y sobre todo a la posibilidad que finalmente los trabajadores puedan negociar en un plano de igualdad de condiciones con sus empleadores. Sin embargo, al igual que cualquier derecho reconocido en el ordenamiento jurídico, éste debe confluir e interactuar en el sistema jurídico con diversos derechos, puesto que en un sistema pluralista y democrático no existen derechos absolutos e ilimitados. De esta forma, el derecho de huelga se encuentra afecto a límites y restricciones, mismos que sólo debiesen proceder ante situaciones excepcionales y calificadas, como lo es ante una situación de crisis nacional aguda, o bien cuando se trate de una función pública o de servicios esenciales en el sentido estricto del término

    Step into tourism virtual reality and explore the world

    Get PDF
    The tourism sector has been evolving and growing, facing several changes, transformations and innovations following the current technological revolution. This revolution has been taking place at an exponential level, making it crucial for companies to urgently and immediately adapt to the new needs of consumers. Following this increasing tendency, one of the technologies with the highest projected potential for growth and most advanced is Virtual Reality. The purpose of the present study is to further understand how Virtual Reality can be incorporated as a marketing tool in the strategic plan of tourism companies, answering the research question “To what extent does Virtual Reality, used as a marketing tool, enhance the desire of traveling?”. In order to assess the aforementioned, this dissertation addressed the predisposition of 20 prospective tourists towards the tool in question and how it would ultimately influence their choices. Once established whether or not it would be relevant to take advantage of this innovation, the perception and approach of 6 tourism professionals and experts about this new method were also explored and analyzed through semi-structured interviews. This analysis was carried out through semi-structured interviews that were then analyzed by Leximancer software which, in turn, identified 4 main themes: "Virtual Reality", "Destinations", "Travel" and "Games" - representing the most mentioned topics. After an extensive and precise analysis of the information previously gathered, the results show that both tourists and tourism professionals were receptive to the incorporation of this technology as a tool to promote tourist destinations.O sector turístico tem vindo a evoluir e a crescer ao longo do tempo, enfrentando várias mudanças, transformações e inovações alinhadas com a atual revolução tecnológica. Esta revolução tem tido lugar a um nível exponencial, tornando crucial para as empresas a adaptação urgente e imediata às novas necessidades dos consumidores. Seguindo esta tendência crescente, uma das tecnologias mais avançadas e com maior potencial de crescimento é a Realidade Virtual. O objetivo do presente estudo passa por compreender melhor como a Realidade Virtual pode ser incorporada como ferramenta de marketing no plano estratégico de empresas do setor do turismo, respondendo à pergunta de investigação "Até que ponto a Realidade Virtual, utilizada como ferramenta de marketing, pode aumentar o desejo de viajar? A fim de avaliar o descrito anteriormente, nesta dissertação aborda-se a predisposição de 20 potenciais turistas para a ferramenta em questão e a forma como esta acabaria por influenciar as suas escolhas. Uma vez estabelecido se seria ou não relevante tirar partido desta inovação, a perceção e abordagem de 6 profissionais e peritos do turismo sobre este novo método foram também exploradas e analisadas através de entrevistas semiestruturadas. Esta análise foi efetuada através da realização de entrevistas semiestruturadas que foram posteriormente analisadas pelo software Leximancer que, por sua vez, identificou 4 temas principais: “Realidade Virtual”, “Destinos”, “Viajar” e “Jogos” – representado os tópicos mais mencionados. Após uma extensa e precisa análise do conteúdo obtido, pôde-se concluir que, tanto os consumidores como os profissionais do turismo, se mostraram recetivos à incorporação desta tecnologia como ferramenta de promoção de destinos turísticos

    Online Activities through Social Media by High Education Students: Business vs. Informatics

    Get PDF
    Online Social Networks (OSN) are the new tools that students are using to interact, communicate and collaborate for school work. The impact on school activities, as well as the communication mechanisms among students, have just started to be studied. This research focuses on this issue, trying to answer the question: How do college students use OSN to improve communication and exchange knowledge? For this purpose we used the application of two online surveys applied to students of business administration (BBA - Bachelor in Business Administration) and informatics management (BIM – Bachelor in Informatics Management) students in 2010 and 2012 in Mexico. Our findings reveal that business administration students are the ones that use these kinds of platforms more frequently for sharing information and communicating with their peers. The comparison of these two surveys shows how the behavior and activities among students have changed

    Facebook-Twitter acquisition proposal

    Get PDF
    Social networks have revolutionized the world by reshaping the way people communicate, interact and live. Facebook was the main propeller of this transformation and is still the undisputed market leader. Twitter also presents a wide (even though smaller) user base, which has been experiencing a slow down during the past year, affecting the company’s financials and its stability. Inspired in news and market rumors, this dissertation aims to extensively analyze the potential acquisition of Twitter, Inc. by Facebook, Inc., focusing on (but not limited to) the perspective of the latter. Taking into account the operational specificities of each company and the industry landscape, I valued both companies on a standalone basis and reached a per share DCF (Discounted Cash Flow) value of 104.98forFacebookand104.98 for Facebook and 17.49 for Twitter. The main argument of the dissertation – the viability of this deal – is supported by potential estimated synergies up to 14,133million(optimisticscenario)tobederivedfromacombinationofbothcompanies.Isuggestabidpremiumof51amixedpaymentstructurecomposedby86.6anexchangeratioof0.23)and13.4totalinganofferof14,133 million (optimistic scenario) to be derived from a combination of both companies. I suggest a bid premium of 51% and a mixed payment structure composed by 86.6% of stock (fixed share agreement with an exchange ratio of 0.23) and 13.4% of cash (50% of the bidder’s cash balance), totaling an offer of 27.65 per share. According to my assumptions and the conducted analysis, both parties should seriously consider such deal since it benefits their shareholders

    Deep learning for large-scale fine-grained recognition of cars

    Get PDF
    Deep learning (DL) is widely used nowadays, with several applications in image classification and object detection. Among many of these applications is the use of Convolutional Neural Networks (CNNs) whose operation is: for a given input (image) and output (label/class), generate representations that define and allow to distinguish different kinds of objects. Neural Networks are computationally demanding, taking hours to train. Convolutional Neural Networks are even more demanding since their input data are usually images – a rich data type that holds a lot of information. The fast evolution in Computer Vision, using deep learning techniques, and computing power recently allowed to train CNNs which can classify images with high precision. In car classifieds websites images are one of the most important types of content. However, until today, little knowledge/metadata is produced from such images. In order to insert an advert in the platform, the user must upload an image of the car for sale and fill a certain number of fields, among them the vehicle category, the color of the car and its respective make, model and version. In this dissertation, CNNs are used for the recognition of the make, model and version of cars where transfer learning and fine-tuning are two approaches used for transferring the knowledge learned in one task and adapting it to another. We extend the work to also validate the efficacy of these neural networks on the tasks of vehicle category and cars’ color recognition. We pretend to validate how CNNs behave in these different tasks. Approaches like background removal and data augmentation are explored for reducing overfitting. We collected one of the largest datasets to date for the task of make, model and version recognition of cars, composed of 1.2 million images belonging to 790 labels.The results obtained in the scope of this dissertation set a new state-of-the-art performance for this type of task (accuracy of 92.7% on an ensemble method) considering the number of classes to classify and the number of images used. It is demonstrated the efficacy of the recent advances in CNN architectures in fine-grained classification where intra-class variation is small and viewpoint variation is high, when a largescale dataset is used.Deep Learning (DL) é um termo cada vez mais mencionado nos dias de hoje, com vastas aplicações em classificação de imagens e detecção de objectos. Por detrás de muitas destas aplicações está a utilização de Convolutional Neural Networks (CNN) cujo funcionamento é, para um dado input (imagem) e output (nome do objecto representado/classe), produzir representações que definem e permitem distinguir vários tipos de objectos. As redes neuronais são computacionalmente exigentes e podem levar horas a ser treinadas. Convolutional Neural Networks são ainda mais exigentes visto o seu input ser, usualmente, imagens - um tipo de dados rico que contém muita informação. Com a rápida evolução do poder computacional aliada à evolução no campo de Computer Vision com recurso a CNNs é possível, somente nos últimos anos, treinar CNNs para classificação de imagens com alto nível de precisão. Em sites de classificados de carros as imagens são um dos tipos de conteúdo mais importante. Todavia até aos dias de hoje, pouco conhecimento/metadados são gerados a partir das mesmas. O utilizador tem sempre que, para inserir um anúncio na plataforma, preencher um vasto número de campos, entre eles a categoria do veículo, a cor do carro e a respectiva marca, modelo e versão, e inserir uma imagem do carro para venda. Nesta dissertação são utilizadas CNNs para o reconhecimento da marca, modelo e versão de carros em que se utiliza transfer learning e fine-tuning para transferir o conhecimento “aprendido” numa tarefa e adaptá-lo para outra. O trabalho é estendido de forma a demonstrar, também, a eficácia destas redes neuronais para as tarefas de reconhecimento da categoria do veículo e reconhecimento de cor de carros. Pretendemos validar como as CNNs se comportam nestes diferentes tipos de tarefas. Abordagens como remoção do fundo da imagem e data augmentation são utilizadas para reduzir overfitting.É obtido um dos maiores datasets para a tarefa de reconhecimento de marca, modelo e versão de carros, composto por 1,2 milhões de imagens pertencentes a 790 classes. Os resultados apresentados são dos melhores para este tipo de tarefa (precisão de 92.7% com um ensemble) considerando tanto o número de classes a classificar como o número de imagens utilizadas. Os resultados obtidos evidenciam a eficácia das arquitecturas de CNNs modernas para a classificação granular onde a variação intra-classe é reduzida e a variação da perspectiva é elevada, quando é utilizado um dataset de grandes dimensões
    corecore