8,885 research outputs found
DeepPermNet: Visual Permutation Learning
We present a principled approach to uncover the structure of visual data by
solving a novel deep learning task coined visual permutation learning. The goal
of this task is to find the permutation that recovers the structure of data
from shuffled versions of it. In the case of natural images, this task boils
down to recovering the original image from patches shuffled by an unknown
permutation matrix. Unfortunately, permutation matrices are discrete, thereby
posing difficulties for gradient-based methods. To this end, we resort to a
continuous approximation of these matrices using doubly-stochastic matrices
which we generate from standard CNN predictions using Sinkhorn iterations.
Unrolling these iterations in a Sinkhorn network layer, we propose DeepPermNet,
an end-to-end CNN model for this task. The utility of DeepPermNet is
demonstrated on two challenging computer vision problems, namely, (i) relative
attributes learning and (ii) self-supervised representation learning. Our
results show state-of-the-art performance on the Public Figures and OSR
benchmarks for (i) and on the classification and segmentation tasks on the
PASCAL VOC dataset for (ii).Comment: Accepted in IEEE International Conference on Computer Vision and
Pattern Recognition CVPR 201
Estratégias para uso de redes industriais sem fio do tipo TSCH em aplicações de mobilidade
A utilização de redes sem fio para aplicações industriais surge como uma alternativa para os sistemas cabeados por apresentarem características como flexibilidade de ampliação ou atualização de dispositivos na rede e facilidade de instalação e manutenção. Protocolos de comunicação para redes sem fio industriais, como WirelessHART, foram desenvolvidos para atender a requisitos de operação do setor industrial garantindo entrega de mensagens em tempo real, segurança e confiabilidade. O protocolo WirelessHART foi desenvolvido para atender aplicações de automação de processos, onde as variáveis do processo são alteradas de forma lenta. Quando inseridos elementos de alta dinamicidade, como a presença de dispositivos móveis ou intermitentes, como nos processos de automação fabril, há um impacto negativo no desempenho destas redes devido à rápida mudança de topologia que não é prevista neste protocolo, e que resultam na redução da taxa de sucesso de transmissões. Dentro deste contexto, este trabalho apresenta a análise dos requisitos e a implementação de dispositivos móveis ou intermitentes e gerenciadores de rede em conformidade com a técnica TSCH (Time Synchronized Channel Hopping), como a empregada no WirelessHART. São propostas modificações em procedimentos do protocolo utilizado como base, visando fornecer o suporte a dispositivos móveis que incluem técnicas para agilizar o processo de conexão e desconexão e manter a conectividade do dispositivo enquanto ele se movimenta pela área de cobertura da rede. Os resultados revelam a viabilidade das técnicas propostas, porém, em detrimento de algumas características fundamentais, tais como segurança e baixo consumo de energia. Para mitigar os problemas gerados, são apresentadas propostas a serem implementadas em trabalhos futuros.The use of wireless networks for industrial applications appears as an alternative for wired systems due to its characteristics such as flexibility to add or remove devices on the network and ease of maintenance and installation. Communication protocols for industrial wireless networks, such as WirelessHART, were developed to meet the operating requirements of the industrial sector ensuring real-time communications, security and reliability. The WirelessHART protocol was developed to operate in process automation applications, where process variables are changed slowly. When high dynamics elements are inserted in these networks, such as the presence of mobile or intermittent devices, as seen in factory automation processes, there is a negative impact on the performance of these networks due to the fast topology change that is not supported in this protocol, resulting in the reduction of success rate of transmissions. In this context, this work presents the analysis of requirements and the implementation of mobile or intermittent devices and network managers in accordance with the TSCH (Time Synchronized Channel Hopping) technique, which is used in WirelessHART. Modifications to the procedures of the protocol used as a basis are proposed, aiming to provide support for mobile devices including techniques to reduce time in processes as connection and disconnection and maintain the connectivity of the device while it moves through the network coverage area. The results show the feasibility of the proposed techniques, however, to the detriment of some fundamental characteristics, such as safety and low energy consumption. In order to mitigate the problems generated, proposals are presented to be implemented in future works
Zero-Shot Verified Image Generation: from Natural Language to Visual Prompts
Text-to-image generation methods (T2I) are popular in generating art and other creative
artifacts. While visual hallucinations can be a positive factor in scenarios where creativity
is appreciated, such artifacts are poorly suited for cases where the generated image needs
to be grounded in complex natural language without explicit visual elements. In this
thesis, we propose to strengthen the consistency property of T2I methods in the presence
of natural complex language, which often breaks the limits of T2I methods by including
non-visual information and textual elements that require external knowledge.
To address these phenomena, we propose a Natural Language to Verified Image
generation approach (NL2VI) that converts a natural prompt into a visual prompt, which is
more suitable for image generation. A T2I model generates an image for the visual prompt,
which is verified with visual question answering algorithms. Experimentally, aligning
natural prompts with image generation can improve the consistency of the generated
images by up to 11% over the state-of-the-art. Moreover, improvements can generalize to
challenging domains like cooking and DIY tasks, where the correctness of the generated
images is crucial to illustrate actions.
Our NL2VI approach was implemented in the TWIZ conversational agent, the winner
of the "Alexa Prize TaskBot Challenge 2 1". Alexa Prize TaskBot is a multimodal challenge
focused on developing agents that assist customers in completing tasks that require
multiple steps and decisions. Our NL2VI algorithm allowed us to faithfully illustrate a
vast array of real-world complex tasks shown to thousands of Alexa customers.Os métodos de geração de texto para imagem (T2I) são comuns na criação de arte e outros
artefatos criativos. Embora alucinações visuais possam ser um fator positivo em cenários
onde a criatividade é apreciada, tais artefatos são inadequados para casos onde a imagem
gerada precisa de estar fundamentada em linguagem natural sem elementos visuais
explícitos. Nesta tese propomos fortalecer a propriedade de consistência dos métodos
T2I na presença de linguagem natural complexa, que muitas vezes ultrapassa os limites
dos métodos T2I por incluir informações não visuais e elementos textuais que requerem
conhecimento externo.
Para resolver estes problemas, propomos uma novo método de geração: Linguagem
Natural para Imagem Verificada (NL2VI), que converte um prompt natural num prompt
visual, que é mais adequado para a geração de imagens. Um modelo T2I gera então uma
imagem para o prompt visual, que é depois verificada com algoritmos de visual question
answering. Experimentalmente alinhar prompts naturais com a geração de imagens pode
melhorar a consistência das imagens geradas em até 11% em comparação com o estado da
arte. Além disso, melhorias podem generalizar para domínios desafiadores como culinária
e tarefas do tipo "faça você mesmo"(DIY), onde a correção das imagens geradas é crucial
para ilustrar ações.
O nosso método NL2VI foi implementado no agente conversational TWIZ, o vencedor
do desafio "Alexa Prize TaskBot Challenge 2 2". Alexa Prize TaskBot é um desafio multimo-
dal focado no desenvolvimento de agentes que assistem os clientes a completar uma tarefa
que requer múltiplos passos e decisões. O nosso algoritmo NL2VI permitiu-nos ilustrar
fielmente uma vasta gama de tarefas complexas do mundo real que foram mostradas a
milhares de clientes da Alexa
Limitaciones al derecho de huelga en Chile: los servicios esenciales, el reemplazo de trabajadores y los servicios mínimos en el contexto de la reforma laboral
The right to strike is a fundamental right. The purpose is to ensure that there is sufficient protection for organizations that want to organize, especially with the possibility that eventually workers can negotiate on equal conditions with their employers. However, like any right recognized in law, it should merge and interact in the legal system with various rights, since in a pluralistic and democratic systems, limited rights do not exist. Thus, the right to strike is subject to limits and restrictions, these limits & restrictions can take affect only before extraordinary and authorized situations. For example in a serious national crisis or in the case of public service or essential services, in the strict sense term, limits can occur.No cabe duda que el derecho de huelga es un derecho fundamental, cuyo propósito es garantizar una adecuada protección al ejercicio del derecho de organización que gozan los trabajadores, y sobre todo a la posibilidad que finalmente los trabajadores puedan negociar en un plano de igualdad de condiciones con sus empleadores. Sin embargo, al igual que cualquier derecho reconocido en el ordenamiento jurídico, éste debe confluir e interactuar en el sistema jurídico con diversos derechos, puesto que en un sistema pluralista y democrático no existen derechos absolutos e ilimitados. De esta forma, el derecho de huelga se encuentra afecto a límites y restricciones, mismos que sólo debiesen proceder ante situaciones excepcionales y calificadas, como lo es ante una situación de crisis nacional aguda, o bien cuando se trate de una función pública o de servicios esenciales en el sentido estricto del término
Step into tourism virtual reality and explore the world
The tourism sector has been evolving and growing, facing several changes, transformations and innovations following the current technological revolution. This revolution has been taking place at an exponential level, making it crucial for companies to urgently and immediately adapt to the new needs of consumers. Following this increasing tendency, one of the technologies with the highest projected potential for growth and most advanced is Virtual Reality. The purpose of the present study is to further understand how Virtual Reality can be incorporated as a marketing tool in the strategic plan of tourism companies, answering the research question “To what extent does Virtual Reality, used as a marketing tool, enhance the desire of traveling?”. In order to assess the aforementioned, this dissertation addressed the predisposition of 20 prospective tourists towards the tool in question and how it would ultimately influence their choices. Once established whether or not it would be relevant to take advantage of this innovation, the perception and approach of 6 tourism professionals and experts about this new method were also explored and analyzed through semi-structured interviews. This analysis was carried out through semi-structured interviews that were then analyzed by Leximancer software which, in turn, identified 4 main themes: "Virtual Reality", "Destinations", "Travel" and "Games" - representing the most mentioned topics. After an extensive and precise analysis of the information previously gathered, the results show that both tourists and tourism professionals were receptive to the incorporation of this technology as a tool to promote tourist destinations.O sector turístico tem vindo a evoluir e a crescer ao longo do tempo, enfrentando várias mudanças, transformações e inovações alinhadas com a atual revolução tecnológica. Esta revolução tem tido lugar a um nível exponencial, tornando crucial para as empresas a adaptação urgente e imediata às novas necessidades dos consumidores. Seguindo esta tendência crescente, uma das tecnologias mais avançadas e com maior potencial de crescimento é a Realidade Virtual. O objetivo do presente estudo passa por compreender melhor como a Realidade Virtual pode ser incorporada como ferramenta de marketing no plano estratégico de empresas do setor do turismo, respondendo à pergunta de investigação "Até que ponto a Realidade Virtual, utilizada como ferramenta de marketing, pode aumentar o desejo de viajar? A fim de avaliar o descrito anteriormente, nesta dissertação aborda-se a predisposição de 20 potenciais turistas para a ferramenta em questão e a forma como esta acabaria por influenciar as suas escolhas. Uma vez estabelecido se seria ou não relevante tirar partido desta inovação, a perceção e abordagem de 6 profissionais e peritos do turismo sobre este novo método foram também exploradas e analisadas através de entrevistas semiestruturadas. Esta análise foi efetuada através da realização de entrevistas semiestruturadas que foram posteriormente analisadas pelo software Leximancer que, por sua vez, identificou 4 temas principais: “Realidade Virtual”, “Destinos”, “Viajar” e “Jogos” – representado os tópicos mais mencionados. Após uma extensa e precisa análise do conteúdo obtido, pôde-se concluir que, tanto os consumidores como os profissionais do turismo, se mostraram recetivos à incorporação desta tecnologia como ferramenta de promoção de destinos turísticos
Online Activities through Social Media by High Education Students: Business vs. Informatics
Online Social Networks (OSN) are the new tools that students are using to interact, communicate and collaborate for school work. The impact on school activities, as well as the communication mechanisms among students, have just started to be studied. This research focuses on this issue, trying to answer the question: How do college students use OSN to improve communication and exchange knowledge? For this purpose we used the application of two online surveys applied to students of business administration (BBA - Bachelor in Business Administration) and informatics management (BIM – Bachelor in Informatics Management) students in 2010 and 2012 in Mexico. Our findings reveal that business administration students are the ones that use these kinds of platforms more frequently for sharing information and communicating with their peers. The comparison of these two surveys shows how the behavior and activities among students have changed
Facebook-Twitter acquisition proposal
Social networks have revolutionized the world by reshaping the way people
communicate, interact and live. Facebook was the main propeller of this
transformation and is still the undisputed market leader. Twitter also presents a wide
(even though smaller) user base, which has been experiencing a slow down during the
past year, affecting the company’s financials and its stability.
Inspired in news and market rumors, this dissertation aims to extensively analyze the
potential acquisition of Twitter, Inc. by Facebook, Inc., focusing on (but not limited
to) the perspective of the latter. Taking into account the operational specificities of
each company and the industry landscape, I valued both companies on a standalone
basis and reached a per share DCF (Discounted Cash Flow) value of 17.49 for Twitter.
The main argument of the dissertation – the viability of this deal – is supported by
potential estimated synergies up to 27.65 per share.
According to my assumptions and the conducted analysis, both parties should
seriously consider such deal since it benefits their shareholders
Deep learning for large-scale fine-grained recognition of cars
Deep learning (DL) is widely used nowadays, with several applications in image classification and
object detection. Among many of these applications is the use of Convolutional Neural Networks
(CNNs) whose operation is: for a given input (image) and output (label/class), generate
representations that define and allow to distinguish different kinds of objects.
Neural Networks are computationally demanding, taking hours to train. Convolutional
Neural Networks are even more demanding since their input data are usually images – a rich data
type that holds a lot of information. The fast evolution in Computer Vision, using deep learning
techniques, and computing power recently allowed to train CNNs which can classify images with
high precision.
In car classifieds websites images are one of the most important types of content. However,
until today, little knowledge/metadata is produced from such images. In order to insert an advert
in the platform, the user must upload an image of the car for sale and fill a certain number of fields,
among them the vehicle category, the color of the car and its respective make, model and version.
In this dissertation, CNNs are used for the recognition of the make, model and version of cars
where transfer learning and fine-tuning are two approaches used for transferring the knowledge
learned in one task and adapting it to another. We extend the work to also validate the efficacy of
these neural networks on the tasks of vehicle category and cars’ color recognition. We pretend to
validate how CNNs behave in these different tasks.
Approaches like background removal and data augmentation are explored for reducing
overfitting.
We collected one of the largest datasets to date for the task of make, model and version
recognition of cars, composed of 1.2 million images belonging to 790 labels.The results obtained in the scope of this dissertation set a new state-of-the-art performance
for this type of task (accuracy of 92.7% on an ensemble method) considering the number of classes
to classify and the number of images used.
It is demonstrated the efficacy of the recent advances in CNN architectures in fine-grained
classification where intra-class variation is small and viewpoint variation is high, when a largescale dataset is used.Deep Learning (DL) é um termo cada vez mais mencionado nos dias de hoje, com vastas aplicações
em classificação de imagens e detecção de objectos. Por detrás de muitas destas aplicações está a
utilização de Convolutional Neural Networks (CNN) cujo funcionamento é, para um dado input
(imagem) e output (nome do objecto representado/classe), produzir representações que definem e
permitem distinguir vários tipos de objectos.
As redes neuronais são computacionalmente exigentes e podem levar horas a ser treinadas.
Convolutional Neural Networks são ainda mais exigentes visto o seu input ser, usualmente,
imagens - um tipo de dados rico que contém muita informação. Com a rápida evolução do poder
computacional aliada à evolução no campo de Computer Vision com recurso a CNNs é possível,
somente nos últimos anos, treinar CNNs para classificação de imagens com alto nível de precisão.
Em sites de classificados de carros as imagens são um dos tipos de conteúdo mais importante.
Todavia até aos dias de hoje, pouco conhecimento/metadados são gerados a partir das mesmas. O
utilizador tem sempre que, para inserir um anúncio na plataforma, preencher um vasto número de
campos, entre eles a categoria do veículo, a cor do carro e a respectiva marca, modelo e versão, e
inserir uma imagem do carro para venda.
Nesta dissertação são utilizadas CNNs para o reconhecimento da marca, modelo e versão de
carros em que se utiliza transfer learning e fine-tuning para transferir o conhecimento “aprendido”
numa tarefa e adaptá-lo para outra. O trabalho é estendido de forma a demonstrar, também, a
eficácia destas redes neuronais para as tarefas de reconhecimento da categoria do veículo e
reconhecimento de cor de carros. Pretendemos validar como as CNNs se comportam nestes
diferentes tipos de tarefas.
Abordagens como remoção do fundo da imagem e data augmentation são utilizadas para
reduzir overfitting.É obtido um dos maiores datasets para a tarefa de reconhecimento de marca, modelo e versão
de carros, composto por 1,2 milhões de imagens pertencentes a 790 classes.
Os resultados apresentados são dos melhores para este tipo de tarefa (precisão de 92.7% com
um ensemble) considerando tanto o número de classes a classificar como o número de imagens
utilizadas.
Os resultados obtidos evidenciam a eficácia das arquitecturas de CNNs modernas para a
classificação granular onde a variação intra-classe é reduzida e a variação da perspectiva é elevada,
quando é utilizado um dataset de grandes dimensões
- …