114 research outputs found

    ARCAA: a framework to analyse the artefact ecology in computer music performance

    Get PDF
    This paper presents ARCAA (Actors, Role, Context, Activity, Artefacts), a framework that supports designers in understanding the artefact ecology in the music performance scenario, in particular, allowing to frame the role of the different actors. The ARCAA framework is the result of the combination of two different areas of HCI: artefact ecology concept, and design framework for digital musical instruments. The model borrows three categories from MINUET an established design framework and rethinks them from an ecological perspective. In ARCAA, these three categories are used as three lenses to connect each human actor to her artefact ecology. Finally, the framework allows comparing how the various artefacts create connections among the different people involved. The second part of the paper describes a case study that shows a practical adoption of the framework

    Mixing Modalities of 3D Sketching and Speech for Interactive Model Retrieval in Virtual Reality

    Get PDF
    Sketch and speech are intuitive interaction methods that convey complementary information and have been independently used for 3D model retrieval in virtual environments. While sketch has been shown to be an effective retrieval method, not all collections are easily navigable using this modality alone. We design a new challenging database for sketch comprised of 3D chairs where each of the components (arms, legs, seat, back) are independently colored. To overcome this, we implement a multimodal interface for querying 3D model databases within a virtual environment. We base the sketch on the state-of-the-art for 3D Sketch Retrieval, and use a Wizard-of-Oz style experiment to process the voice input. In this way, we avoid the complexities of natural language processing which frequently requires fine-tuning to be robust. We conduct two user studies and show that hybrid search strategies emerge from the combination of interactions, fostering the advantages provided by both modalities

    Extended perspective system visualizer

    Get PDF
    Tese de mestrado, Engenharia InformĂĄtica (Interacção e Conhecimento), Universidade de Lisboa, Faculdade de CiĂȘncias, 2014A projecção perspectiva linear tem sido o modo predominante de desenhar imagens de espaços tridimensionais hĂĄ sĂ©culos, sejam estes desenhos manuais ou computacionais. Em particular, os arquitectos usam o sistema perspĂ©ctico linear no desenho formal como forma de representar o seu trabalho como este seria observado atravĂ©s da visĂŁo humana. PorĂ©m, este sistema perspĂ©ctico Ă© limitado nesta capacidade. Quando se utilizam Ăąngulos de visĂŁo mais alargados, os desenhos que utilizam projecção perspectiva linear manifestam uma distorção que dificulta a interpretação da imagem e limitam a capacidade desta perspectiva de verdadeiramente representar a visĂŁo humana. Aos 180Âș de Ăąngulo de visĂŁo, o mĂĄximo possĂ­vel neste sistema, a imagem passa a ser inteiramente irreconhecĂ­vel. Formas de projecção perspectiva nĂŁo lineares, ou curvilĂ­neas, como a perspectiva cilĂ­ndrica ou panorĂąmica ou a perspectiva esfĂ©rica, nĂŁo apresentam a mesma limitação. Usando estas perspectivas, o Ăąngulo de visĂŁo pode ser alargado atĂ© aos 360Âș sem que esta distorção apareça. PorĂ©m, estes sistemas tambĂ©m nĂŁo sĂŁo soluçÔes perfeitas jĂĄ que a rectilinearidade nĂŁo Ă© preservada. O Sistema PerspĂ©ctico Expandido (EPS) foi criado por membros da equipa NAADIR (New Approach on Architectural Drawings Integrating computeR descriptions) para responder Ă s limitaçÔes dos sistemas individuais existentes. O seu trabalho, bem como esta dissertação, foram realizados no Ăąmbito do projecto NAADIR (PTDC/AUR-AQI/098388/2008), financiado pela Fundação para a CiĂȘncia e Tecnologia. A equipa inclui membros da Faculdade de CiĂȘncias e da Faculdade de Arquitectura da Universidade de Lisboa. Este sistema une os sistemas perspĂ©cticos linear, esfĂ©rico e cilĂ­ndrico num contĂ­nuo hĂ­brido controlado por dois parĂąmetros. Variando estes dois parĂąmetros, o utilizador pode encontrar sistemas intermĂ©dios e obter deste modo uma melhor visualização do espaço tridimensional representado. O sistema tem tambĂ©m o objectivo de ajudar os arquitectos no seu processo de design, ajudando-os a ter uma melhor visualização do espaço em que trabalham. O sistema EPS realiza a projecção em dois passos e utiliza duas superfĂ­cies, uma superfĂ­cie de projecção elipsoidal e uma superfĂ­cie de representação plana. O primeiro passo consiste em projectar o espaço 3D sobre a superfĂ­cie de projecção. O segundo consiste em mapear a superfĂ­cie de projecção sobre a superfĂ­cie de representação, de modo anĂĄlogo Ă  cartografia, em que a superfĂ­cie da terra Ă© mapeada sobre um plano, criando um mapa. A imagem criada sobre a superfĂ­cie de representação Ă© a imagem final. O elipsĂłide da superfĂ­cie de projecção pode ser manipulado com dois parĂąmetros: raio e excentricidade. Esta manipulação afecta a perspectiva final. Um raio e excentricidade pequenos produzem uma perspectiva mais prĂłxima da esfĂ©rica, um raio pequeno e excentricidade elevada aproximam uma perspectiva cilĂ­ndrica, e um raio elevado aproxima a perspectiva linear. É possĂ­vel tambĂ©m escolher um de trĂȘs modos diferentes de mapeamento da superfĂ­cie de projecção sobre a de representação, o modo esfĂ©rico (projecção azimutal equidistante), o modo cilĂ­ndrico (projecção sinusoidal) e o modo hĂ­brido. Devido Ă  sua natureza dinĂąmica, o EPS Ă© sobretudo Ăștil implementado computacionalmente, com uma interface que permita a sua fĂĄcil manipulação. Em trabalho prĂ©vio, a equipa NAADIR iniciou a implementação do EPS Visualizer, um visualizador de modelos 3D que implementa o sistema EPS. Nesta fase, o visualizador foi desenvolvido ainda sem implementar a maior parte do sistema EPS e sem ser avaliado. Nesta versĂŁo inicial estava apenas implementada a projecção usando o mapeamento esfĂ©rico atĂ© aos 180Âș de Ăąngulo de visĂŁo. A interface do visualizador era composta por quatro viewports, um principal e trĂȘs secundĂĄrios, e por dois menus. Cada viewport permitia visualizar o espaço 3D a partir de cima, baixo, frente, trĂĄs, esquerda ou direita, usando projecção perspectiva linear ou projecção paralela, ou permitia visualizar o espaço a partir de uma cĂąmara usando projecção perspectiva linear ou usando o sistema EPS. Os menus permitiam manipular a posição e orientação da cĂąmara, o Ăąngulo de visĂŁo, a rotação da cĂąmara em relação ao seu eixo frente-trĂĄs e os parĂąmetros do sistema EPS, raio e excentricidade. O visualizador podia ainda renderizar os modelos em wireframe ou com faces opacas. A renderização em wireframe era relativamente rĂĄpida mas a renderização com faces sĂłlidas era lenta,demorando cerca de um minuto a produzir uma Ășnica imagem. O projecto descrito por esta dissertação teve dois objectivos principais. O primeiro foi a conclusĂŁo do EPS Visualizer. Sub-objectivos desta tarefa foram a implementação do sistema EPS por inteiro, o melhoramento do seu desempenho e o melhoramento da sua interface com o utilizador. O segundo foi a realização de duas avaliaçÔes do visualizador. As avaliaçÔes tiveram como objectivo avaliar a qualidade da interface, ajudar a identificar formas de melhorar a interface e avaliar a utilidade do sistema EPS como ferramenta no processo de design de arquitectos. Durante o desenvolvimento do projecto, o EPS Visualizer foi concluĂ­do e foram realizadas as avaliaçÔes previstas, atingindo-se os objectivos. O desenvolvimento do visualizador pode ser dividido em quatro ĂĄreas. A implementação do sistema EPS, o melhoramento do desempenho, a restruturação interna do software e o melhoramento da interface. Foram implementadas as projecçÔes usando o mapeamento esfĂ©rico atĂ© aos 360Âș, usando o mapeamento cilĂ­ndrico e usando o mapeamento hĂ­brido. Completou-se assim a implementação do sistema EPS no visualizador. O desempenho do software foi melhorado implementando-se multi-threading para o cĂĄlculo da projecção. Isto permitiu separar a interface do processo de rendering do cĂĄlculo da projecção EPS e permitiu tambĂ©m que o cĂĄlculo da projecção fosse dividido pelos mĂșltiplos cores que sĂŁo hoje habituais em processadores. Foi tambĂ©m criado um novo sistema de rendering de faces opacas com desempenho similar ao desempenho da renderização de wireframe. Para permitir a implementação do multi-threading, foi necessĂĄrio reestruturar o visualizador. Este processo resultou num nĂșmero maior de classes mais pequenas e num programa que mais facilmente poderia ser adaptado ao multiprocessamento. Finalmente, a interface foi alterada e melhorada. Este processo teve duas fases. A primeira fase ocorreu antes da primeira avaliação. Os menus for reorganizados, o controlo da cĂąmara com o rato foi melhorado e fizeram-se outras modificaçÔes menores. ApĂłs a avaliação deu-se a segunda fase do desenvolvimento da interface. Foram implementadas funcionalidades sugeridas por observaçÔes e sugestĂ”es feitas durante a avaliação. Surgiram opçÔes alternativas para certos elementos da interface que foram implementadas em versĂ”es alternativas da interface. Estas versĂ”es alternativas foram depois testadas na segunda avaliação de modo a se escolher os elementos melhores das duas versĂ”es. A primeira avaliação foi realizada no contexto de um workshop e teve como foco principal o estudo da utilidade do sistema EPS como suporte ao design arquitectĂłnico. Alunos de arquitectura tiveram acesso ao EPS Visualizer durante o workshop no contexto de um projecto de design de arquitectura. Cada aluno pĂŽde usar a ferramenta livremente tendo no final preenchido um questionĂĄrio sobre a sua experiĂȘncia. Os alunos mostraram interesse em usar a ferramenta no futuro e de a ver implementada em software de modelação tridimensional. Consideraram a interface fĂĄcil de usar. A segunda avaliação teve como foco o estudo da usabilidade do visualizador e consistiu em entrevistas individuais supervisionadas com guiĂŁo. Os utilizadores foram divididos em trĂȘs grupos: alunos de arquitectura, profissionais de arquitectura e alunos de informĂĄtica com experiĂȘncia de computação grĂĄfica e modelação 3D. Os utilizadores foram conduzidos atravĂ©s de um conjunto de tarefas em que avaliaram cada elemento da interface. Para cada elemento das duas versĂ”es do visualizador, os utilizadores puderam experimentar ambas as versĂ”es e indicar a sua preferĂȘncia. No final preencheram um questionĂĄrio sobre a sua opiniĂŁo global acerca do visualizador, incluindo um teste SUS (System Usability Scale). Os utilizadores avaliaram a interface de forma positiva, indicando as suas preferĂȘncias sobre versĂ”es alternativas de elementos da interface. O Visualizador EPS foi concluido com sucesso, tendo sido implementado o sistema EPS por completo e o desempenho e interface da aplicação melhorados. Realizaram-se ambas as avaliaçÔes com bons resultados. Foram portanto atingidos os objectivos propostos. Foram ainda publicados trĂȘs artigos cientĂ­ficos no contexto desta tese.For centuries, linear perspective projection has been the dominant way of accurately drawing the world as seen from the human eye. In particular, it has been a tool used by architects in rigorous formal drawing. However, this system is limited by the distortions that manifest when large fields of view are used, making the interpretation of the image more difficult and limiting its ability to express human vision in its full dynamic breadth. Alternative curvilinear perspective systems do not share this limitation and can serve as a complement to linear perspective projection, though they are not without their own limitations. The Extended Perspective System is an alternative system that blends linear and curvilinear perspective systems into a single continuum, responding to the limitations of the individual systems. In this capacity, it also aims to aid architects in their design process. In previous work, a computational implementation of the EPS system, the EPS Visualizer was started to demonstrate its properties and test its usefulness as a tool for architects. However, it was left incomplete, lacking most key perspective features and leaving the EPS' usefulness unevaluated. The project described in this dissertation had two main objectives. The first was to complete the EPS Visualizer, implementing the EPS system fully, improving its performance and user interface. The second was to perform two evaluations, the first to determine the usefulness of the EPS system as a tool in the architectural design process and the second to evaluate the usability of the visualizer's user interface. The EPS Visualizer was completed and the two evaluations were performed, fulfilling the objectives of the project. The evaluation of the usefulness of the EPS system indicated that there was interest on the part of architects and architecture students in the visualizer and a desire to see it integrated into design software. The evaluation of the user interface aided in its development and gave positive results overall

    Techniques de mise en scÚne pour le jeu vidéo et l'animation

    Get PDF
    Eurographics State of the Art Report (STAR).International audienceOver the last forty years, researchers in computer graphics have proposed a large variety of theoretical models and computer implementations of a virtual film director, capable of creating movies from minimal input such as a screenplay or storyboard. The underlying film directing techniques are also in high demand to assist and automate the generation of movies in computer games and animation. The goal of this survey is to characterize the spectrum of applications that require film directing, to present a historical and up-to-date summary of research in algorithmic film directing, and to identify promising avenues and hot topics for future research.Depuis quarante ans, les chercheurs en informatique graphique ont proposĂ© une grande variĂ©tĂ© de modĂšles thĂ©oriques et d'implĂ©mentations de rĂ©alisateurs virtuels, capables de crĂ©er des films automatiquement Ă  partir de scĂ©narios ou de storyboards. Les techniques de mise en scĂšne sous-jacentes peuvent Ă©galement ĂȘtre trĂšs utiles pour assister et automatiser la crĂ©ation de films dans le jeu vidĂ©o et l'animation. Le but de cet Ă©tat de l'art est de caractĂ©riser le spectre des applications qui peuvent bĂ©nĂ©ficier des techniques de mise en scĂšne, de donner un compte rendu historique de la recherche en mise en scĂšne algorithmique, et d'identifier les tendances et perspectives du domaine

    Skyler and Bliss

    Get PDF
    Hong Kong remains the backdrop to the science fiction movies of my youth. The city reminds me of my former training in the financial sector. It is a city in which I could have succeeded in finance, but as far as art goes it is a young city, and I am a young artist. A frustration emerges; much like the mould, the artist also had to develop new skills by killing off his former desires and manipulating technology. My new series entitled HONG KONG surface project shows a new direction in my artistic research in which my technique becomes ever simpler, reducing the traces of pixelation until objects appear almost as they were found and photographed. Skyler and Bliss presents tectonic plates based on satellite images of the Arctic. Working in a hot and humid Hong Kong where mushrooms grow ferociously, a city artificially refrigerated by climate control, this series provides a conceptual image of a imaginary typographic map for survival. (Laurent Segretier

    Text–to–Video: Image Semantics and NLP

    Get PDF
    When aiming at automatically translating an arbitrary text into a visual story, the main challenge consists in finding a semantically close visual representation whereby the displayed meaning should remain the same as in the given text. Besides, the appearance of an image itself largely influences how its meaningful information is transported towards an observer. This thesis now demonstrates that investigating in both, image semantics as well as the semantic relatedness between visual and textual sources enables us to tackle the challenging semantic gap and to find a semantically close translation from natural language to a corresponding visual representation. Within the last years, social networking became of high interest leading to an enormous and still increasing amount of online available data. Photo sharing sites like Flickr allow users to associate textual information with their uploaded imagery. Thus, this thesis exploits this huge knowledge source of user generated data providing initial links between images and words, and other meaningful data. In order to approach visual semantics, this work presents various methods to analyze the visual structure as well as the appearance of images in terms of meaningful similarities, aesthetic appeal, and emotional effect towards an observer. In detail, our GPU-based approach efficiently finds visual similarities between images in large datasets across visual domains and identifies various meanings for ambiguous words exploring similarity in online search results. Further, we investigate in the highly subjective aesthetic appeal of images and make use of deep learning to directly learn aesthetic rankings from a broad diversity of user reactions in social online behavior. To gain even deeper insights into the influence of visual appearance towards an observer, we explore how simple image processing is capable of actually changing the emotional perception and derive a simple but effective image filter. To identify meaningful connections between written text and visual representations, we employ methods from Natural Language Processing (NLP). Extensive textual processing allows us to create semantically relevant illustrations for simple text elements as well as complete storylines. More precisely, we present an approach that resolves dependencies in textual descriptions to arrange 3D models correctly. Further, we develop a method that finds semantically relevant illustrations to texts of different types based on a novel hierarchical querying algorithm. Finally, we present an optimization based framework that is capable of not only generating semantically relevant but also visually coherent picture stories in different styles.Bei der automatischen Umwandlung eines beliebigen Textes in eine visuelle Geschichte, besteht die grĂ¶ĂŸte Herausforderung darin eine semantisch passende visuelle Darstellung zu finden. Dabei sollte die Bedeutung der Darstellung dem vorgegebenen Text entsprechen. DarĂŒber hinaus hat die Erscheinung eines Bildes einen großen Einfluß darauf, wie seine bedeutungsvollen Inhalte auf einen Betrachter ĂŒbertragen werden. Diese Dissertation zeigt, dass die Erforschung sowohl der Bildsemantik als auch der semantischen Verbindung zwischen visuellen und textuellen Quellen es ermöglicht, die anspruchsvolle semantische LĂŒcke zu schließen und eine semantisch nahe Übersetzung von natĂŒrlicher Sprache in eine entsprechend sinngemĂ€ĂŸe visuelle Darstellung zu finden. Des Weiteren gewann die soziale Vernetzung in den letzten Jahren zunehmend an Bedeutung, was zu einer enormen und immer noch wachsenden Menge an online verfĂŒgbaren Daten gefĂŒhrt hat. Foto-Sharing-Websites wie Flickr ermöglichen es Benutzern, Textinformationen mit ihren hochgeladenen Bildern zu verknĂŒpfen. Die vorliegende Arbeit nutzt die enorme Wissensquelle von benutzergenerierten Daten welche erste Verbindungen zwischen Bildern und Wörtern sowie anderen aussagekrĂ€ftigen Daten zur VerfĂŒgung stellt. Zur Erforschung der visuellen Semantik stellt diese Arbeit unterschiedliche Methoden vor, um die visuelle Struktur sowie die Wirkung von Bildern in Bezug auf bedeutungsvolle Ähnlichkeiten, Ă€sthetische Erscheinung und emotionalem Einfluss auf einen Beobachter zu analysieren. Genauer gesagt, findet unser GPU-basierter Ansatz effizient visuelle Ähnlichkeiten zwischen Bildern in großen Datenmengen quer ĂŒber visuelle DomĂ€nen hinweg und identifiziert verschiedene Bedeutungen fĂŒr mehrdeutige Wörter durch die Erforschung von Ähnlichkeiten in Online-Suchergebnissen. Des Weiteren wird die höchst subjektive Ă€sthetische Anziehungskraft von Bildern untersucht und "deep learning" genutzt, um direkt Ă€sthetische Einordnungen aus einer breiten Vielfalt von Benutzerreaktionen im sozialen Online-Verhalten zu lernen. Um noch tiefere Erkenntnisse ĂŒber den Einfluss des visuellen Erscheinungsbildes auf einen Betrachter zu gewinnen, wird erforscht, wie alleinig einfache Bildverarbeitung in der Lage ist, tatsĂ€chlich die emotionale Wahrnehmung zu verĂ€ndern und ein einfacher aber wirkungsvoller Bildfilter davon abgeleitet werden kann. Um bedeutungserhaltende Verbindungen zwischen geschriebenem Text und visueller Darstellung zu ermitteln, werden Methoden des "Natural Language Processing (NLP)" verwendet, die der Verarbeitung natĂŒrlicher Sprache dienen. Der Einsatz umfangreicher Textverarbeitung ermöglicht es, semantisch relevante Illustrationen fĂŒr einfache Textteile sowie fĂŒr komplette HandlungsstrĂ€nge zu erzeugen. Im Detail wird ein Ansatz vorgestellt, der AbhĂ€ngigkeiten in Textbeschreibungen auflöst, um 3D-Modelle korrekt anzuordnen. Des Weiteren wird eine Methode entwickelt die, basierend auf einem neuen hierarchischen Such-Anfrage Algorithmus, semantisch relevante Illustrationen zu Texten verschiedener Art findet. Schließlich wird ein optimierungsbasiertes Framework vorgestellt, das nicht nur semantisch relevante, sondern auch visuell kohĂ€rente Bildgeschichten in verschiedenen Bildstilen erzeugen kann

    Digital 3D Technologies for Humanities Research and Education: An Overview

    Get PDF
    Digital 3D modelling and visualization technologies have been widely applied to support research in the humanities since the 1980s. Since technological backgrounds, project opportunities, and methodological considerations for application are widely discussed in the literature, one of the next tasks is to validate these techniques within a wider scientific community and establish them in the culture of academic disciplines. This article resulted from a postdoctoral thesis and is intended to provide a comprehensive overview on the use of digital 3D technologies in the humanities with regards to (1) scenarios, user communities, and epistemic challenges; (2) technologies, UX design, and workflows; and (3) framework conditions as legislation, infrastructures, and teaching programs. Although the results are of relevance for 3D modelling in all humanities disciplines, the focus of our studies is on modelling of past architectural and cultural landscape objects via interpretative 3D reconstruction methods

    CGAMES'2009

    Get PDF

    Eight Biennial Report : April 2005 – March 2007

    No full text
    • 

    corecore