    Experiments on distant-talking speaker verification in TV scenario

    In this work text-independent speaker verification (SV) in a distant-talking noisy scenario is addressed: users can interact with a TVsystem able to understand vocal commands and verify simultaneously the identity of the speaker. The main issues with SV under this scenario are related to reverberation, interfering sound sources (TV output) and usually very short utterances; as a consequence, an increasing confusability among speakers models can be observed. To partially cope with this, we propose a system that exploits the processing of signals acquired by a microphone array and a phonetic class segmentation in unsupervised modality. Comparing the proposed system with a GMM-UBM based system we demonstrate the effectiveness of the approach on data acquired with a real prototype

    Identificação de utilizadores seniores em televisão interativa (iTV) : uma matriz de decisão tecnológica

    Doutoramento em Informação e Comunicação em Plataformas DigitaisDesde que surgiu há mais de 50 anos, a televisão sofreu muitas transformações, tanto ao nível tecnológico (por exemplo com a passagem da emissão a preto/branco para cor, o som analógico para digital, a difusão digital) como a nível da sua influência nas sociedades. Entre outros fatores de ordem tecnológica, a consolidação da Internet com o seu elevado nível de personalização, da experiência de utilização, e a sua enorme quantidade de conteúdos disponíveis, catapultou a televisão no sentido de esta se tornar mais interativa. Assim, o telespectador passou a poder usufruir de uma experiência televisiva que pode, por um lado, ser mais participativa, sendo-lhe possível, por exemplo, alvitrar sobre a qualidade de um programa enquanto assiste à sua exibição, e, por outro, ser mais personalizada, possibilitando-lhe, por exemplo, receber conteúdos automaticamente adequados ao seu perfil e contexto. No entanto, esta experiência mais participativa e personalizável carece de uma identificação, idealmente automática e não intrusiva, de quem pode beneficiar da mesma – o telespectador. Contudo, e apesar de significativos avanços na área da televisão interativa, tanto ao nível da infraestrutura de suporte como ao nível dos serviços disponibilizados, a identificação dos utilizadores é, ainda, uma área de estudo com muitos aspetos por compreender. Os seniores, em particular, são grandes consumidores de televisão e representam uma fatia muito considerável das pessoas que podem beneficiar das potencialidades disponibilizadas pela interatividade presente em muitos serviços atuais. Um número crescente destes serviços são desenhados com o objetivo de promoverem um envelhecimento ativo e um concreto apoio à vida, pelo que os seniores podem beneficiar, em vários aspetos do seu quotidiano, se os utilizarem. Nesta faixa etária, a identificação de utilizadores tem, como elemento potenciador da experiência de utilização, um papel especialmente importante ao nível de um aproveitamento personalizado e dirigido destes serviços. No entanto, atendendo às diferentes combinações de características físicas, sensoriais, cognitivas e, mesmo, de literacia digital que tipificam os seniores, perspetivou-se existir uma dependência do perfil do utilizador na seleção do método de identificação mais adequado, os quais podem ser baseados, por exemplo, num leitor de impressões digitais, instalado no telecomando; na leitura de uma wearable tag ou de um cartão RFiD; no reconhecimento da face e, eventualmente, na voz do utilizador. Assim, a inerente investigação desenrolou-se em várias fases, no sentido de permitir alicerçar a construção de uma matriz de decisão tecnológica que, em função do perfil de utilizador, selecione o sistema de identificação mais adequado. O procedimento metodológico inerente à construção desta matriz de decisão, passou por um longo processo envolvendo utilizadores reais, que se iniciou com a realização de entrevistas exploratórias com o objetivo de permitir conhecer melhor os seniores e a forma como estes encaram a tecnologia e, mais concretamente, a televisão interativa. Foi depois implementado um protótipo de alta-fidelidade, completamente funcional, para a realização de testes com o objetivo de perceber qual a preferência relativamente a um subconjunto de tecnologias de identificação. Estes testes, uma vez que não permitiram testar todas as tecnologias em estudo, revelaram-se inconclusivos, porém permitiram reforçar a necessidade de identificar e caracterizar os referidos aspetos do perfil do utilizador que podem interferir na sua preferência relativamente ao sistema de identificação. As características identificadas constituíram-se como os parâmetros de entrada da matriz, sendo que para preencher as respetivas células realizaramse testes de aceitação, com um conjunto de seniores, tendo por base um protótipo, wizard of oz, especificamente implementado para permitir experienciar todas as tecnologias em estudo. Estes testes foram precedidos pela avaliação das capacidades funcionais dos participantes, nos diversos parâmetros definidos. Este texto relata, assim, todo o processo de investigação que foi conduzido, terminando com uma descrição de exemplos de utilização da matriz de decisão implementada e com a identificação de potenciais caminhos de desenvolvimento deste trabalho.Television underwent by many socio-technological changes since its beginning in the fifties. Beyond some inherent technological factors like the transition from black and white to color and the digitalization of both audio and video components, the consolidation of the Internet with its high level of customization of user experience and massive amount of available content, helped television to be driven towards an interactive dimension. Thus, the viewer happened to be able to enjoy from a viewing experience that can, first, be more participatory as he can, for example, vote in TV shows or express his opinion about the quality of a TV program and, second, be more personalized allowing him, for instance, receiving TV contents appropriated to his profile and context of use. However, this more participatory and customizable experience lacks of an automatic identification process of the person/s that is/are watching TV. Despite significant advances in the area of interactive television (iTV), the automatic identification of viewers, especially if a non-intrusive way is at stake, is still a research area with many unsolved topics. Elder people, in particular, are major consumers of television and represent a very sizable chunk of viewers that can benefit from the potential offered by this interactivity in many types of services. A growing number of these services are designed with the aim to promote active aging and life support, thus seniors can benefit in various aspects of their daily lives, if they use them. In this age group, the automatic identification of viewers has a special role in a personalized and targeted usage of these services, acting as an enhancer of the user experience. However, due to a broad range of physical, sensorial, cognitive and digital literacy characteristics inherent to the elderly, it was envisaged that the definition of the most suitable viewer identification technology would be dependent of the actual user/viewer profile. Actually, the user identification method can be based in several technology options, e.g. a fingerprint reader placed in the remote, a wearable tag, an RFID card, a facial or a voice recognition system, making it necessary deciding on the best approach for each possible viewer profile. The research was carried out in order to leverage the design of a decision matrix that, using the characteristics of the senior's profile, computes the most suitable viewer identification method. The methodology used to build the matrix was based on multiple sets of interviews and evaluation sessions with elderly viewers in a longitudinal prototyping process. We started with a set of exploratory interviews that allowed a better understanding how seniors see iTV technology. After, it was implemented a fully functional prototype (that allowed to test a particular set of identification technologies), that was evaluated by seniors participants, to find a clear trend about the preference of identification technologies. Despite these tests were a step forward (since they allow to understand that viewer’s characteristics can influence their preferences about the identification technology), they were not totally conclusive mainly due to the fact that they only had allowed testing a particular set of technologies among all that are referenced in this research. The aforementioned characteristics became the inputs of the decision matrix, leading to a new set of tests to start filling in its cells. These tests were based on a wizard of oz prototype that allowed participants to experiment all identification technologies referred in this research. All these tests with seniors were made at their homes preceded of the evaluation of their functional characteristics (the ones identified in previous test and that can influence viewer's preferences). The document ends reporting the main conclusions and examples of the matrix usage and with some points to next steps of this work