2 research outputs found
Experiments on distant-talking speaker verification in TV scenario
In this work text-independent speaker verification (SV) in a distant-talking noisy scenario is addressed: users can interact with a TVsystem able to understand vocal commands and verify simultaneously
the identity of the speaker. The main issues with SV under this scenario are related to reverberation, interfering sound sources (TV
output) and usually very short utterances; as a consequence, an increasing confusability among speakers models can be observed. To
partially cope with this, we propose a system that exploits the processing of signals acquired by a microphone array and a phonetic class segmentation in unsupervised modality. Comparing the proposed system with a GMM-UBM based system we demonstrate the
effectiveness of the approach on data acquired with a real prototype
Identificação de utilizadores seniores em televisão interativa (iTV) : uma matriz de decisão tecnológica
Doutoramento em Informação e Comunicação em Plataformas DigitaisDesde que surgiu há mais de 50 anos, a televisão sofreu muitas
transformações, tanto ao nível tecnológico (por exemplo com a passagem da
emissão a preto/branco para cor, o som analógico para digital, a difusão
digital) como a nível da sua influência nas sociedades. Entre outros fatores de
ordem tecnológica, a consolidação da Internet com o seu elevado nível de
personalização, da experiência de utilização, e a sua enorme quantidade de
conteúdos disponíveis, catapultou a televisão no sentido de esta se tornar mais
interativa. Assim, o telespectador passou a poder usufruir de uma experiência
televisiva que pode, por um lado, ser mais participativa, sendo-lhe possível,
por exemplo, alvitrar sobre a qualidade de um programa enquanto assiste à
sua exibição, e, por outro, ser mais personalizada, possibilitando-lhe, por
exemplo, receber conteúdos automaticamente adequados ao seu perfil e
contexto. No entanto, esta experiência mais participativa e personalizável
carece de uma identificação, idealmente automática e não intrusiva, de quem
pode beneficiar da mesma – o telespectador. Contudo, e apesar de
significativos avanços na área da televisão interativa, tanto ao nível da
infraestrutura de suporte como ao nível dos serviços disponibilizados, a
identificação dos utilizadores é, ainda, uma área de estudo com muitos
aspetos por compreender.
Os seniores, em particular, são grandes consumidores de televisão e
representam uma fatia muito considerável das pessoas que podem beneficiar
das potencialidades disponibilizadas pela interatividade presente em muitos
serviços atuais. Um número crescente destes serviços são desenhados com o
objetivo de promoverem um envelhecimento ativo e um concreto apoio à vida,
pelo que os seniores podem beneficiar, em vários aspetos do seu quotidiano,
se os utilizarem. Nesta faixa etária, a identificação de utilizadores tem, como
elemento potenciador da experiência de utilização, um papel especialmente
importante ao nível de um aproveitamento personalizado e dirigido destes
serviços. No entanto, atendendo às diferentes combinações de características
físicas, sensoriais, cognitivas e, mesmo, de literacia digital que tipificam os
seniores, perspetivou-se existir uma dependência do perfil do utilizador na
seleção do método de identificação mais adequado, os quais podem ser
baseados, por exemplo, num leitor de impressões digitais, instalado no
telecomando; na leitura de uma wearable tag ou de um cartão RFiD; no
reconhecimento da face e, eventualmente, na voz do utilizador.
Assim, a inerente investigação desenrolou-se em várias fases, no sentido de
permitir alicerçar a construção de uma matriz de decisão tecnológica que, em
função do perfil de utilizador, selecione o sistema de identificação mais
adequado. O procedimento metodológico inerente à construção desta matriz de decisão,
passou por um longo processo envolvendo utilizadores reais, que se iniciou
com a realização de entrevistas exploratórias com o objetivo de permitir
conhecer melhor os seniores e a forma como estes encaram a tecnologia e,
mais concretamente, a televisão interativa.
Foi depois implementado um protótipo de alta-fidelidade, completamente
funcional, para a realização de testes com o objetivo de perceber qual a
preferência relativamente a um subconjunto de tecnologias de identificação.
Estes testes, uma vez que não permitiram testar todas as tecnologias em
estudo, revelaram-se inconclusivos, porém permitiram reforçar a necessidade
de identificar e caracterizar os referidos aspetos do perfil do utilizador que
podem interferir na sua preferência relativamente ao sistema de identificação.
As características identificadas constituíram-se como os parâmetros de
entrada da matriz, sendo que para preencher as respetivas células realizaramse
testes de aceitação, com um conjunto de seniores, tendo por base um
protótipo, wizard of oz, especificamente implementado para permitir
experienciar todas as tecnologias em estudo. Estes testes foram precedidos
pela avaliação das capacidades funcionais dos participantes, nos diversos
parâmetros definidos.
Este texto relata, assim, todo o processo de investigação que foi conduzido,
terminando com uma descrição de exemplos de utilização da matriz de
decisão implementada e com a identificação de potenciais caminhos de
desenvolvimento deste trabalho.Television underwent by many socio-technological changes since its beginning
in the fifties. Beyond some inherent technological factors like the transition from
black and white to color and the digitalization of both audio and video
components, the consolidation of the Internet with its high level of
customization of user experience and massive amount of available content,
helped television to be driven towards an interactive dimension.
Thus, the viewer happened to be able to enjoy from a viewing experience that
can, first, be more participatory as he can, for example, vote in TV shows or
express his opinion about the quality of a TV program and, second, be more
personalized allowing him, for instance, receiving TV contents appropriated to
his profile and context of use.
However, this more participatory and customizable experience lacks of an
automatic identification process of the person/s that is/are watching TV.
Despite significant advances in the area of interactive television (iTV), the
automatic identification of viewers, especially if a non-intrusive way is at stake,
is still a research area with many unsolved topics.
Elder people, in particular, are major consumers of television and represent a
very sizable chunk of viewers that can benefit from the potential offered by this
interactivity in many types of services. A growing number of these services are
designed with the aim to promote active aging and life support, thus seniors
can benefit in various aspects of their daily lives, if they use them.
In this age group, the automatic identification of viewers has a special role in a
personalized and targeted usage of these services, acting as an enhancer of
the user experience. However, due to a broad range of physical, sensorial,
cognitive and digital literacy characteristics inherent to the elderly, it was
envisaged that the definition of the most suitable viewer identification
technology would be dependent of the actual user/viewer profile. Actually, the
user identification method can be based in several technology options, e.g. a
fingerprint reader placed in the remote, a wearable tag, an RFID card, a facial
or a voice recognition system, making it necessary deciding on the best
approach for each possible viewer profile.
The research was carried out in order to leverage the design of a decision
matrix that, using the characteristics of the senior's profile, computes the most
suitable viewer identification method.
The methodology used to build the matrix was based on multiple sets of
interviews and evaluation sessions with elderly viewers in a longitudinal
prototyping process. We started with a set of exploratory interviews that
allowed a better understanding how seniors see iTV technology. After, it was
implemented a fully functional prototype (that allowed to test a particular set of
identification technologies), that was evaluated by seniors participants, to find a
clear trend about the preference of identification technologies. Despite these tests were a step forward (since they allow to understand that
viewer’s characteristics can influence their preferences about the identification
technology), they were not totally conclusive mainly due to the fact that they
only had allowed testing a particular set of technologies among all that are
referenced in this research.
The aforementioned characteristics became the inputs of the decision matrix,
leading to a new set of tests to start filling in its cells. These tests were based
on a wizard of oz prototype that allowed participants to experiment all
identification technologies referred in this research. All these tests with seniors
were made at their homes preceded of the evaluation of their functional
characteristics (the ones identified in previous test and that can influence
viewer's preferences).
The document ends reporting the main conclusions and examples of the matrix
usage and with some points to next steps of this work