Instituto Politécnico do Porto. Instituto Superior de Engenharia do Porto
Abstract
Com a crescente geração, armazenamento e disseminação da informação nos últimos anos, o
anterior problema de falta de informação transformou-se num problema de extracção do
conhecimento útil a partir da informação disponível.
As representações visuais da informação abstracta têm sido utilizadas para auxiliar a interpretação
os dados e para revelar padrões de outra forma escondidos. A visualização de informação procura
aumentar a cognição humana aproveitando as capacidades visuais humanas, de forma a tornar
perceptível a informação abstracta, fornecendo os meios necessários para que um humano possa
absorver quantidades crescentes de informação, com as suas capacidades de percepção.
O objectivo das técnicas de agrupamento de dados consiste na divisão de um conjunto de dados em
vários grupos, em que dados semelhantes são colocados no mesmo grupo e dados dissemelhantes
em grupos diferentes. Mais especificamente, o agrupamento de dados com restrições tem o intuito
de incorporar conhecimento a priori no processo de agrupamento de dados, com o objectivo de
aumentar a qualidade do agrupamento de dados e, simultaneamente, encontrar soluções apropriadas
a tarefas e interesses específicos.
Nesta dissertação é estudado a abordagem de Agrupamento de Dados Visual Interactivo que permite
ao utilizador, através da interacção com uma representação visual da informação, incorporar o seu
conhecimento prévio acerca do domínio de dados, de forma a influenciar o agrupamento resultante
para satisfazer os seus objectivos. Esta abordagem combina e estende técnicas de visualização
interactiva de informação, desenho de grafos de forças direccionadas e agrupamento de dados com
restrições. Com o propósito de avaliar o desempenho de diferentes estratégias de interacção com o
utilizador, são efectuados estudos comparativos utilizando conjuntos de dados sintéticos e reais.With the rising generation, storage and dissemination of information in recent years, the previous
problem of lack of information has become a problem of extracting useful knowledge from the
information available.
The visual representations of abstract information have been used to assist in interpreting the data
and reveal otherwise hidden patterns. Information visualization seeks to enhance human cognition
by leveraging human visual capabilities to make sense of abstract information, providing means by
which humans with constant perceptual abilities can absorb increasing amounts of information.
Data clustering techniques purpose is to partition a data set into several clusters, in which similar
data is placed in the same cluster and dissimilar data in different clusters. More specifically,
constrained clustering methods are intended to incorporate a priori knowledge in the clustering
process, in order to improve data clustering quality and, simultaneously, find appropriate solutions
to specific tasks or interests .
This thesis studied the interactive visual clustering approach that allows the user, through
interaction with a visual representation of information, to incorporate prior knowledge about the
data domain in order to influence the resulting grouping to meet its objectives. This approach
combines and extends interactive information visualization, force directed graph layout and
constrained clustering techniques. With the purpose of evaluating the performance of different user
interaction strategies, comparative studies using sets of synthetic and real data are performed