1 research outputs found
Study of the magnification effect on self-organizing maps
Self-Organizing Maps (SOM), are a type of neuronal network (Kohonen, 1982b) that
has been used mainly in data clustering problems, using unsupervised learning. Among
the multiple areas of application, SOM has been used in various problems of direct
interest to the Navy (V. J. Lobo, 2009), including route planning and the location of
critical infrastructures. The SOM has also been used to sample large databases. In this
sort of application, they have a behaviour called the magnification effect (Bauer & Der,
1996), which causes areas of the attribute space of data with less density to be overrepresented or magnified.
This dissertation uses an experimental approach to mitigate the lack of theoretical
explanation for this effect except for one-dimensional and quite simple cases. From
experimental evidence obtained for carefully designed problems we infer a relationship
between input data densities and output neuron densities that can be applied universally,
or at least in a broad set of situations. A large number of experiments were conducted
using one-dimensional to one-dimensional mappings followed by 2D to 2D, 3D to 1, 2
and 3D. We derived an empirical relationship whereby the density in the output space
is equal to a constant times the density of the input space raised to the power
of (alpha) which although depending on a number of factors can be approximated by
the root index n of 2/3 where n is the input space dimension.
The correlation that we found in our experiments, for both the well-known 1-
dimensional case and for more general 2 to 3-dimensional cases is a useful guide to
predict the magnification effect in practical situations.Therefore, in chapter 4 we
produce a populational cartogram of Angola and we prove that our relation can be used
to correct the magnification effect on 2-dimensional cases.Os mapas auto-organizados ou SOM (Self Organizing Maps), são um tipo de rede
neuronal (Kohonen, 1982) que tem sido utilizada sobretudo em problemas agrupamento
de dados (clustering), usando aprendizagem não supervisionada. Entre as múltiplas
áreas de aplicação, os SOM têm sido usados em vários problemas com interesse direto
para a Marinha (Lobo, 2009), incluindo o planeamento de rotas e a localização de
infraestruturas críticas. Os SOM também têm sido usados para fazer amostragem de
grandes bases de dados, e nesse tipo de aplicações têm um comportamento, denominado
efeito de magnificação (Bauer & R. Der, 1996), que faz com que zonas do espaço de
atributos dos dados com menor densidade sejam sobre representadas, ou seja
magnificadas.
Esta dissertação traz uma abordagem experimental para mitigar a falta de explicação
teórica para este efeito, com exceção de casos unidimensionais e bastante simples. A
partir de provas experimentais obtidas para problemas cuidadosamente concebidos,
inferimos uma relação entre densidades de dados de entrada e densidades de neuronios
à saída que podem ser aplicadas universalmente, ou pelo menos num conjunto alargado
de situações. Foram realizadas um grande numero de experiências usando mapeamentos
unidimensionais para mapeamentos unidimensionais seguidos por 2D para 2D, 3D para
1, 2 e 3D. Derivamos uma relação empírica em que a densidade no espaço de saída
é igual a uma constante vezes a densidade do espaço de entrada elevada a (alpha)
que, embora dependendo de uma série de fatores, pode ser aproximado pela raiz de
índice n de 2/3 onde n é a dimensão do espaço de entrada.
A correlação que encontramos nas nossas experiências, tanto para o caso
unidimensional bem como para casos mais gerais de 2 a 3 dimensões é um guia útil para
prever o efeito de magnificação em situações práticas. No capítulo 4 produzimos um
cartograma populacional de Angola e provamos que a nossa relação pode ser usada para
corrigir o efeito de magnificação em casos bidimensionais