thesis

T-profiles: a method for inferring socio-demographic profiles from trajectories

Abstract

Dissertação (mestrado) - Universidade Federal de Santa Catarina, Centro Tecnológico, Programa de Pós-Graduação em Ciência da Computação, Florianópolis, 2015.Ter o conhecimento sobre o perfil dos habitantes de uma cidade ou país tem grande valor para administrações públicas e empresas. Conhecer o perfil de uma população pode auxiliar o trabalho de planejadores urbanos, administradores de transporte público, serviços governamentais ou empresas de diferentes maneiras como, por exemplo, decidir onde é interessante instalar uma nova loja ou personalizar anúncios para um determinado público. A forma mais comum utilizada na análise de informações demográficas de uma população é através da segmentação da mesma em perfis sócio-demográficos, como idade, ocupação, estado civil ou renda mensal. Atualmente, para que essas informações sejam descobertas e analisadas, os dados são coletados através de entrevistas realizadas de casa em casa, periodicamente, em diversos países. No entanto, este tipo de abordagem possui algumas desvantagens: 1) os dados não são atualizados e precisos, pois são coletados em um intervalo de 5 - 10 anos; 2) a coleta é muito custosa e cobre apenas uma parcela da população por um curto período de tempo, apesar de ser estatisticamente significante; 3) não caracteriza as atividades completas do indivíduo, apenas o período de 1 dia de atividades, fornecidas através da entrevista realizada. Atualmente, é possível inferir muito conhecimento a partir do comportamento das pessoas analisando seu movimento do dia-a-dia, uma vez que grandes quantidades de dados de movimento estão disponíveis como: dados de telefone celular, redes sociais, dados de GPS, etc. Nesta dissertação, é proposto um método para a extração de perfis sócio-demográficos a partir de trajetórias de objetos móveis, e apresenta as seguintes contribuições: (i) proposta de um modelo de perfil geral para representar o perfil sócio-demográfico de pessoas, como trabalhador, estudante, desempregado, etc; (ii) proposta de um modelo para representar o histórico de movimentação diária dos indivíduos; (iii) proposta de funções de similaridade para fazer o casamento entre histórico e modelo de perfil e; (iv) um algoritmo chamado T-Profiles que realiza a comparação entre modelo de perfil e modelo de histórico, com o intuito de inferir o perfil sócio-demográfico de um objeto móvel a partir de sua trajetória. O algoritmo T-Profiles é validado utilizando dados reais de trajetórias, obtendo em torno de 90% de precisão.Abstract : The knowledge about people living in a city or country has great value for the public administration as well as for enterprises. To know the population profile may help the job of smart city planners, public transportation administrators, government services or companies in many different ways, such as to decide if and where to install a new store or to personalize an advertisement, for example. The usual approach for population demographic analysis is to segment the population in socio-demographic profiles, such as age, occupation, marital status or income. Most attempts to discover and measure the population profiles is through human surveys, and the most well-known example is the socio-demographic census with diary activities, done periodically in many countries. However, the main drawbacks of the census data is that they: 1) are not up to date since they are usually collected every 5 - 10 years; 2) are expensive to collect, and cover only a small - although statistically significant - part of the population for a short period of time; 3) do not collect the actual movement of the individuals, but only the activity performed during one day and which is mentioned by the user during the interview. We believe that nowadays we can infer much knowledge and the real behavior about people from their every day movement. In this thesis we propose a method to extract socio-demographic profiles from trajectories of moving objects, and make the following contributions: (i) we propose a general profile model to represent socio-demographic profiles of people such as worker, student, unemployed, etc; (ii) we propose a moving object history model to represent the daily movement of the object, and (iii) we propose similarity functions and an algorithm called T-Profiles for matching the profile model and the history model in order to infer the socio-demographic profile of a moving object from his/her trajectories. We validate T-Profiles with real trajectory data obtaining about 90% of precision

    Similar works