A thesis submitted in partial fulfillment of the requirements for the degree of Doctor in Information Management, specialization in Statistics and EconometricsProcessing driving data and investigating driving behavior has been receiving an
increasing interest in the last decades, with applications ranging from car insurance
pricing to policy-making. A popular way of analyzing driving behavior is to move
the focus to the maneuvers as they give useful information about the driver who is
performing them.
Previous research on maneuver detection can be divided into two strategies, namely,
1) using fixed thresholds in inertial measurements to define the start and end of specific
maneuvers or 2) using features extracted from rolling windows of sensor data
in a supervised learning model to detect maneuvers. While the first strategy is not
adaptable and requires fine-tuning, the second needs a dataset with labels (which is
time-consuming) and cannot identify maneuvers with different lengths in time.
To tackle these shortcomings, we investigate a new way of identifying maneuvers
from vehicle telematics data, through motif detection in time-series. Using a publicly
available naturalistic driving dataset (the UAH-DriveSet), we conclude that motif
detection algorithms are not only capable of extracting simple maneuvers such as accelerations,
brakes, and turns, but also more complex maneuvers, such as lane changes
and overtaking maneuvers, thus validating motif discovery as a worthwhile line for
future research in driving behavior.
We also propose TripMD, a system that extracts the most relevant driving patterns
from sensor recordings (such as acceleration) and provides a visualization that allows
for an easy investigation. We test TripMD in the same UAH-DriveSet dataset and show
that (1) our system can extract a rich number of driving patterns from a single driver
that are meaningful to understand driving behaviors and (2) our system can be used
to identify the driving behavior of an unknown driver from a set of drivers whose
behavior we know.Nas últimas décadas, o processamento e análise de dados de condução tem recebido
um interesse cada vez maior, com aplicações que abrangem a área de seguros de
automóveis até a atea de regulação. Tipicamente, a análise de condução compreende a
extração e estudo de manobras uma vez que estas contêm informação relevante sobre
a performance do condutor.
A investigação prévia sobre este tema pode ser dividida em dois tipos de estratégias,
a saber, 1) o uso de valores fixos de aceleração para definir o início e fim de cada
manobra ou 2) a utilização de modelos de aprendizagem supervisionada em janelas
temporais. Enquanto o primeiro tipo de estratégias é inflexível e requer afinação dos
parâmetros, o segundo precisa de dados de condução anotados (o que é moroso) e não
é capaz de identificar manobras de diferentes durações.
De forma a mitigar estas lacunas, neste trabalho, aplicamos métodos desenvolvidos
na área de investigação de séries temporais de forma a resolver o problema de deteção
de manobras. Em particular, exploramos área de deteção de motifs em séries temporais
e testamos se estes métodos genéricos são bem-sucedidos na deteção de manobras.
Também propomos o TripMD, um sistema que extrai os padrões de condução mais
relevantes de um conjuntos de viagens e fornece uma simples visualização. TripMD é
testado num conjunto de dados públicos (o UAH-DriveSet), do qual concluímos que
(1) o nosso sistema é capaz de extrair padrões de condução/manobras de um único
condutor que estão relacionados com o perfil de condução do condutor em questão e (2)
o nosso sistema pode ser usado para identificar o perfil de condução de um condutor
desconhecido de um conjunto de condutores cujo comportamento nos é conhecido