    Driver risk classification in auto insurance: Using deep neural networks and in-vehicle CAN bus data

    Applied project submitted to the Department of Computer Science and Information Systems, Ashesi University, in partial fulfillment of Bachelor of Science degree in Management Information Systems, May 2020Among the numerous ways auto insurance companies can contribute to safety on the roads whilst creating more value for themselves and customers is by effectively analyzing individual driver risk level. Every driver’s driving style is their fingerprint and when insurance companies can anticipate their style and the risk associated with it, they can create safer portfolios, reward good driving with lower premiums, customize customer offerings and penalize bad driving with higher premiums. A good driver risk assessment lies in identifying and analyzing behavioral patterns in driving. The challenge however with prevalent risk assessment methods in motor insurance are that they rely on non-precise data (age, occupation, address) and their assessment is merely descriptive, leaving little to no detail about the individual nature of the risk a driver might pose. In this project I design a web interface for users and use In-vehicle sensor data that identify driver behaviour patterns and a deep neural network with continuous learning capabilities to analyse and predict the driver’s risk based on the data from their vehicle.Ashesi Universit

    Classification of driver behavior using machine learning techniques and onboard monitoring with OBD ll in real road conditions

    La movilidad vial y el buen comportamiento del conductor en la carretera es de vital importancia para mantener una movilidad sin accidentes de tránsito y conductores prudentes en las vías. Los sistemas inteligentes de transporte (SIT) brindan la optimización de la estructura vial incrementando el control, la eficiencia, efectividad, la educación de los conductores al momento de la conducción, con el objetivo de gestionar el crecimiento demanda de movilidad y el comportamiento de los conductores en las vías. Un aporte crucial para los sistemas inteligentes de transporte son las campañas de monitoreo en condiciones reales de carretera que permitan la recolección de datos y su vez identificar el tipo de comportamiento del conductor. En el proyecto desarrollado se implementó una campaña de monitoreo abordo con un dispositivo ODB ll instalado en una muestra de 5 vehículos, que por medio de la conexión a bluetooth y una App instalada en el Smartphone se realiza la captura de los datos pertinentes para identificar el comportamiento de conducción. Para la identificación de los comportamientos de conducción se desarrolló un modelo de Machine Learning por medio de la técnica K-Means donde se clasificaron a los conductores en 3 grandes grupos (clúster): conductor normal, agresivo y peligroso. Con la identificación de los comportamientos de conducción se logra evidenciar que el conductor peligroso al ir a velocidad altas, tiene un mayor consumo de combustible y el riesgo de ocasionar accidenten en la malla vial.INTRODUCCIÓN...............................................................................................13 1.MARCO TEÓRICO O ESTADO DEL ARTE.................................................16 1.1 MARCO TEÓRICO......................................................................................16 1.1.1 Comportamiento de conducción..............................................................16 1.1.2 Estilos de conducción...............................................................................22 1.2 ESTADO DEL ARTE ...................................................................................25 1.2.1 Análisis Bibliométrico ...............................................................................25 1.2.2 Tipos de comportamiento del conductor.................................................29 1.2.3 Instrumentación para la recolección de datos ........................................30 1.2.4 Técnicas de clasificación para el comportamiento del conductor .........31 2.METODOLOGÍA.............................................................................................33 3.MONITOREO DE VARIABLES DE OPERACIÓN Y ACTUALIZACIÓN DE LA BASE DE DATOS...............................................................................34 3.1 CAMPAÑA DE MONITOREO.....................................................................34 3.1.1 Ruta Seleccionada ...................................................................................35 3.1.2 Datos técnicos de los vehículos monitoreados.......................................36 3.1.3 Datos sociodemográficos de los conductores ........................................37 3.1.4 Variables monitoreadas ...........................................................................38 3.1.5 Sistema de monitoreo ejecutado.............................................................39 3.1.6 Sistema de captura de los datos .............................................................40 3.1.7 Canal de Conectividad para él envió de la información.........................42 3.2. SISTEMA CAPTURAR DE DATOS...........................................................44 3.2.1 Almacenamiento de datos .......................................................................48 3.2.2 Captura de los datos ................................................................................50 3.2.3 Eliminación de Datos Atípicos .................................................................50 3.2.4 Registro de datos en la nube...................................................................54 3.3 BASE DE DATOS PROYECTO ACTUAL 2023 ........................................54 3.4 BASE DE DATOS CONCATENADA..........................................................56 4.TÉCNICA DE MACHINE LEARNING PARA LA CLASIFICACIÓN DE LOS COMPORTAMIENTOS DE CONDUCCIÓN ........................................58 7 4.1 METODOLOGÍA APLICADA PARA LA CLASIFICACIÓN DE LOS COMPORTAMIENTOS DE CONDUCCIÓN. ...................................................58 4.2 ELECCIÓN Y CONFIGURACIÓN DEL ENTORNO DE DESARROLLO .62 4.2.1 Entorno de desarrollo integrado IDE.......................................................62 4.2.2 Listado de IDE en el lenguaje de programación Python........................63 4.2.3 Cuadro comparativo de los IDE...............................................................64 4.3 CONSTRUCCIÓN DEL MODELO DE MACHINE LEARNING.................65 4.3.1 Paso a paso para la construcción del modelo de Machine Learning:...67 4.4 ANÁLISIS DE LOS DATOS ........................................................................70 4.5 MODELO DE MACHINE LEARNING.........................................................76 4.6 PREDICCIONES SEGÚN EL MODELO DE MACHINE LEARNING .......89 4.6.1 Pasos para realizar la predicción con el modelo de Machine Learning 90 4.7 RESULTADOS OBTENIDOS DE LAS PREDICCIONES DE LOS CONDUCTORES...............................................................................................98 4.8 ANÁLISIS DE LOS DIAGRAMAS SAFD..................................................102 5.VALIDACIÓN DE RESULTADOS POR MEDIO DE GUI (INTERFAZ GRÁFICA DE USUARIO) ............................................................................104 5.1 VALIDACIÓN DEL ALGORITMO .............................................................104 5.2 INTERFAZ GRÁFICA................................................................................109 5.2.1 Librerías implementadas en Python para la creación de la interfaz gráfica…...........................................................................................................110 5.2.2 Proceso de construcción de la GUI.......................................................112 6.CONCLUSIONES.........................................................................................118 7.RECOMENDACIONES Y TRABAJOS FUTUROS ....................................119 REFERENCIAS Y BIBLIOGRAFIA.................................................................120 LISTA DE ANEXOS.........................................................................................126 ANEXOS..........................................................................................................127MaestríaRoad mobility and good driver behavior on the road is of vital importance to maintain mobility without traffic accidents and prudent drivers on the roads. Intelligent transportation systems (ITS) provide optimization of the road structure by increasing control, efficiency, effectiveness, and driver education at the time of driving, with the aim of managing the growing demand for mobility and the behavior of drivers. drivers on the roads. A crucial contribution to intelligent transportation systems are monitoring campaigns in real road conditions that allow data collection and in turn identify the type of driver behavior. In the developed project, an on-board monitoring campaign was implemented with an ODB II device installed in a sample of 5 vehicles, which through a Bluetooth connection and an App installed on the Smartphone captures the relevant data to identify the driving behavior. To identify driving behaviors, a Machine Learning model was developed using the K-Means technique where drivers were classified into 3 large groups (cluster): normal, aggressive and dangerous driver. With the identification of driving behaviors, it is possible to show that the dangerous driver, when traveling at high speed, has greater fuel consumption and the risk of causing accidents on the road network.