Mellora de métodos computacionais semiempíricos para a predición de reactividade química mediante técnicas de “machine learning”

Abstract

Traballo Fin de Grao en Química. Curso 2020-2021O machine learning e a intelixencia artificial estanse convertindo en técnicas cada vez máis presentes na investigación en química computacional. A medida que temos acceso a unha maior cantidade datos de química cuántica, aumentan as posibilidades de uso de algoritmos intelixentes para a exploración do espazo químico. Por outra parte, aínda non dispoñemos de métodos eficientes para a predición de propiedades de reacción cuantitativas. Entre estas propiedades atópase a enerxía de activación, cuxa predición de forma precisa proporcionaría un método para o descubrimento de novos mecanismos de reacción e forneceríanos control sobre a cinética das reaccións. O presente traballo intenta buscar un algoritmo baseado en machine learning para a predición de enerxías de activación. O noso modelo depende dun cálculo a nivel semiempírico (PM7) e proporciona unha predición a nivel DFT mediante machine learning. Con este procedemento, conseguimos precisión química cun custo computacional reducido. Ademais de obter un rendemento equiparable ao estado da arte, esta alternativa contribúe con descritores personalizados, que poden ser incorporados en novos procedementos de minaría de datos na química. Por último, tamén proporciona unha interpretación do modelo dende a perspectiva da intuición química.El machine learning y la inteligencia artificial se están convirtiendo en técnicas cada vez más presentes en la investigación en química computacional. A medida que tenemos acceso a una mayor cantidad de datos de química cuántica, aumentan las posiblidades de uso de algoritmos inteligentes para la exploración del espacio químico. Por otra parte, todavía no disponemos de métodos eficientes para la predicción de propiedades de reacción cuantitativas. Entre estas propiedades se encuentra la energía de activación, cuya predicción de forma precisa proporcionaría un método para el descubrimiento de nuevos mecanismos de reacción y nos facilitaría el control sobre la cinética de las reacciones. El presente trabajo intenta buscar un algoritmo basado en machine learning para la predicción de energías de activación. Nuestro modelo depende de un cálculo a nivel semiempírico (PM7) y proporciona una predicción a nivel DFT mediante machine learning. Con este procedimiento, conseguimos precisión química con un coste computacional reducido. Además de obtener un rendimiento equiparable al estado del arte, esta alternativa contribuye con descriptores personalizados, que pueden ser incorporados en procedimientos de minería de datos en la química. Por último, también proporciona una interpretación del modelo desde una perspectiva de la intuición química.Machine learning and artificial intelligence are becoming ubiquitous techniques in computational chemistry research. With quantum-chemical data becoming increasingly available, intelligent algorithms are taking the upper hand in the exploration of the chemical space. On the other hand, we still lack efficient algorithms when it comes to predicting quantitative reaction properties. Within this properties, accurately predicting activation energies would enable rapid discovery of new reaction mechanisms and would grant control over chemical kinetics. The present work intends to seek for a machine learning-based algorithm to predict activation energies. Our model relies on a semiempirical calculation (PM7 level of theory) and resorts to machine learning to DFT accuracy. With this procedure, we can obtain chemical accuracy while limiting the computational expenditure. In addition to achieving state of the art performance, this approach contribute with innovative custom descriptors that can be harnessed in data mining techniques in the chemical domain and allow interpretability from the perspective of chemical intuition

    Similar works