4 research outputs found
Recommended from our members
Chatbot Interaction with Artificial Intelligence:human data augmentation with T5 and language transformer ensemble for text classification
In this work we present the Chatbot Interaction with Artificial Intelligence (CI-AI) framework as an approach to the training of a transformer based chatbot-like architecture for task classification with a focus on natural human interaction with a machine as opposed to interfaces, code, or formal commands. The intelligent system augments human-sourced data via artificial paraphrasing in order to generate a large set of training data for further classical, attention, and language transformation-based learning approaches for Natural Language Processing (NLP). Human beings are asked to paraphrase commands and questions for task identification for further execution of algorithms as skills. The commands and questions are split into training and validation sets. A total of 483 responses were recorded. Secondly, the training set is paraphrased by the T5 model in order to augment it with further data. Seven state-of-the-art transformer-based text classification algorithms (BERT, DistilBERT, RoBERTa, DistilRoBERTa, XLM, XLM-RoBERTa, and XLNet) are benchmarked for both sets after fine-tuning on the training data for two epochs. We find that all models are improved when training data is augmented by the T5 model, with an average increase of classification accuracy by 4.01%. The best result was the RoBERTa model trained on T5 augmented data which achieved 98.96% classification accuracy. Finally, we found that an ensemble of the five best-performing transformer models via Logistic Regression of output label predictions led to an accuracy of 99.59% on the dataset of human responses. A highly-performing model allows the intelligent system to interpret human commands at the social-interaction level through a chatbot-like interface (e.g. âRobot, can we have a conversation?â) and allows for better accessibility to AI by non-technical users
IdentificaciĂłn de mĂșltiples intenciones y sus dependencias subsumidas en mĂșltiples utterances para el desarrollo de Chatbots
Los chatbots son sistemas de procesamiento de lenguaje natural con los que se puede
interactuar mediante una interfaz de texto o voz, y han sido adoptados en muchas
industrias para responder las preguntas y solicitudes de los usuarios a través de
interfaces de chat. Por ende, los chatbots tienen un valor comercial como asistentes
virtuales.
Tanto es asĂ que se estĂĄ trabajando en que los chatbots puedan comunicarse con los
usuarios de manera similar a la comunicaciĂłn que hay entre dos humanos; en otras
palabras, un usuario debe experimentar la sensaciĂłn de comunicarse con una
persona. A su vez, dado que los chatbots eliminan los factores humanos y estĂĄn
disponibles las 24 horas del dĂa, hay un incremento en la demanda de las capacidades
de inteligencia artificial para interactuar con los clientes. En este aspecto, la sensaciĂłn
de comunicarse con una persona puede ser lograda mediante la inclusión de técnicas
de comprensiĂłn del lenguaje natural, procesamiento del lenguaje natural, generaciĂłn
del lenguaje natural y aprendizaje automĂĄtico.
De este modo, los chatbots son capaces de interpretar una o varias intenciones
comunicativas en cada âutteranceâ de un usuario, siendo que un âutteranceâ es todo lo
que el usuario o chatbot mencionan mientras es su turno de hablar o escribir. AsĂ
mismo, los chatbots pueden asociar una o varias intenciones comunicativas a un
identificador de âutterancesâ que contiene varios âutterancesâ. Por ende, a partir del
âutteranceâ de un usuario, un chatbot es capaz de interpretar una o varias intenciones
comunicativas asociadas a un identificador de âutterancesâ, a travĂ©s del cual usa los
âutterancesâ contenidos para escoger o generar un âutteranceâ como respuesta al
usuario. No obstante, si bien un chatbot puede identificar mĂșltiples intenciones
comunicativas en un enunciado, de un usuario, con un âutteranceâ, no puede identificar
mĂșltiples intenciones comunicativas en un enunciado, de un usuario, que contenga
mĂșltiples âutterancesâ. En consecuencia, tampoco se ha investigado como encontrar
los âutterancesâ de respuesta del chatbot cuando se tiene mĂșltiples âutterancesâ.
Por lo descrito previamente, en este proyecto se propone la implementaciĂłn de una
herramienta para: identificar mĂșltiples intenciones comunicativas en mĂșltiples
âutterancesâ, identificar las dependencias entre intenciones, agrupar las intenciones a
partir de sus dependencias, identificar las dependencias entre los grupos de
intenciones respecto de los identificadores de âutterancesâ y los identificadores de
âutterancesâ respecto de los âutterancesâ. AdemĂĄs, para facilitar el uso de la
herramienta, se elabora una interfaz de programaciĂłn de aplicaciones que recibe
mĂșltiples âutterancesâ en forma de texto, y devuelve los âutterancesâ segmentados, las
intenciones identificadas, los grupos entre intenciones y los âutterancesâ de respuesta
del chatbot para cada grupo de intenciones.
Los resultados obtenidos evidencian que los enfoques utilizados son exitosos. Por
Ășltimo, se espera mejorar los resultados con tĂ©cnicas de inteligencia artificial y
computaciĂłn lingĂŒĂstica