5 research outputs found

    Анализ информационного и математического обеспечения для распознавания аффективных состояний человека

    Get PDF
    В статье представлен аналитический обзор исследований в области аффективных вычислений. Это направление является составляющей искусственного интеллекта, и изучает методы, алгоритмы и системы для анализа аффективных состояний человека при его взаимодействии с другими людьми, компьютерными системами или роботами. В области интеллектуального анализа данных под аффектом подразумевается проявление психологических реакций на возбуждаемое событие, которое может протекать как в краткосрочном, так и в долгосрочном периоде, а также иметь различную интенсивность переживаний. Аффекты в рассматриваемой области разделены на 4 вида: аффективные эмоции, базовые эмоции, настроение и аффективные расстройства. Проявление аффективных состояний отражается в вербальных данных и невербальных характеристиках поведения: акустических и лингвистических характеристиках речи, мимике, жестах и позах человека. В обзоре приводится сравнительный анализ существующего информационного обеспечения для автоматического распознавания аффективных состояний человека на примере эмоций, сентимента, агрессии и депрессии. Немногочисленные русскоязычные аффективные базы данных пока существенно уступают по объему и качеству электронным ресурсам на других мировых языках, что обуславливает необходимость рассмотрения широкого спектра дополнительных подходов, методов и алгоритмов, применяемых в условиях ограниченного объема обучающих и тестовых данных, и ставит задачу разработки новых подходов к аугментации данных, переносу обучения моделей и адаптации иноязычных ресурсов. В статье приводится описание методов анализа одномодальной визуальной, акустической и лингвистической информации, а также многомодальных подходов к распознаванию аффективных состояний. Многомодальный подход к автоматическому анализу аффективных состояний позволяет повысить точность распознавания рассматриваемых явлений относительно одномодальных решений. В обзоре отмечена тенденция современных исследований, заключающаяся в том, что нейросетевые методы постепенно вытесняют классические детерминированные методы благодаря лучшему качеству распознавания состояний и оперативной обработке большого объема данных. В статье рассматриваются методы анализа аффективных состояний. Преимуществом использования многозадачных иерархических подходов является возможность извлекать новые типы знаний, в том числе о влиянии, корреляции и взаимодействии нескольких аффективных состояний друг на друга, что потенциально влечет к улучшению качества распознавания. Приводятся потенциальные требования к разрабатываемым системам анализа аффективных состояний и основные направления дальнейших исследований

    Анализ информационного и математического обеспечения для распознавания аффективных состояний человека

    Get PDF
    The article presents an analytical review of research in the affective computing field. This research direction is a component of artificial intelligence, and it studies methods, algorithms and systems for analyzing human affective states during interactions with other people, computer systems or robots. In the field of data mining, the definition of affect means the manifestation of psychological reactions to an exciting event, which can occur both in the short and long term, and also have different intensity. The affects in this field are divided into 4 types: affective emotions, basic emotions, sentiment and affective disorders. The manifestation of affective states is reflected in verbal data and non-verbal characteristics of behavior: acoustic and linguistic characteristics of speech, facial expressions, gestures and postures of a person. The review provides a comparative analysis of the existing infoware for automatic recognition of a person’s affective states on the example of emotions, sentiment, aggression and depression. The few Russian-language, affective databases are still significantly inferior in volume and quality compared to electronic resources in other world languages. Thus, there is a need to consider a wide range of additional approaches, methods and algorithms used in a limited amount of training and testing data, and set the task of developing new approaches to data augmentation, transferring model learning and adapting foreign-language resources. The article describes the methods of analyzing unimodal visual, acoustic and linguistic information, as well as multimodal approaches for the affective states recognition. A multimodal approach to the automatic affective states analysis makes it possible to increase the accuracy of recognition of the phenomena compared to single-modal solutions. The review notes the trend of modern research that neural network methods are gradually replacing classical deterministic methods through better quality of state recognition and fast processing of large amount of data. The article discusses the methods for affective states analysis. The advantage of multitasking hierarchical approaches is the ability to extract new types of knowledge, including the influence, correlation and interaction of several affective states on each other, which potentially leads to improved recognition quality. The potential requirements for the developed systems for affective states analysis and the main directions of further research are given.В статье представлен аналитический обзор исследований в области аффективных вычислений. Это направление является составляющей искусственного интеллекта, и изучает методы, алгоритмы и системы для анализа аффективных состояний человека при его взаимодействии с другими людьми, компьютерными системами или роботами. В области интеллектуального анализа данных под аффектом подразумевается проявление психологических реакций на возбуждаемое событие, которое может протекать как в краткосрочном, так и в долгосрочном периоде, а также иметь различную интенсивность переживаний. Аффекты в рассматриваемой области разделены на 4 вида: аффективные эмоции, базовые эмоции, настроение и аффективные расстройства. Проявление аффективных состояний отражается в вербальных данных и невербальных характеристиках поведения: акустических и лингвистических характеристиках речи, мимике, жестах и позах человека. В обзоре приводится сравнительный анализ существующего информационного обеспечения для автоматического распознавания аффективных состояний человека на примере эмоций, сентимента, агрессии и депрессии. Немногочисленные русскоязычные аффективные базы данных пока существенно уступают по объему и качеству электронным ресурсам на других мировых языках, что обуславливает необходимость рассмотрения широкого спектра дополнительных подходов, методов и алгоритмов, применяемых в условиях ограниченного объема обучающих и тестовых данных, и ставит задачу разработки новых подходов к аугментации данных, переносу обучения моделей и адаптации иноязычных ресурсов. В статье приводится описание методов анализа одномодальной визуальной, акустической и лингвистической информации, а также многомодальных подходов к распознаванию аффективных состояний. Многомодальный подход к автоматическому анализу аффективных состояний позволяет повысить точность распознавания рассматриваемых явлений относительно одномодальных решений. В обзоре отмечена тенденция современных исследований, заключающаяся в том, что нейросетевые методы постепенно вытесняют классические детерминированные методы благодаря лучшему качеству распознавания состояний и оперативной обработке большого объема данных. В статье рассматриваются методы анализа аффективных состояний. Преимуществом использования многозадачных иерархических подходов является возможность извлекать новые типы знаний, в том числе о влиянии, корреляции и взаимодействии нескольких аффективных состояний друг на друга, что потенциально влечет к улучшению качества распознавания. Приводятся потенциальные требования к разрабатываемым системам анализа аффективных состояний и основные направления дальнейших исследований

    Modelos de clasificación binaria de la coloración semántica de textos

    Get PDF
    Introduction: The purpose of the research is to compare different types of recurrent neural network architectures, namely the long short-term memory and gate recurrent node architecture and the convolutional neural network, and to explore their performance on the example of binary text classification. Material and Methods: To achieve this, the research evaluates the performance of these two popular deep-learning approaches on a dataset consisting of film reviews that are marked with both positive and adverse opinions. The real-world dataset was used to train neural network models using software implementations. Results and Discussion: The research focuses on the implementation of a recurrent neural network for the binary classification of a dataset and explores different types of architecture, approaches and hyperparameters to determine the best model to achieve optimal performance. The software implementation allowed evaluating of various quality metrics, which allowed comparing the performance of the proposed approaches. In addition, the research explores various hyperparameters such as learning rate, packet sizes, and regulation methods to determine their impact on model performance. Conclusion: In general, the research provides valuable insights into the performance of neural networks in binary text classification and highlights the importance of careful architecture selection and hyperparameter tuning to achieve optimal performance

    DEEP : uma arquitetura para reconhecer emoção com base no espectro sonoro da voz de falantes da língua portuguesa

    Get PDF
    Trabalho de conclusão de curso (graduação)—Universidade de Brasília, Instituto de Ciências Exatas, Departamento de Ciência da Computação, 2020.O reconhecimento de emoção em fala é uma linha de pesquisa dentro da Inteligência Ar- tificial (IA) que exige arquiteturas robustas de modelos de Deep Learning (DL) para a correta distinção das emoções percebidas na voz. Para responder a essa exigência, trabal- hos recentes da literatura sugerem arquiteturas cada vez mais robustas, como a de modelos híbridos. No entanto, a utilização de múltiplas redes neurais de maneira sequencial pode ocasionar a propagação de erros entre os modelos. Além desse problema, ressalta-se que não foram encontrados outros trabalhos que treinam modelos em língua portuguesa. Dessa forma, a fim de lidar com as referidas limitações da literatura relacionada, neste trabalho é desenvolvida uma arquitetura para o reconhecimento de emoções com base em padrões presentes no espectro sonoro gerado pela voz de falantes da língua portuguesa: DEEP - DEtection of voice Emotion in Portuguese language (Detecção de Emoção na Voz na Linguagem Portuguesa). O DEEP é composto por um conjunto de modelos especialistas de redes neurais convolucionais, do inglês Convolutional Neural Networks (CNNs), mod- elos de DL treinados em língua portuguesa, cujo intuito visa à especialização da detecção de emoções. Para treinamento do modelo, foi utilizada a base de dados de voz em língua portuguesa VERBO, o que permite que esta tecnologia seja aplicada em diversas áreas nos países que têm esse idioma como oficial. Para avaliar os resultados da performance alcançada com a arquitetura proposta, em um primeiro momento, os modelos especialistas foram hiper parametrizados, o que permitiu o descobrimento de configurações otimizadas na detecção de cada emoção. Em seguida, as acurácias obtidas foram comparadas com as alcançadas por um modelo CNN classificador tradicionalmente apresentado na literatura relacionada, denominado neste trabalho por modelo baseline, em que foram observados ganhos de performance para todas as 7 emoções presentes no VERBO, com uma diferença média de 12.39%, tendo o maior ganho com a emoção Medo, esta que foi 24.42% maior quando comparado com a CNN.Speech emotion recognition is a line of research within Artificial Intelligence (AI) that re- quires complex architectures of Deep Learning (DL) models to distinguish the perceived emotions in voice. To fulfill this requirement, recent works suggest increasingly complex architectures, such as hybrid models. However, these models can propitiate error prop- agation among the sequentially placed models, increasing false positives. In addition to this problem, it is noteworthy that no other studies that train models in Portuguese were found. Thus, in order to deal with the referred limitations of the related literature, this work presents an architecture for emotion recognition based on patterns present in the sound spectrum generated by the voice of Portuguese speakers: DEEP - DEtection of voice Emotion in Portuguese language. DEEP is composed of specialist models of con- volutional neural networks (CNN) whose aim is to specialize in detecting emotions. The Portuguese voice database VERBO was used for training the model, which allows this technology to be applied in several areas in countries that have this language as an official language. To evaluate the proposed architecture, the specialist models were hyper param- eterized, which allowed the discovery of optimized configurations to detect each emotion. Then, the DEEP was compared with a CNN model, in which performance gains were observed for all seven emotions present in VERBO, with an average difference of 12.39%, having the highest gain with the Fear emotion, which was 24.42% higher when compared to CNN
    corecore