Cientifica, ISSN 2594-2921, vol. 26, no. 2, July-December 2022.

DOI: https://doi.org/10.46842/ipn.cien.v26n2a02

Recognition of Facial Expressions Using Vision Transformer


Reconocimiento de expresiones faciales con vision transformer


Paula Ivone Rodríguez-Azar
(https://orcid.org/0000-0001-8981-5350)
Universidad Autónoma de Ciudad Juárez, MÉXICO

José Manuel Mejía-Muñoz
(https://orcid.org/0000-0002-5832-6623)
Universidad Autónoma de Ciudad Juárez, MÉXICO

Carlos Alberto Ochoa-Zezzatti
(https://orcid.org/0000-0002-9183-6086)
Universidad Autónoma de Ciudad Juárez, MÉXICO


Recibido 03-05-2022, aceptado 19-09-2022.

Abstract

The identification of emotions through the reading of non-verbal signals, such as gestures and facial expressions, has generated a new application in the field of Facial Expression Recognition (FER) and human-computer interaction. Through the recognition of facial expressions, it would be possible to improve industrial equipment by making it safer through social intelligence that has excellent applications in the area of industrial security. That is why this research proposes to classify a series of images from the database called FER-2013, which contains data on seven different emotions, which are anger, disgust, fear, joy, sadness, surprise, neutral. For the recognition of expressions, a Vision Transformer architecture was implemented, of which 87% precision was obtained, while the top test accuracy was 99%.


Resumen

La identificación de emociones a través de la lectura de señales no verbales, como gestos y expresiones faciales, ha generado una nueva aplicación en el campo del Reconocimiento de Expresión Facial (FER por sus siglas en ingles) y la interacción humano ordenador. A través del reconocimiento de expresiones faciales, sería posible mejorar los equipos industriales haciéndolos más seguros a través de la inteligencia social que tiene excelentes aplicaciones en el área de la seguridad industrial. Es por ello que en esta investigación se propone clasificar una serie de imágenes de la base de datos denominada FER-2013, que contiene datos sobre siete emociones distintas, las cuales son enfado, asco, miedo, alegría, tristeza, sorpresa, neutral. Para el reconocimiento de expresiones se implementó la arquitectura Vision Transformer, de la cual se obtuvo un 87% de exactitud, mientras que la exactitud más alta fue de 99%.

Palabras clave: vision transformer, expresiones faciales, reconocimiento de emociones.
Index terms: vision transformer, facial expressions, emotion recognition.


ISO 690 reference:
Rodríguez-Azar, Paula Ivone; Mejía-Muñoz, José Manuel; Ochoa-Zezzatti, Carlos Alberto, 2022, Recognition of Facial Expressions Using Vision Transformer, Científica, Revista Mexicana de Ingeniería Electromecánica y de Sistemas, vol. 26, no. 2, ISSN 2594-2921, e260202, DOI: https://doi.org/10.46842/ipn.cien.v26n2a02