Cientifica, ISSN 2594-2921, vol. 29, no. 2, July-December 2025.
DOI: 10.46842/ipn.cien.v29n2a08
A Review of Multimodal Artificial Intelligence: Ethical Challenges and Practical Benefits in Content Generation
Una revisión sobre Inteligencia artificial multimodal: retos éticos y beneficios prácticos en la generación de contenidos
Recibido 06/08/2025, aceptado 08-12-2025.
Abstract
This systematic review examines 23 peer-reviewed studies published since 2020 to delineate technical and ethical risks, synthesize key benefits, and identify future research avenues for AI-driven multimodal content creation. Employing a PRISMA-guided protocol, we screened five major digital libraries using rigorous inclusion/exclusion criteria and an adapted CASP checklist. The resulting corpus encompasses diverse domains, including visual art, education, marketing, healthcare, and disaster response. We classified these works into four functional categories: Creation and Design, Communication and Analysis, Automation and Detection, and Interaction and Teaching. Quantitative analysis reveals that 30% of studies prioritized automation efficiency, 26% highlighted personalized outputs, and 18% reported enhanced content diversity. Crucially, our review identifies significant risks such as misinformation, modality-alignment failures, algorithmic bias, and privacy breaches. These findings underscore the need for transparent algorithms, bias-monitoring protocols, and privacy-by-design frameworks. We conclude by advocating for the development of interpretable models and standardized ethical methodologies to advance robust, responsible, and scalable multimodal AI systems.
Resumen
Esta revisión sistemática examina 23 estudios revisados por pares publicados desde 2020 para delinear los riesgos técnicos y éticos, sintetizar los beneficios clave e identificar futuras vías de investigación para la creación de contenido multimodal impulsada por IA. Empleando un protocolo guiado por PRISMA, examinamos cinco bibliotecas digitales principales utilizando rigurosos criterios de inclusión y exclusión, junto con una lista de verificación CASP adaptada. El corpus resultante abarca diversos dominios, incluyendo artes visuales, educación, marketing, salud y respuesta ante desastres. Clasificamos estos trabajos en cuatro categorías funcionales: Creación y Diseño, Comunicación y Análisis, Automatización y Detección, e Interacción y Enseñanza. El análisis cuantitativo revela que el 30% de los estudios priorizaron la eficiencia de la automatización, el 26% destacaron los resultados personalizados y el 18% reportaron una mayor diversidad de contenido. Crucialmente, nuestra revisión identifica riesgos significativos como la desinformación, fallos en la alineación de modalidades, sesgo algorítmico y violaciones de privacidad. Estos hallazgos subrayan la necesidad de algoritmos transparentes, protocolos de monitoreo de sesgos y marcos de privacidad desde el diseño. Concluimos abogando por el desarrollo de modelos interpretables y metodologías éticas estandarizadas para avanzar hacia sistemas de IA multimodal robustos, responsables y escalables.
Index terms: multimodal AI, AI-generated content,
ethical challenges, automation efficiency.
Palabras clave: IA multimodal, contenido generado por IA,
retos éticos, automatización eficiente.
ISO 690 reference:
Cuaya Simbro, German;
Garcia Tapia, Wendy;
Avila Vargas, María F.;
Hernández Ávalos, Pedro Aarón,
2025,
A Review of Multimodal Artificial Intelligence: Ethical
Challenges and Practical Benefits in Content Generation,
Científica, vol. 29, no. 2,
ISSN 2594-2921, e290208,
DOI: 10.46842/ipn.cien.v29n2a08