Cientifica, ISSN 2594-2921, vol. 29, no. 2, July-December 2025.

DOI: 10.46842/ipn.cien.v29n2a09

Mecanismos para la detección de anomalías de ciberseguridad a través del análisis de grandes cantidades de datos


Mechanisms for the Detection of Cybersecurity Anomalies through Big Data Analysis


Pablo Andrés Martínez Velasco
(ORCID: 0009-0002-0607-672X)
Universidad Autónoma de Aguascalientes, Centro de Ciencias Básicas, Aguascalientes, MÉXICO

Luis Eduardo Bautista Villalpando
(ORCID: 0000-0001-8665-1776)
Universidad Autónoma de Aguascalientes, Centro de Ciencias Básicas, Aguascalientes, MÉXICO

Edgar Oswaldo Díaz
(ORCID: 0000-0002-3695-7715)
Instituto Nacional de Estadística y Geografía, Aguascalientes, MÉXICO

Juan Muñoz López
(ORCID: 0009-0006-2880-191X)
Instituto Nacional de Estadística y Geografía, Aguascalientes, MÉXICO

Recibido 09/08/2025, aceptado 19-12-2025.

Resumen

Esta investigación se centra en la convergencia de la Ciencia de Datos y la Ciberseguridad. El objetivo es el de proponer una solución innovadora que fortalezca la protección de organizaciones en México frente a amenazas cibernéticas. Este trabajo se enfoca en los ataques Denegación de Servicios Distribuidos (DDoS por sus siglas en inglés) a través de diversos estudios y comparaciones usando la metodología más adecuada que permite procesar bases de datos relacionadas de ciberataques desde una perspectiva de modelos de aprendizaje automático tanto supervisados como semi-supervisados. Estos algoritmos han sido entrenados, evaluados y configurados cuidadosamente evitando el sobre ajuste (overfitting) y el ruido de datos corruptos. Así, el modelo resultante es capaz de clasificar eficientemente registros de ataques DDoS y archivos de registros (logs) normales con una alta precisión, demostrando su potencial para ser implementado en ambientes de producción con el objetivo de fortalecer la ciberseguridad evitando la fuga de datos e inhabilitación de servicios.

Abstract

This research centers on the convergence of Data Science and Cybersecurity. The aim is to propose an innovative solution to strengthen the protection of organizations in Mexico against cyber threats. This work focuses on Distributed Denial of Service (DDoS) attacks through various studies and comparisons, employing the most suitable methodology to process cyberattack-related datasets from the perspective of both supervised and semi-supervised machine learning models. These algorithms were carefully trained, evaluated, and tuned to avoid overfitting and noise from corrupt data. Consequently, the resulting model is capable of efficiently classifying DDoS attack records and normal log files with accuracy, demonstrating its potential for implementation in production environments to enhance organizational cybersecurity, thereby preventing data breaches and service disruptions.


Palabras clave: aprendizaje automático, aprendizaje semi-supervisado, aprendizaje supervisado, ciberseguridad, ciencia de datos, big data.
Index terms: machine learning, semi-supervised learning, supervised learning, big data science, cybersecurity.


ISO 690 reference:
Martínez Velasco, Pablo Andrés; Bautista Villalpando, Luis Eduardo; Díaz, Edgar Oswaldo; Muñoz López, Juan, Mecanismos para la detección de anomalías de ciberseguridad a través del análisis de grandes cantidades de datos, Científica, vol. 29, no. 2, ISSN 2594-2921, e290209, DOI: 10.46842/ipn.cien.v29n2a09