Application of natural language processing techniques to network traffic processing for classification using deep learning models

Antecedentes: El rápido crecimiento del tráfico de red cifrado ha aumentado la necesidad de una clasificación del tráfico de red (NTC) eficaz y no sesgada. Las técnicas tradicionales tienen dificultades con los datos cifrados, la disponibilidad limitada de características y el elevado volumen de tráfico, lo que reduce su fiabilidad en escenarios reales. Métodos: Proponemos una metodología de preprocesamiento novedosa que analiza el tráfico de red en bruto y lo transforma en un formato textual (nt2txt), lo que permite aplicar técnicas de Procesamiento del Lenguaje Natural (NLP) y de Aprendizaje Profundo. Este enfoque elimina el sesgo derivado de los metadatos de protocolo, estructura los datos en semi-flujos de tamaño fijo y utiliza una división rigurosa de los datos para evitar el solapamiento de flujos entre entrenamiento y prueba. A continuación, se entrena un modelo basado en LSTM para clasificar el tráfico utilizando únicamente los datos de la carga útil (payload). Resultados: Este trabajo proporciona un marco escalable e independiente del protocolo para la clasificación de tráfico cifrado, demostrando la eficacia de las técnicas de NLP para mejorar el rendimiento del modelo y reducir el sesgo del conjunto de datos. Nuestra metodología alcanzó una precisión del 88,87 ± 0,04% en un conjunto de datos externo ciego, superando a modelos similares LSTM e híbridos CNN-LSTM. Métricas como la Kappa de Cohen y el Coeficiente de Correlación de Matthews confirman además la robustez y la generalizabilidad de nuestro enfoque. [Traducción automática al español; idioma original: inglés.]

Description

Keywords

Artificial intelligence, Cybersecurity, PLN, Traffic classification, Information Systems, Hardware and Architecture, Computer Networks and Communications, Information Systems and Management, Yes, yes

Citation

Maitin, A M, Arranz-Luque, C, Alba, E & García-Tejedor, Á J 2025, 'Application of natural language processing techniques to network traffic processing for classification using deep learning models', Journal of Big Data, vol. 12, no. 1, 277. https://doi.org/10.1186/s40537-025-01183-w

Collections

ESCUELA POLITÉCNICA SUPERIOR

Full item page

Depósito Digital UFV

Application of natural language processing techniques to network traffic processing for classification using deep learning models

Identifiers

Publication date

Start date of the public exhibition period

End date of the public exhibition period

Authors

Advisors

Journal Title

Journal ISSN

Volume Title

Publisher

Metrics

Share

Export

Research Projects

Organizational Units

Journal Issue

Abstract

Doctoral program

Description

Keywords

Citation

Collections