Crossing Domains for Accuracy: In-Network Stacking of Machine Learning Classifiers
Nome: BRUNO MISSI XAVIER
Data de publicação: 21/06/2024
Banca:
Nome | Papel |
---|---|
RAFAEL PASQUINI | Examinador Externo |
Páginas
Resumo: A gestão de tráfego desempenha um papel crucial nessa conectividade global expansiva. Nesse contexto, a classificação de tráfego diferencia estrategicamente uma variedade de aplicações e seus requisitos. Essa transformação aprimora a agilidade da rede e facilita a integração direta do Machine Learning (ML) na infraestrutura de rede, mudando fundamentalmente a gestão de tráfego ao promover o processamento e a análise de dados de forma proativa dentro da rede. A sinergia entre a Softwarização de Redes (NS) e o ML não só reduz a latência e melhora a gestão de carga, mas também aumenta a capacidade de lidar eficazmente com volumes maiores de dados. Consequentemente, as redes estão mais bem preparadas para atender às demandas complexas dos ecossistemas digitais modernos, garantindo conectividade robusta e eficiente. Esta tese explorou o domínio das redes programáveis, com foco específico na implementação de ML para classificação de tráfego nos componentes da arquitetura de rede, incluindo a Rede de Acesso por Rádio (RAN) e planos de dados programáveis. Essa abordagem representa uma mudança significativa em relação às técnicas tradicionais de classificação de tráfego, que geralmente são implementadas em hosts finais. Além disso, abre caminho para a integração de capacidades de Inteligência Artificial (IA) Multidomínio na rede, facilitada pelo aprendizado multivisão. Mais especificamente, avançamos o estado da arte com quatro contribuições principais: (i) Projetamos uma estrutura chamada Early Attack Guarding and Learning Engine (EAGLE) como a primeira linha de defesa contra um conjunto de ameaças cibernéticas. Nossa estrutura explora a Open Radio Access Network (O-RAN) para coletar medições da interface aérea (isto é, Física e Controle de Acesso ao Meio) para identificar e mitigar precocemente fluxos maliciosos; (ii) Introduzimos o MAP4, que demonstra a viabilidade de implantar modelos de ML (como árvores de decisão e Random Forest) no plano de dados. Para alcançar isso, utilizamos a linguagem P4 para implementar um modelo pré-treinado capaz de classificar fluxos com precisão em taxas de linha; (iii) Propusemos o conceito de In-Network Concept Drift para lidar com a natureza dinâmica do tráfego de rede. Essa abordagem detecta mudanças na distribuição do tráfego implementando a Exponentially Weighted Moving Average (EWMA), superando as limitações do P4; (iv) Nossa abordagem de IA Multidomínio integra múltiplas camadas (RAN e planos de dados programáveis) para formar uma pilha de classificadores de ML na rede sob a perspectiva de aprendizado multivisão. Essa abordagem inovadora supera os desafios de uma única camada para melhorar a precisão geral do sistema de classificação.