Categorização automática de produtos utilizando apenas o título e aprendizado profundo

Nome: LEONARDO SANTOS PAULUCIO
Tipo: Dissertação de mestrado acadêmico
Data de publicação: 14/02/2022
Orientador:

Nomeordem decrescente Papel
THIAGO OLIVEIRA DOS SANTOS Orientador

Banca:

Nomeordem decrescente Papel
FLÁVIO MIGUEL VAREJÃO Examinador Interno
PATRICK MARQUES CIARELLI Examinador Externo
THIAGO OLIVEIRA DOS SANTOS Orientador

Resumo: O Processamento de Linguagem Natural (PLN) tem recebido uma atenção cada vez maior
nos últimos anos. Em parte, isso está relacionado ao enorme fluxo de dados disponibilizados
todos os dias na internet, o que aumentou a necessidade de ferramentas automáticas capazes
de analisar e extrair informações relevantes, principalmente do texto. Nesse contexto, a
classificação de textos tornou-se uma das tarefas mais estudadas no domínio do PLN.
O objetivo é atribuir categorias ou rótulos predefinidos a textos ou frases. Aplicativos
importantes incluem classificação de frases, análise de sentimento, detecção de spam, entre
muitos outros. Este trabalho propõe um sistema automático de categorização de produtos
utilizando apenas seus títulos. O sistema proposto emprega uma rede neural profunda
de última geração como uma ferramenta para extrair recursos dos títulos a serem usados
como entrada em diferentes modelos de aprendizado de máquina. O sistema é avaliado no
conjunto de dados do Mercado Libre de larga escala, que possui características comuns a
problemas do mundo real, como classes desequilibradas, rótulos não confiáveis, além de
possuir um grande número de amostras: 20.000.000 no total. Os resultados mostraram que
o sistema proposto foi capaz de categorizar corretamente os produtos com uma precisão
balanceada de 86,57% na divisão de teste local do conjunto de dados do Mercado Libre.
Também ultrapassou o quarto lugar no ranking público do MeLi Data Challenge com
91,19% de precisão balanceada, o que representa menos de 1% da diferença para o vencedor.

Acesso ao documento

Acesso à informação
Transparência Pública

© 2013 Universidade Federal do Espírito Santo. Todos os direitos reservados.
Av. Fernando Ferrari, 514 - Goiabeiras, Vitória - ES | CEP 29075-910