Avaliação de uma Árvore para melhorias de Desempenho de Classificação do Algoritmo dos vizinhos mais Próximos
Nome: HOWARD CRUZ ROATTI
Tipo: Dissertação de mestrado acadêmico
Data de publicação: 05/08/2016
Orientador:
Nome![]() |
Papel |
---|---|
ELIAS SILVA DE OLIVEIRA | Orientador |
Banca:
Nome![]() |
Papel |
---|---|
ELIAS SILVA DE OLIVEIRA | Orientador |
MARIELLA BERGER ANDRADE | Examinador Externo |
PATRICK MARQUES CIARELLI | Coorientador |
RICARDO BASTOS CAVALCANTE PRUDÊNCIO | Examinador Externo |
THIAGO OLIVEIRA DOS SANTOS | Examinador Interno |
Resumo: Na área de mineração de textos a classificação é uma das principais atividades exploradas pelos pesquisadores. O kNN (k-Nearest Neighbors) e um classificador de simples implementação e possui bons resultados frente a outros algoritmos mais avançados. Entretanto, possui problemas de desempenho a proporção que a base de dados a ser classificada cresce suas dimensões, seja em número de termos ou quantidade de documentos. Algumas alternativas para melhoria de desempenho
estão relacionadas a abordagens híbridas misturando álgebra linear e lista como estrutura de dados,técnicas de redução de dimensionalidade, metodologias de otimização, seleção de características e ponderações de termos. Essas abordagens são de implementação complexa dificultando o uso delas em grande escala. Para contornar esse problema e ainda assim conseguir melhorar o desempenho do kNN, nesse trabalho foi aplicado uma metodologia de classificação dos vizinhos mais próximos com utilização de uma estrutura em árvore, estrutura de dados com baixa complexidade computacional. Com ela notou-se ganho de tempo de classificação em relação ao kNN. Alem disso, modificações feitas na árvore e no modo de tomada de decisão para classificação, culminaram em melhorar o tempo de classificação sendo em média 17 vezes mais rápido que a versão original e manteve, estatisticamente, as qualidades de obtidas.