Novas técnicas de amostragem tendenciosa para os algoritmos de análise de agrupamento k-médias e DBSCAN
Nome: DIEGO LUCHI
Tipo: Tese de doutorado
Data de publicação: 28/03/2019
Orientador:
Nome | Papel |
---|---|
FLÁVIO MIGUEL VAREJÃO | Orientador |
Banca:
Nome | Papel |
---|---|
FLÁVIO MIGUEL VAREJÃO | Orientador |
Resumo: A análise de agrupamento é um conjunto de técnicas destinadas a identificação de grupos de elementos similares em um conjunto de dados. Tais técnicas são utilizadas nas mais variadas aplicações, como segmentação de imagens, processamento de sinais, compressão de dados, aprendizado não supervisionado, seleção de características, amostragem, dentre outras. Embora sejam importantes nas mais diversas aplicações, a utilização dessas técnicas em conjunto de dados de grande cardinalidade é um problema em virtude da escalabilidade ruim de vários algoritmos tradicionais. Uma das formas de se contornar esse problema é a amostragem, afinal, reduzir a cardinalidade do conjuntos de dados reduz bastante o esforço computacional exigido pelos métodos. Nesse trabalho são apresentados três métodos amostrais novos especificamente projetados para serem utilizados em conjunto com os algoritmos de análise de agrupamento k-médias e DBSCAN. Os resultados experimentais mostram que os métodos propostos para o algoritmo DBSCAN obtiveram melhores resultados que os competidores. Contudo, a abordagem amostral proposta para o k-médias ficou em segundo lugar, retornando resultados de qualidade inferior a outro método recentemente proposto denominado DENDIS.