Exploring label correlations in multi-label ensemble
Nome: VICTOR FREITAS ROCHA
Tipo: Dissertação de mestrado acadêmico
Data de publicação: 25/08/2022
Orientador:
Nome | Papel |
---|---|
FLÁVIO MIGUEL VAREJÃO | Orientador |
Banca:
Nome | Papel |
---|---|
ALEXANDRE LOUREIROS RODRIGUES | Examinador Externo |
FLÁVIO MIGUEL VAREJÃO | Orientador |
THIAGO OLIVEIRA DOS SANTOS | Examinador Interno |
Resumo: No contexto de aprendizado de máquina, a classificação é a tarefa de identificar a que classe
pertence uma instância de acordo com o conhecimento obtido atráves de um conjunto
de treinamento, ou seja, um conjunto de instâncias cuja classificação é previamente
conhecida. A classificação unirrótulo, uma das versões mais tradicionais do problema de
classificação, permite que uma instância pertença a apenas uma classe considerando-as,
portanto, mutualmente exclusivas. Entretanto, problemas do mundo real em que interseções
entre classes ocorrem frequentemente podem ser melhor modelados como problemas de
classificação multirrótulo, cuja tarefa permite que múltiplos rótulos sejam atribuidos à
mesma instancia. Múltiplos classificadores, tanto unirrótulo quanto multirrótulo, podem
ser treinados para o mesmo problema de classificação e gerar um resultado combinado. Essa
técnica, conhecida como comitês de classificadores, é comumente utilizada para melhorar
a performance de classificação. Várias abordagens já foram propostas para realizar a
combinação dos resultados individuais dos classificadores. Neste trabalho, é apresentada
uma abordagem de combinação de conjuntos de classificação múltirrótulo baseado na
técnica Modelos de Decisão para Comitês de Cadeias de Classificadores que incorpora a
exploração de correlações entre os rótulos no processo de fusão dos classificadores.
Na técnica de Perfis de Decisão, originalmente proposta para a fusão de classificadores
de rótulo único, estima-se um perfil de decisão por classe usando o mesmo conjunto de
treinamento que é usado para o conjunto de classificadores. A classificação para cada
instância invisível é obtida medindo a similaridade entre seu perfil de decisão e os perfis
de decisão das classes. O método proposto estima dois perfis de decisão por classe, um
representando a presença da classe e o outro representando sua ausência. Para cada nova
instância, é criado um novo perfil de decisão e a similaridade entre os perfis de decisão das
classes e o perfil de decisão da instância determina o conjunto de rótulos resultante. Para
cada rótulo analisado, informações sobre rótulos correlacionados é incorporada. O método
de fusão proposto é utilizado em um algoritmo tradicional e de eficiência comprovada de
comitê de classificadores múltirrótulo: Comitês de Cadeias de Classificadores. As evidências
empíricas indicam que o uso da adaptação dos Perfis de Decisão proposto pode melhorar o
desempenho em relação aos esquemas de combinação tradicionalmente usados na maioria
das métricas avaliadas melhorando o desempenho de um método de comitê de classificadores
já conhecido na literatura multirrótulo.