ANALYSIS OF THE IMPACTS OF LABEL
DEPENDENCE IN MULTI-LABEL LEARNING
Nome: LUCAS HENRIQUE SOUSA MELLO
Tipo: Tese de doutorado
Data de publicação: 19/10/2021
Orientador:
Nome![]() |
Papel |
---|---|
FLÁVIO MIGUEL VAREJÃO | Orientador |
Banca:
Nome![]() |
Papel |
---|---|
THOMAS WALTER RAUBER | Examinador Interno |
Páginas
Resumo: \\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\"Conclusões em aprendizado multirrótulo geralmente são tiradas através de experimentos
usando conjuntos de dados reais de referência, o que é uma boa prática ao comparar
resultados. No entanto, dificilmente demonstra ou mostra claramente como a dependência
entre rótulos afeta o desempenho e o comportamento de algoritmos multirrótulo. Uma abordagem razoável para resolver tal problema consiste em adotar uma formulação matemática ou estatística do problema e usá-lo para elaborar provas teóricas. Outra abordagem consiste em elaborar experimentos em um ambiente controlado, onde a dependência entre rótulos pode ser mais facilmente controlada e analisada, o que é o caso de muitos trabalhos baseados em conjuntos de dados artificiais. Ambas abordagens são adotadas nesta tese para entender o papel da dependência de rótulos na aprendizagem multirrótulo.
O trabalho realizado nesta tese é composto de várias contribuições à análise de algoritmos multirrótulo de uma perspectiva estatística. Uma contribuição é que o método calibrated label ranking é um algoritmo que pode ter um desempenho extremamente baixo quando empregado em um cenário muito particular em que a dependência entre rótulos está presente, devido à maneira como a comparação em pares de rótulos é feita pelo algoritmo. Outra contribuição é que a dependência entre rótulos a otimização de coverage esperado é um problema NP-difícil. Por final, é apresentada uma forma de criar um ambiente experimental em que a dependência entre rótulos possa ser convenientemente controlada com o objetivo de comparar o desempenho entre os métodos de aprendizado multirrótulo.\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\"