ANALYSIS OF THE IMPACTS OF LABEL
DEPENDENCE IN MULTI-LABEL LEARNING
Name: LUCAS HENRIQUE SOUSA MELLO
Type: PhD thesis
Publication date: 19/10/2021
Advisor:
Name | Role |
---|---|
FLÁVIO MIGUEL VAREJÃO | Advisor * |
Examining board:
Name | Role |
---|---|
FLÁVIO MIGUEL VAREJÃO | Advisor * |
FRANCISCO DE ASSIS BOLDT | External Examiner * |
THIAGO OLIVEIRA DOS SANTOS | Internal Examiner * |
THOMAS WALTER RAUBER | Internal Examiner * |
Summary: \\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\"Conclusões em aprendizado multirrótulo geralmente são tiradas através de experimentos
usando conjuntos de dados reais de referência, o que é uma boa prática ao comparar
resultados. No entanto, dificilmente demonstra ou mostra claramente como a dependência
entre rótulos afeta o desempenho e o comportamento de algoritmos multirrótulo. Uma abordagem razoável para resolver tal problema consiste em adotar uma formulação matemática ou estatística do problema e usá-lo para elaborar provas teóricas. Outra abordagem consiste em elaborar experimentos em um ambiente controlado, onde a dependência entre rótulos pode ser mais facilmente controlada e analisada, o que é o caso de muitos trabalhos baseados em conjuntos de dados artificiais. Ambas abordagens são adotadas nesta tese para entender o papel da dependência de rótulos na aprendizagem multirrótulo.
O trabalho realizado nesta tese é composto de várias contribuições à análise de algoritmos multirrótulo de uma perspectiva estatística. Uma contribuição é que o método calibrated label ranking é um algoritmo que pode ter um desempenho extremamente baixo quando empregado em um cenário muito particular em que a dependência entre rótulos está presente, devido à maneira como a comparação em pares de rótulos é feita pelo algoritmo. Outra contribuição é que a dependência entre rótulos a otimização de coverage esperado é um problema NP-difícil. Por final, é apresentada uma forma de criar um ambiente experimental em que a dependência entre rótulos possa ser convenientemente controlada com o objetivo de comparar o desempenho entre os métodos de aprendizado multirrótulo.\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\"