Feature Selection for Fault Detection in Industrial Processes: a SHAP values approach
Nome: ALEXANDRE ROSSETO LEMOS
Data de publicação: 01/10/2024
Banca:
Nome | Papel |
---|---|
CELSO JOSE MUNARO | Coorientador |
FRANCISCO DE ASSIS BOLDT | Examinador Externo |
KARIN SATIE KOMATI | Examinador Externo |
THOMAS WALTER RAUBER | Presidente |
Resumo: Falhas em processos industriais podem causar deteriorização de equipamentos,
colocar em risco a segurança de trabalhadores, prejudicar a produtividade da
operação e reduzir a lucratividade, podendo levar inclusive a necessidade de paradas
no processo para manutenção. Com o avanço da Inteligência Artificial, o uso
de algoritmos de Aprendizado de Máquinas em tarefas de detecção de falhas
vem sendo bastante utilizado. Dados industriais constumam ser extremamente
complexos devido a alta quantidade de características presentes em processos
industriais, fazendo a utilização de algoritmos para seleção de características ser
uma etapa fundamental. Nesse estudo, foi elaborada uma metodologia para seleção
de caractesríticas que funciona em duas etapas: a primeira utiliza um algoritmo
para realizar a ordenação inicial das características e a segunda utiliza Sequential
Forward Selection para obtenção do subconjunto otimizado de características. Foi
proposto a utilização do algoritmo SHAP para realizar a ordenação inicial das
características, expandindo o seu uso para além da interpretabilidade de modelos.
Os resultados obtidos com o SHAP foram então comparados com os resultados
obtidos utilizando algoritmos consolidados na literatura para realizar a ordenação
inicial das características: o mRMR e o ReliefF. Em 16 das 21 falhas analisadas, a
utilização do SHAP obteve resultados superiores em termos de F1-score e FDR. O
método proposto obteve uma média de F1-score 3.34% e 5.96% e uma média de FDR
4.74% e 8.21% superiores aos obtidos pelo mRMR e ReliefF, respectivamente. Além
disso, a metodologia proposta selecionou, em média, 34% menos características que
o mRMR e 40% menos características que o ReliefF. Os subconjuntos obtidos pelo
método proposto foram subsequentemente utilizados em diferentes classificadores,
obtendo, para a grande maioria das falhas, resultados semelhantes e uma média de
F1-score superior a 85% e uma média de FDR superior a 80%. O bom resultado do
último experimento reafirma a qualidade do subconjunto de características obtido
e reforça o bom desempenho da utilização do SHAP como algoritmo de ordenação
de importância de característica e da metodologia de seleção de característica
desenvolvida.