Cross-Domain Object Detection Using Unsupervised Image Translation and
Neural Style Transfer
Nome: VINICIUS FERRAÇO ARRUDA
Tipo: Dissertação de mestrado acadêmico
Data de publicação: 24/02/2022
Orientador:
Nome | Papel |
---|---|
THIAGO OLIVEIRA DOS SANTOS | Orientador |
Banca:
Nome | Papel |
---|---|
FILIPE WALL MUTZ | Examinador Externo |
THIAGO OLIVEIRA DOS SANTOS | Orientador |
THOMAS WALTER RAUBER | Examinador Interno |
Resumo: A adaptação de domínio de modo não supervisionado para detecção de objetos aborda a adaptação de detectores treinados em um domínio de origem para atuar com precisão em um domínio alvo desconhecido. Em aplicações do mundo real, é desejável que os detectores de objetos trabalhem com precisão, independentemente do domínio de aplicação (por exemplo, condições climáticas). Esses modelos têm a propriedade intrínseca de serem enviesados aos dados de treinamento e são conhecidos por não generalizar bem para dados desconhecidos. A maior disponibilidade de conjuntos de dados pode ser vista nos domínios mais prevalentes (por exemplo, dia ensolarado), mas para certas aplicações pode ser necessário treinar um modelo para atuar em um domínio menos predominante (por exemplo, dia com neblina). Para tal, se faz necessário realizar a coleta de um conjunto de dados de domínios menos predominantes. No entanto, a aquisição de um novo conjunto de dados envolve o laborioso processo de anotação de dados, mas a coleta de
grandes quantidades de dados sem anotação pode ser viável. Recentemente, métodos de adaptação de domínio não supervisionados que abordam o alinhamento das características intermediárias mostraram-se promissores, alcançando resultados no estado da arte. No entanto, esses métodos são trabalhosos de implementar e por serem métodos caixa preta são difíceis de interpretar. Embora tenham resultados promissores, ainda há espaço para
melhorias para fechar a lacuna de desempenho em relação ao modelo ideal (ao treinar com os dados do domínio alvo). Neste trabalho, propomos um método para gerar um conjunto de dados artificial no domínio alvo para treinar um detector de objetos. Empregamos um tradutor de imagem não supervisionado (CycleGAN) e um método de transferência de estilo neural (baseado em AdaIN) usando apenas dados anotados do domínio de origem e dados não anotados do domínio alvo. Nossas principais contribuições são a proposta de um método menos complexo de adaptação de domínio de modo não supervisionado para detecção de objetos, porém mais eficaz, que também tem uma interpretabilidade
aprimorada em relação aos métodos estado da arte. Os resultados em cenários do mundo
real para direção autônoma mostram melhorias significativas, superando os métodos estado
da arte na maioria dos casos, obtendo resultados ainda mais próximos do modelo ideal.