Visual Global Localization Based on Deep Neural Networks for Self-Driving Cars

Nome: THIAGO GONÇALVES CAVALCANTE
Tipo: Dissertação de mestrado acadêmico
Data de publicação: 11/05/2022
Orientador:

Nomeordem decrescente Papel
CLAUDINE SANTOS BADUE Orientador

Banca:

Nomeordem decrescente Papel
AVELINO FORECHI SILVA Coorientador
CLAUDINE SANTOS BADUE Orientador
DENIS FERNANDO WOLF Examinador Externo
RENATO ANTÔNIO KROHLING Examinador Interno

Resumo: Neste trabalho, apresentamos um sistema de localização global visual baseado em Deep
Neural Networks (DNNs) para carros autônomos, denominado DeepVGL (Deep Visual Global
Localization), que recebe imagens em tempo real de uma câmera frontal instalada no teto do
carro e infere sua posição correspondente em coordenadas globais. Para tanto, o DeepVGL é
treinado com pares de coordenadas e imagens associadas pertencentes a conjuntos de dados de
veículos autônomos construídos com dados de sensores alinhados no tempo e no espaço por
meio de um processo de Localização e Mapeamento Simultâneo (SLAM). Para avaliar o
desempenho do DeepVGL, realizamos experimentos usando conjuntos de dados compostos por
imagens de câmeras coletadas por diferentes carros autônomos em viagens feitas em longos
intervalos de tempo (mais de 4 anos), incluindo mudanças significativas no ambiente, volume
de tráfego e condições climáticas, bem como diferentes horas do dia e estações do ano. Também
comparamos o DeepVGL com um sistema de localização global de última geração baseado em
WNN. Por fim, executamos experimentos usando conjuntos de dados compostos por imagens
da faixa LIDAR obtidas por um caminhão autônomo em viagens feitas em intervalos de tempo
razoáveis (mais de 3 meses). Os resultados experimentais mostram que o DeepVGL pode
estimar corretamente a localização global do carro autônomo em até 75% do tempo para uma
precisão de 0,2 me até 96% do tempo para uma precisão de 5 m. Os resultados também mostram
que o DeepVGL supera o WNN, que pode localizar corretamente o carro autônomo em até 76%
do tempo para precisão de 0,2 m, mas apenas até 89% do tempo para precisão de 5 m. Por fim,
os resultados mostram que o DeepVGL funciona melhor com imagens de alcance LIDAR do
que com imagens de câmera, localizando o caminhão autônomo em até 95% do tempo para
precisão de 0,2 m e 98% do tempo para precisão de 5 m.

Acesso ao documento

Acesso à informação
Transparência Pública

© 2013 Universidade Federal do Espírito Santo. Todos os direitos reservados.
Av. Fernando Ferrari, 514 - Goiabeiras, Vitória - ES | CEP 29075-910