Lane Marking Detection and Classification using Spatial-Temporal Feature Pooling
Nome: LUCAS TABELINI TORRES
Data de publicação: 31/07/2023
Banca:
Nome | Papel |
---|---|
FLAVIO MIGUEL VAREJAO | Examinador Interno |
GLADSTON JULIANO PRATES MOREIRA | Examinador Externo |
RODRIGO FERREIRA BERRIEL | Coorientador |
THIAGO OLIVEIRA DOS SANTOS | Presidente |
Resumo: O problema de detecção de faixas de trânsito tem sido pesquisado extensivamente nas últimas décadas,
especialmente com o advento do aprendizado profundo. Apesar dos inúmeros trabalhos propondo soluções para a
tarefa de localização (i.e., a de localizar as bordas das faixas de trânsito na imagem de entrada), a tarefa de
classificação não tem recebido a mesma atenção. De qualquer maneira, ter a informação do tipo da faixa,
especialmente da faixa atualmente ocupada pelo veículo, pode ser bastante útil em várias aplicações. Por exemplo,
dependendo do tipo da faixa, o veículo talvez não possa (pela lei) fazer uma ultrapassagem. Além disso, poucos
trabalhos exploram a informação temporal disponível nos vídeos capturados pelos veículos: a maioria faz uso da
abordagem single-frame. Neste trabalho, partindo do recém proposto modelo de detecção de faixas LaneATT, nós
propomos uma maneira de explorar a informação temporal e integrar a tarefa de classificação no modelo. Isso é
alcançado por meio da extração de features de múltiplos frames usando uma rede neural profunda (ao invés de
somente uma, como no LaneATT. Os resultados mostram que as modificações propostas podem melhorar o
desempenho de localização no benchmark em 2.34%, estabelecendo um novo estado-da-arte. Finalmente, uma
avaliação extensiva mostra que também é possível obter um alto desempenho de classificação (89.37%) que serve
como benchmark para a área de pesquisa.