Predição de Mapas de Profundidades a Partir de Imagens Monoculares por Redes Neurais Sem Peso
Nome: HELIO PERRONI FILHO
Tipo: Dissertação de mestrado acadêmico
Data de publicação: 26/02/2010
Orientador:
Nome | Papel |
---|---|
ALBERTO FERREIRA DE SOUZA | Orientador |
Banca:
Nome | Papel |
---|---|
ALBERTO FERREIRA DE SOUZA | Orientador |
Resumo: Um problema central para a Visão Computacional é o de depth estimation (estimativa de profundidades) isto é, derivar, a partir de uma ou mais imagens de uma cena, um depth map (mapa de profundidades) que determine as distâncias entre o observador e cada ponto das várias superfícies capturadas. Não é surpresa, portanto, que a abordagem de stereo correspondence (correspondência estéreo), tradicionalmente usada nesse problema, seja um dos tópicos mais intensamente investigados do campo.
Sistemas de correspondência estimam profundidades a partir de características binoculares do par estéreo mais especificamente, a diferença de posição de cada ponto entre as imagens de um par. Além dessa informação puramente geométrica, imagens contém uma série de características monoculares tais como variações e gradientes de textura, variações de foco, padrões de cores e reflexão, etc que podem ser exploradas para derivar estimativas de profundidade. Para isso, entretanto, é preciso acumular uma certa quantidade de conhecimento a priori, uma vez que há uma ambiguidade intrínseca entre as características de uma imagem e variações de profundidade.
Através de suas pesquisas com sistemas de aprendizado de máquina baseados em Markov Random Fields (MRFs), Ashutosh Saxena demonstrou ser possível estimar mapas de profundidades com grande precisão a partir de imagens monoculares estáticas. Sua abordagem, entretanto, carece de plausibilidade biológica, visto que não há correspondência teórica conhecida entre MRFs e as redes neurais do cérebro humano.
Motivados por sucessos anteriores na aplicação de Weightless Neural Networks (Redes Neurais Sem Peso, ou RNSP's) a problemas de visão computacional, neste trabalho objetivamos investigar a efetividade da aplicação de RNSPs ao problema de estimar mapas de profunidades. Com isso, esperamos alcançar uma melhoria em relação ao sistema baseado em MRFs de Saxena, além de desenvolver uma arquitetura mais útil para a avaliação de hipóteses sobre o processamento de informações visuais no córtex humano.