Download como arquivo ICAL
Mestrado: "Redes Neurais Convolucionais Aplicadas ao Projeto de Operadores de Imagens"
Sexta-feira 08 Dezembro 2017, 14:00
Contato: Este endereço de email está sendo protegido de spambots. Você precisa do JavaScript ativado para vê-lo.

Candidato: André Vinicius Lopes

 

Orientador: Prof. Dr. Roberto Hirata Junior

 

Resumo: O projeto de W-operadores de imagens requer a estimação de um operador local a partir
de exemplos de treinamento e da indução de um classificador baseado em aprendizado de
máquina para a classificação de exemplos pouco, ou nunca, observados no treinamento.
Nos últimos anos, a área de aprendizado de máquina passou por um avanço muito grande
devido às redes neurais convolucionais (CNN). Esse avanço é principalmente devido ao poder
de representação das redes neurais e pelo fato das redes convolucionais serem efetivas na
extração de características locais. Devido a isso, elas estão presentes em muitas soluções do
estado da arte de diversos problemas de visão computacional [MPGC17, HGC+17, FTM+17,
MZY+17, CGW+17].
Neste trabalho, estudamos e exploramos o poder de representação das CNNs no contexto
do projeto de W-operadores de imagens. Integramos implementações públicas e bastante
maduras de CNN a uma biblioteca de projeto de W-operadores desenvolvida pelo nosso
grupo (TRIOS) e testamos diversas estratégias para segmentar imagens de níveis de cinza
ou, ainda, classificar os padrões de intensidades em níveis de cinza observados através de
uma janela W em poucos rótulos (em geral, dois rótulos, ou 0, ou 1).
Para validar a proposta, usamos 2 conjuntos de dados de imagens de fundo de olho,
chamados de DRIVE e STARE, os quais já são um padrão na área de imagens para a
segmentação das veias da retina e também em um conjunto de dados chamado de STAFF
[KFV+13, VKFJ13], o qual é uma variação do banco de dados CVC-MUSCIMA [FDGL12]
e tem o objetivo de segmentar notas musicais em partituras. Os resultados obtidos mostram
que, para uma janela razoavelmente grande, os resultados são satisfatórias ao se comparar
com soluções específicas do estado da arte, as quais utilizam heurísticas de pré e pósprocessamento.
Palavras-chave: redes neurais, redes neurais convolucionais, deep-learning, operadores de
imagem.

Local SAla 07 - Bloco B do IME-USP