Oportunidades de pesquisaIniciação científica ou pós-graduação
|
|
(IC) Reconhecimento de padrões e machine learning
|
|
Processamento de imagens de documentosCom as várias iniciativas de digitalização de documentos, surgiu também o interesse pela extração de informações relativas ao conteúdo de documentos a partir de suas imagens. Algumas das informações de interesse são, por exemplo, a identificação da categoria de documentos (carta, memorando, formulário, manuscrito, etc), os temas abordados no documento, ou mesmo a conversão da imagem para o formato texto digital. A extração dessas informações é importante tanto para a análise do conteúdo como para busca eficiente de documentos por conteúdo. O processamento de imagens de documentos é uma etapa que faz parte do processo de extração dessas informações. Alguns problemas de processamento de imagens comumente tratados nessa área são: binarização de documentos, filtragem de ruído, restauração, segmentação de texto, detecção de componentes, análise de layout, entre outros. Uma vez que documentos variam muito em termos de tipo e tamanho de fontes, layout, espaçamentos, entre outros aspectos, desenhar algoritmos manualmente para esses problemas é uma tarefa pouco produtiva. Uma alternativa aos métodos manuais são as baseadas em aprendizado de máquina. Muitas das abordagens desse tipo dependem de imagens de treinamento, isto é, amostras de imagens antes e depois do processamento. Tais imagens são muitas vezes criadas manualmente. Nesta IC, o objetivo é selecionar um problema de processamento de imagens no contexto de processamento de imagens de documentos e aplicar um método baseado em aprendizado de máquina para resolver o problema. Para tanto, a IC envolve o estudo de conceitos, técnicas e métodos de processamento de imagens e machine learning, assim como uma parte prática que consiste na preparação das imagens de treinamento e a aplicação dos métodos de machine learning para o problema selecionado. |
|
Casamento entre árvores e grafosUma expressão matemática pode ser pensada como uma composição hierárquica, na qual os elementos atômicos são os símbolos e os níveis intermediários correspondem a subexpressões que se combinam para, no topo da hierarquia, formar a expressão completa. Uma hierarquia dessas pode ser representada por uma árvore. Supondo que é dada uma expressão modelo, cuja representação hierárquica é conhecida, e uma transcrição dessa expressão, gostaríamos de identificar os traços na transcrição que correspondem a cada símbolo da expressão modelo. Ao modelarmos a expressão transcrita por meio de um grafo, esse problema pode ser entendido como um problema de encontrar uma árvore no grafo que seja isomorfa à expressão modelo. |
|
Other topics
|
|