Trabalho de Formatura - BCC (IME / USP)

Propostas de temas (pelos profs) para 2019

Última atualização: 26/fevereiro/2019


Dr. Marcelo Reis (Pesquisador Associado, LECC, Instituto Butantan)

    Gostaria de fazer seu TCC produzindo ciência em uma equipe interdisciplinar, numa das mais renomadas instituições brasileiras de pesquisa biomédica? Então venha trabalhar conosco no Laboratório Especial de Ciclo Celular (LECC) do Instituto Butantan, em um dos seguintes projetos:

    1. Desenvolvimento de um sistema de informação para avaliação da produtividade científica dos laboratórios do Instituto Butantan (projeto com bolsa PIBIT/CNPq garantida);

    2. Aplicação de técnicas de Machine Learning (em particular Deep Learning) em dados proteômicos baseados em espectrometria de massas para identificação de proteínas e tambémem estudos evolutivos (possibilidade de bolsa FAPESP);

    3. Inferência de modelos dinâmicos baseados em sistemas de ODEs, para simular a cinética do interruptor molecular Ras em linhagens celulares tumorais (possibilidade de bolsa FAPESP).

    Caso tenha interesse em uma ou mais das possibilidades listadas acima, escreva uma mensagem para marcelo.reis at butantan dot gov dot br, pesquisador associado ao LECC que já supervisionou diversos TCCs em edições anteriores da disciplina.




Prof. Alfredo Goldman

    Em um TCC prévio (LUNGY), foi desenvolvido um App para acompanhar exercícios físicos em ambientes passíveis de poluição. O App monitora os índices de poluentes e alerta o praticante quando os benefícios trazidos à saúde pelo exercício são anulados pelos males que podem ser causados pela poluição. No App desenvolvido, esse monitoramento é baseado em informações obtidas a partir da localização GPS do celular e de dados de estações de monitoramento. O objetivo será melhorar o monitoramento, incorporando informações provenientes de sensores.




Prof. Marcelo Finger

    Desenvolvimento de Verificador de Ontologias Probabilísticas

    Trata-se de uma linha de pesquisa de verificação de consistência. No caso, temos uma linguagem de modelagem eficiente de descrição lógica de ontologias, a qual foi enriquecida com expressões probabilísticas, visando aplicações práticas de modelagem e integração de grandes bases de conhecimento. Tais bases podem conter inconsistências, que são, em geral, muito complexas de detectar. Mas estamos desenvolvendo linguagens que permitem verificação eficiente.

    Ao final do processo, o aluno terá visto noções de lógicas de descrição, raciocínio probabilístico, álgebra linear e implementação eficiente de algoritmos. E terá desenvolvido habilidades de programação e inteligência artificial aplicada. Possibilidade de interação com pesquisadores da Alemanha envolvidos no mesmo projeto.

    Requisitos: saber programar em C/C++; Java e orientação objeto também ajuda. Reuniões quinzenais (sério)




Profs. Paulo Meirelles (UNIFESP), Fabio Kon, Renata Wasserman

    Contexto 1: Ecossistema do desenvolvimento do Kernel Linux
      Supervisor: Prof. Paulo Meirelles (UNIFESP)
      Co-Supervisor: Prof. Fabio Kon (IME-USP)

    1. Evolução dos testes e da integração contínua (CI) do Kernel Linux

      Dentre os maiores avanços recentes da engenharia de software destacam-se as áreas de testes e integração contínua (CI). Em especial, o uso de CI possibilitou entregas confiáveis e rápidas de novas funcionalidades em sistemas executando em produção. Apesar dos avanços em tal área, nota-se dois problemas: pouca sistematização da área e poucas integração com sistemas de mais baixo nível. Como exemplo de como o CI ainda não atingiu certas áreas, nota-se diversos esforços acontecendo em paralelo para consolidar tal área no Kernel Linux [1,2]. Apesar do empenho de diferentes vertentes do Kernel em consolidar um mecanismo de testes/CI, essa área ainda é um desafio do ponto de vista da pesquisa e da indústria.

      [1] https://lwn.net/Articles/772525/
      [2] https://github.com/kernelci/kernelci-doc/wiki


    2. Como contribuir e desenvolver driver para o GNU Linux

      Tivemos uma excelente experiência na disciplina de Laboratório de Programação Extrema com um grupo de alunos que contribuiu para o Kernel Linux, no segundo semestre de 2018, sendo responsável por 20% das contribuições no subsistema do IIO do Kernel Linux[1]. Com isso, foi desmistificado as dificuldades para contribuir com o GNU Linux - o maior, mais descentralizado e mais famoso projeto de software livre. Como conseguência, os alunos do BCC do IME criaram o FLUSP (Free/Libre/Open Source Software at USP)[2]. Nesse contexto, algumas sugestões de TCC são:

      • Desenvolvimento de robôs para minerar dados de comunidades de software livre (IRC, Listas e Repositórios do Kernel Linux)
      • Desenvolvimento de um dashboard para visualização dos logs do Kernel Linux
      • Melhorar as ferramentas de testes do subsistema gráfico do Kernel Linux [3]
      • Implementar protótipo de testes para os driver do IIO
      • Mover drivers do subsistema de IIO da staging (quarentena) para a árvore principal do Kernel Linux
      • Implementar novos drivers para o IIO
      • Evoluir um conjuntos de scripts para auxiliar no processo de desenvolvimento para Kernel Linux[4]
      • Avançar o estado da arte do Virtual Kernel ModeSetting [5]

      [1] https://flusp.ime.usp.br/achievements/
      [2] https://flusp.ime.usp.br
      [3] https://cgit.freedesktop.org/xorg/app/intel-gpu-tools/
      [4] https://github.com/rodrigosiqueira/kworkflow
      [5] https://dri.freedesktop.org/docs/drm/gpu/vkms.html#vkms


    Contexto 2: Desenvolvimento de aplicações para visualização espacial de dados de saúde da cidade de São Paulo

      Supervisor: Prof. Paulo Meirelles (UNIFESP);
      Co-Supervisores: Profs. Renata Wasserman e Fabio Kon (IME-USP)

      As tecnologias de Cidades Inteligentes emergem como uma solução para enfrentar problemas comuns em grandes centros urbanos, usando os recursos da cidade de forma eficiente e proporcionando serviços de qualidade para os cidadãos. Neste sentido, o IME-USP sedia o INCT da Internet do Futuro para Cidades Inteligentes - InterSCity, um consórcio de pesquisa multidisciplinar que tem como objetivo abordar os principais desafios de pesquisa em cidades inteligentes, com financiamento da FAPESP, CNPq e CAPES. Um dos objetivos de nosso INCT, é investigar abordagens e desenvolver aplicações para visualização espacial de dados de saúde de grandes cidades como o município de São Paulo, a partir de dados oficiais fornecidos pela Secretaria Municipal de Saúde de São Paulo (SMS-SP). A grande quantidade de dados heterogêneos sobre saúde nas grandes cidades torna necessário a criação de novas formas dinâmicas de visualização georreferenciada de dados da área da saúde. Nesse sentido, há diversas oportunidades de colaborações inerentes ao desenvolvimento dessas soluções, tanto em pesquisa quanto em desenvolvimento técnico. Portanto, este projeto visa oferecer oportunidades para que pesquisadores e gestores públicos possam contribuir com formas inovadoras para coleta, armazenamento, gestão, visualização e análise de grandes quantidades de dados de saúde de populações urbanas. Um primeira versão desta plataforma está disponível [2].

      Como sugestão de TCC neste contexto, temos:

      • Evoluir a camada de visualização dos dados (de Internações Hospitalares) para dar suporte à outros tipos de bases de dados (exemplo: Mortalidade e Nascidos Vivos também disponibilizados pela SMS-SP)
      • Estudo de técnicas de visualização de dados para o desenvolvimento de uma aplicação voltada para a análise de dados da base de Nascidos Vivos (SINASC)
      • Uso de algoritmos de Aprendizado de Máquina para encontrar padrões de distribuição das doenças pela cidade de São Paulo (a partir da base de Internações hospitalares que já trabalhamos)

      [1] http://interscity.org
      [2] http://healthdashboard.interscity.org




Prof. Daniel Macêdo Batista

    A Segurança da Informação (SI) é um elemento crítico para a sobrevivência de qualquer organização. Um incidente de segurança pode ter impactos críticos para o negócio e operação de uma instituição e, algumas vezes, irreversíveis. Portanto, é necessário implementar e operar uma gestão de segurança da informação adequada e eficaz. Existem diversos frameworks e boas práticas no mercado que apoiam a implementação de todos os processos envolvidos com a gestão de SI, como a ABNT NBR ISO/IEC 27001:2013. O desafio maior, atualmente, é avaliar continuamente a qualidade, o desempenho e a eficácia dos processos de SI. Há a carência de uma metodologia documentada e ferramentas, como planilhas e softwares, que permitam a avaliação de maturidade de processos de SI. Esse projeto tem com objetivo desenvolver uma ferramenta para avaliar processos de SI, tendo como base a principal referência no tema, a norma ABNT anteriormente citada. A ferramenta será genérica e poderá ser utilizada por qualquer instituição que deseje avaliar sua segurança da informação e definir um Plano de Melhoria.




Dr. Jorge Guevara (IBM research), Prof. Roberto Hirata

    Scikit Fuzzy Kernel - A Toolkit for Kernels on Fuzzy Sets for Data mining and Machine Learning Applications

    Detalhes podem ser encontardos neste pdf




Prof. Fabio Kon

    1. Uso de técnicas computacionais nas artes plásticas
      • Supervisor: Fabio Kon
        Co-supervisor: Jê Américo

        Explorar o uso de conceitos e técnicas computacionais para a produção de arte visual envolvendo algoritmos de IA, aprendizado de máquina, autômatos celulares ou outras técnicas de escolha do aluno e dos supervisores da pesquisa. O trabalho será desenvolvido em parceria com o artista plástico Jê Américo (https://galeriacaribe.com.br/art-je-americo) e poderá tanto ser uma extensão de um trabalho realizado no ano passado (link), quanto uma nova iniciativa desde o início.



    2. Padrões GoF para Microserviços
      • Supervisor: Fabio Kon
        Co-supervisor: Joe Yoder

        A ideia desse projeto de TCC para alunos que tenham bastante interesse em arquitetura de software, OO e microsserviços é estudar os 23 padrões de projeto OO do livro GoF e analisar quais deles podem ser mapeados para sistemas baseados em microsserviços e quais deles não permitem um mapeamento natural. Esse TCC seria coorientado por Joe Yoder (https://joeyoder.com/) e, portanto, preferencialmente deveria ser escrito em inglês.



    3. Desenvolvimento de aplicativo móvel e base de dados para avaliação e registro do hábito miccional
      • Somos um grupo de pesquisa do Laboratório de Fisioterapia em Saúde da Mulher da Faculdade de Medicina da USP e temos um projeto que consiste no desenvolvimento de um aplicativo móvel para plataforma Android e IOS, que registre o hábito miccional diário e contribua para o diagnóstico e tratamento da incontinência urinária. O objetivo é fazer em versão eletrônica o diário miccional que normalmente é preenchido em papel, o que dificulta a adesão da paciente e o compilamento e interpretação dos dados pelos profissionais de saúde. O projeto ainda contempla a organização de um banco de dados que permita análises mais complexas. O projeto já está aprovado pelo comitê de ética em pesquisa e será útil para atividade clínica e científica. O aplicativo será de uso livre e gratuito, o que permitirá grande utilização da ferramenta e futuras publicações.

        Coordenadora do laboratório: Profa Dra Elizabeth Alves Ferreira (Faculdade de Medicina - USP)

        Supervisor do TCC: Fabio Kon (IME - USP)

        Colaboradoras: Leda Silveira

        Acadêmicas: Daniela Fantin, Débora Porto e Natalie Vaccari




Prof. Renata Wasserman

    1. Integração semântica de big data no município de São Paulo: dados sobre a realidade materno infantil no SUS

    Supervisora: Renata Wasserman
    Co-supervisora: Débora Lina Ciriaco (doutoranda)

    No Brasil, as informações dos pacientes do SUS estão espalhadas por mais de 45 sistemas que possuem históricos e finalidades específicas, sendo independentes e heterogêneos. O acesso a essas informações muitas vezes se dá de maneira manual ou semi-automática, podendo levar dias para saber por quais procedimentos o paciente foi submetido no último ano, por exemplo. A integração semântica dessas bases de dados é uma solução para profissionais de diversas áreas obterem informações de maneira mais simples. A partir dessa necessidade surgiu nosso projeto. Integrante do INCT de Cidades Inteligentes, o projeto possui uma aplicação real na sociedade utilizando conceitos de inteligência artificial e data science para big data. Nosso objetivo é utilizar ontologias na integração das bases de dados e em seguida apresentar os dados de um modo inovador para os gestores da saúde e para a população. Para isso temos parceria com a Faculdade de Saúde Pública da USP e a Secretaria Municipal da Saúde onde obtivemos o acesso às bases do SUS da cidade de São Paulo, algumas delas gerando cerca de 30GB de dados por mês. O projeto tem três frentes, que embora integradas podem ser desenvolvidas independentemente: Semântica, Banco de dados e Análise e Visualização dos dados. Segue algumas atividades a serem desenvolvidas:

    • Participar do processo de criação e integração de ontologias
      • Especificação das questões de competência;
      • Criação de diagramas;
      • Criação de regras de integração;
      • Validação de ontologias;
      • Integração das ontologias com as bases de dados;
      • Comparação entre os plugins da solução LDM (Linked Data Mashup) com o ONTOP;

    • Participar da curadoria das bases de dados:
      • Desenvolvimento de plugins para conversão de diversos formatos de dados - dbf, csv, rdf;
      • Avaliação da qualidade dos dados;
      • Criação de data warehouse: criação de um repositório para as bases, criação de um id único para os indivíduos;
      • Otimização das consultas nas bases de dados e do uso dos dados;

    • Participar do processo de data linkage:
      • Desenvolver melhorias dos plugins de data linkage como Soundex e L_dif;
      • Comparação entre os plugins da solução LDM e o desenvolvido pela Secretaria Municipal de Saúde;
      • Replicar as técnicas de data linkage utilizadas no CIDACS com os dados da Secretaria Municipal de Saúde;

    • Participar da análise dos dados:
      • Aplicar algoritmos de machine learning para reconhecimento de padrões relacionados ao problema de pesquisa;
      • Integrar a solução de ontologias à plataforma de visualização de dados;


    2. Visualização de Dados

    A Fundação Seade é uma das principais produtoras de dados e estatísticas paulistas. As bases de dados do Seade são ricas em informações Socioeconômicas e Demográficas sobre o Estado de São Paulo e seus municípios. Por exemplo, há bases com longas séries históricas sobre nascimentos, óbitos, casamentos, produto interno bruto, investimentos anunciados, emprego, desemprego, eleições, dentre outras.

    O farto material da Fundação Seade nem sempre é de fácil compreensão. Por isso, a instituição vem fazendo tentativas de explicar seus dados de forma visual. Por exemplo, as iniciativas VisualizeSP, DataVisus e as publicações no Facebook usam ferramentas e técnicas simples para buscar deixar os dados mais acessíveis.

    DESAFIO: A partir da escolha de um tema, criar visualização que explique uma grande quantidade de dados complexos de forma simples, agradável e intuitiva. Exemplo: http://www.seade.gov.br/visualizacao/desmembramentosp/



    3. Coleta de Dados

    A Relação de Nomes e Cargos consistia em uma base de dados com nome e contato de todos os ocupantes de postos de liderança de todos os órgãos públicos nos três poderes do Estado de São Paulo e seus municípios. Por exemplo, havia dados do governador, dos prefeitos, secretários estaduais e municipais, dirigentes de órgãos da administração direta e indireta (Ex: Autarquias, Fundações, Empresas públicas, Institutos, etc.), Deputados e Vereadores.

    A alimentação de dados era manual, a partir de consultas a fontes como diário oficial, sites dos órgãos e até mesmo por meio de ligações telefônicas a representantes dos órgãos. O produto foi descontinuado devido ao grande esforço operacional para sua atualização.

    DESAFIO: Propor solução para automatizar a alimentação e atualização das informações sobre os dirigentes públicos do Estado de São Paulo.