Curso de difusão: Introdução à Aprendizagem Estatística e à Ciência de Dados em R

Objetivo: Oferecer para a comunidade externa à Universidade de São Paulo um curso de fundamentos teóricos em aprendizagem estatística e ciência de dados e também um treinamento prático usando a linguagem R, considerando a grande demanda atual dos profissionais que atuam no mercado de trabalho por este tipo de conhecimentos/ferramentas. Aproximar os temas de pesquisa desenvolvidos na Universidade para a comunidade externa, proporcionando uma ponte entre a Academia e a comunidade em geral.

Público alvo: Graduados ou alunos de graduação de curso superior em qualquer área interessados em adquirir ou aperfeiçoar conhecimentos teóricos e práticos sobre aprendizagem estatística e ciência de dados na linguagem de programação R.

Pré-requisitos: Conhecimento prévio de probabilidade e estatística, operações com vetores e matrizes, cálculo.

ATENÇÃO: O curso está dirigido a pessoas com alguns conhecimentos prévios de probabilidade e estatística e uso de linguagens estruturadas como R. Sugerimos verificar o conteúdo da disciplina associada ao curso e a bibliografia que será utilizada.

Conteúdo do curso: O curso será realizado na modalidade EaD, pelo sistema Moodle da USP. O acesso ao sistema será possível mediante cadastro com CPF ou após a matrícula, com o cadastramento de uma senha USP. Nesse sistema serão disponibilizados vídeos e materiais de estudo, assim como de aulas síncronas realizadas por Google Meet. Os alunos deverão realizar tarefas e exercícios que deverão ser entregues no próprio sistema. Essas tarefas e exercícios serão corrigidos e terão uma nota atribuída, que comporá a média final do curso. O conteúdo do curso corresponderá aos seguintes tópicos:

  1. Revisão de conceitos básicos de probabilidade e estatística: variáveis aleatórias, esperança, variância e viés. Conceitos básicos da aprendizagem estatística supervisionada.
  2. Modelos lineares para regressão.
  3. Diferentes tipos de erro. Decomposição do erro esperado "fora da amostra" em viés e variância. Avaliação e seleção de modelos, validação cruzada.
  4. Seleção de variáveis no modelo de regressão linear e regularização.
  5. Métodos de classificação: regressão logística, naive Bayes e k-vizinhos mais próximos.
  6. Árvores de decisão. Bagging, florestas aleatórias e boosting.
  7. Redes neurais, algoritmo gradiente descendente, gradiente descendente estocástico, regularização.
  8. Redes neurais convolucionais e recorrentes.
  9. Métodos para análise não supervisionada.
Para cada um destes tópicos são apresentados exemplos práticos na linguagem de programação R.

Bibliografia básica:
  1. G. James, D. Witten, T. Hastie & R. Tibshirani. An Introduction to Statistical Learning with Applications in R. Springer, 2013.
  2. T. Hastie, R. Tibshirani & J. Friedman. The Elements of Statistical Learning. 2nd edition. Springer, 2009.
Bibliografia complementar:
  1. Y. Abu-Mostafa, M. Magdon-Ismail & H.T Lin. Learning from Data. AMLBook, 2012.
  2. B. Efron & J. Friedman. Computer Age Statistical Inference. Cambridge University Press, 2016.
  3. T. Hastie, R. Tibshirani & M. Wainwright. Statistical Learning with Sparsity. The Lasso and Generalizations. CRC Press, 2015.
  4. I. Goodfellow, Y. Bengio & A. Courville. Deep Learning. MIT Press. 2016
Carga horária total: 40h

Ministrantes: Florencia Leonardi e Magno T. F. Severino

Dias e horários de aulas síncronas:
Turma 1: terças-feiras dàs 19:00 às 20:30
Turma 2: quartas-feiras dàs 19:00 às 20:30

Período: de 18 de abril a 24 de junho de 2022

Valor: 450,00 reais (única parcela). Oferecemos 10 bolsas com isenção de 100%, com base em avaliação socioeconômica. Para concorrer às bolsas, preencha este formulário e envie-o junto com os documentos comprobatórios até o dia 31 de março para .

Inscrição: de 10/03/2022 00:01 até 31/03/2022 23:59, pelo sistema Apolo. Para efetuar a inscrição, siga estas instruções:
  1. No canto superior esquerdo, acessar Inscrição on-line -> fazer inscrição;
  2. No campo Unidade, selecionar "Instituto de Matemática e Estatística";
  3. Selecionar o curso dentre os cursos disponíveis para inscrição on-line; e
  4. Digitar o CPF para começar o processo de inscrição.
  5. O cancelamento da inscrição com a devolução da taxa poderá ser feita até o início do curso.
Todos os aprovados (75% de frequência mínima e acima de 7,0 de média final) terão direito ao certificado oficial da USP.