Curso de difusão: Introdução à Aprendizagem Estatística e à Ciência de Dados em R
Objetivo: Oferecer para a comunidade externa à Universidade de São Paulo um curso de fundamentos
teóricos em aprendizagem estatística e ciência de dados e também um treinamento prático usando a linguagem R,
considerando a grande demanda atual dos profissionais que atuam no mercado de trabalho por este tipo de conhecimentos/ferramentas.
Aproximar os temas de pesquisa desenvolvidos na Universidade para a comunidade externa, proporcionando uma ponte entre a Academia e
a comunidade em geral.
Público alvo: Graduados ou alunos de graduação de curso superior em qualquer área interessados em adquirir ou aperfeiçoar conhecimentos teóricos e práticos sobre aprendizagem estatística e ciência de dados na linguagem de programação R.
Pré-requisitos: Conhecimento prévio de probabilidade e estatística, operações com vetores e matrizes, cálculo.
ATENÇÃO: O curso está dirigido a pessoas com alguns conhecimentos prévios de probabilidade e estatística e uso de linguagens estruturadas como R. Sugerimos verificar o conteúdo da disciplina associada ao curso e a bibliografia que será utilizada.
Conteúdo do curso: O curso será realizado na modalidade EaD, pelo sistema Moodle da USP. O acesso ao sistema será possível mediante cadastro com CPF ou após a matrícula, com o cadastramento de uma senha USP. Nesse sistema serão disponibilizados
vídeos e materiais de estudo, assim como de aulas síncronas realizadas por Google Meet.
Os alunos deverão realizar tarefas e exercícios que deverão ser entregues no próprio sistema. Essas tarefas e exercícios serão corrigidos e
terão uma nota atribuída, que comporá a média final do curso. O conteúdo do curso corresponderá aos seguintes tópicos:
- Revisão de conceitos básicos de probabilidade e estatística: variáveis aleatórias, esperança, variância e viés. Conceitos básicos da aprendizagem estatística supervisionada.
- Modelos lineares para regressão.
- Diferentes tipos de erro. Decomposição do erro esperado "fora da amostra" em viés e variância. Avaliação e seleção de modelos, validação cruzada.
- Seleção de variáveis no modelo de regressão linear e regularização.
- Métodos de classificação: regressão logística, naive Bayes e k-vizinhos mais próximos.
- Árvores de decisão. Bagging, florestas aleatórias e boosting.
- Redes neurais, algoritmo gradiente descendente, gradiente descendente estocástico, regularização.
- Redes neurais convolucionais e recorrentes.
- Métodos para análise não supervisionada.
Bibliografia básica:
- G. James, D. Witten, T. Hastie & R. Tibshirani. An Introduction to Statistical Learning with Applications in R. Springer, 2013.
- T. Hastie, R. Tibshirani & J. Friedman. The Elements of Statistical Learning. 2nd edition. Springer, 2009.
- Y. Abu-Mostafa, M. Magdon-Ismail & H.T Lin. Learning from Data. AMLBook, 2012.
- B. Efron & J. Friedman. Computer Age Statistical Inference. Cambridge University Press, 2016.
- T. Hastie, R. Tibshirani & M. Wainwright. Statistical Learning with Sparsity. The Lasso and Generalizations. CRC Press, 2015.
- I. Goodfellow, Y. Bengio & A. Courville. Deep Learning. MIT Press. 2016
Ministrantes: Florencia Leonardi e Magno T. F. Severino
Dias e horários de aulas síncronas:
Turma 1: terças-feiras dàs 19:00 às 20:30
Turma 2: quartas-feiras dàs 19:00 às 20:30
Período: de 18 de abril a 24 de junho de 2022
Valor: 450,00 reais (única parcela). Oferecemos 10 bolsas com isenção de 100%, com base em avaliação socioeconômica. Para concorrer às bolsas, preencha este formulário e envie-o junto com os documentos comprobatórios até o dia 31 de março para .
Inscrição: de 10/03/2022 00:01 até 31/03/2022 23:59, pelo sistema Apolo. Para efetuar a inscrição, siga estas instruções:
- No canto superior esquerdo, acessar Inscrição on-line -> fazer inscrição;
- No campo Unidade, selecionar "Instituto de Matemática e Estatística";
- Selecionar o curso dentre os cursos disponíveis para inscrição on-line; e
- Digitar o CPF para começar o processo de inscrição.
- O cancelamento da inscrição com a devolução da taxa poderá ser feita até o início do curso.