====== Estatística Descritiva (MAE0217) ====== **Julio da Motta Singer** (sala A-202)\\ **Horário**: 3a feira das 8:00h às 9:40min e 5a feira das 10:00h às 11:40min\\ **Sala**: B-1\\ **Monitor**: José Valdenir de Oliveira Junior (denividal@ime.usp.br) \\ **Atendimento**: 5a feira das 12:00 às 13:00 (Sala de monitores, Bloco B) * **Programa** - Introdução - Estatística descritiva e inferência estatística - Tipos de dados - Obtenção de dados - Bancos de dados - Ordem de grandeza, precisão e arredondamento de dados quantitativos - Proporções e porcentagens - Taxas e números índices - Sugestões para construção e apresentação de gráficos e tabelas\\ \\ - Representação gráfica e tabular de distribuição de dados - Tabelas de frequências - Gráficos de barras e do tipo torta (pizza) - Histogramas - Função de distribuição empírica\\ \\ - Medidas resumo - Medidas de posição - Medidas de dispersão - Medidas de assimetria e curtose - Gráficos do tipo caixa (“box plots”)\\ \\ - Modelos para distribuições de frequências - Distribuições de probabilidade - Gráficos de probabilidade (ou do tipo QQ) - Estatística de Pearson para avaliação de aderência\\ \\ - Associação entre duas variáveis qualitativas - Tabelas de contingência - Coeficientes de associação - Sensibilidade e especificidade - Risco relativo - Razão de chances\\ \\ - Associação entre uma variável quantitativa e uma variável qualitativa - Gráficos de médias - Gráficos de perfis - Homogeneidade de distribuições (Análise de variância com um fator) - Regressão logística\\ \\ - Associação entre duas variáveis quantitativas - Gráficos de dispersão - Correlação linear - Concordância - Gráficos de perfis - Regressão linear simples - Suavização\\ \\ - Associação entre três ou mais variáveis - Tabelas de contingência de múltiplas entradas - Distribuições multivariadas - Matrizes de covariâncias - Análise de variância com dois ou mais fatores - Regressão linear múltipla\\ \\ - Outros tópicos - Elaboração de relatórios técnicos - Análise de Sobrevivência e Tábuas atuariais - Modelos estatísticos - Parametrização e identificabilidade - Noções de inferência estatística - Estimação pontual e por intervalos - Testes de hipóteses * **Bibliografia** //"Chegarei aonde puder, rematou o Sr. José com uma serenidade que não parecia ser sua. Como se fosse essa a conclusão lógica do que tinha pensado,\\ entrou numa papelaria e comprou um grosso caderno de folhas pautadas, dos usados pelos estudantes para apontar as matérias de ensino\\ à medida que julgam que as vão aprendendo."//\\ José Saramago, Todos os nomes. - Anderson, A.J.B. (1989). **Interpreting data: a first course in Statistics.** London: Chapman and Hall. - Berry, D. A. (1996). **Statistics: A Bayesian perspective.** Belmont, CA: Duxbury Press. - Bussab, W.O. (1986). **Análise de variância e de regressão.** São Paulo: Atual. - Bussab, W.O. e Morettin, P.A. (2017). **Estatística Básica, 9a Edição**. São Paulo: Saraiva. - Bussab, W.O., Miazaki, E. e Andrade, D.F. (1990). **Introdução à análise de agrupamentos.** São Paulo: Associação Brasileira de Estatística. - Caulcutt, R. and Boddy, R. (1983). **Statistics for analytical chemists.** London: Chapman and Hall. - Chambers, J.M., Cleveland, W.S. e Tukey, P.A. (1983). **Graphical methods for data analysis.** Boston: Duxbury Press. - Cleveland, W.M. (1993). **Visualizing data.** Summit, New Jersey: Hobart Press. - Cleveland, W.M. (1994). **The elements of graphing data.** Summit, New Jersey: Hobart Press. - Ehrenberg, A.S.C. (1981). The problem of numeracy. **The American Statistician, 35**, 67-71. - Fienberg, S.E. (1979). Graphical methods in Statistics. **The American Statistician, 33**, 165-178. - Hosmer, D.W. and Lemeshow, S. (2000). **Applied logistic regression**. New York: Wiley - James, G., Witten, D., Hastie, T. and Tibshirani, R. (2014). **An Introduction to Statistical Learning** with Applications in R. New York: Springer. - Kleinbaum, D.G (1996). **Survival analysis.** New York: Springer-Verlag. - Loether, H.J. and McTavish, D.G. (1976). **Descriptive and inferential Statistics: An introduction.** Boston: Allyn and Bacon, Inc. - Magalhães, M.N. e Lima, A.C.P. (2013). **Noções de Probabilidade e Estatística, 7a. edição, revista, 2a. reimpressão.** São Paulo: EDUSP. - Morettin, P.A. e Singer, J.M. (2021). **Estatística e Ciência de Dados (versão parcial em elaboração).** \\ http://www.ime.usp.br/~jmsinger/MAE0217/cdados2021out12.pdf \\ - Murteira, B.F.J. e Black, G.H.J. (1983). **Estatística descritiva.** Lisboa: McGraw-Hill. - Tufte, E.R. (1983). **The visual display of quantitative information.** Cheshire, Conn.: Graphics Press. - Tukey, J.W. (1977). **Exploratory data analysis.** Reading, Mass: Addison Wesley. - Tukey, J.W. (1990). Data-based graphics: visual display in the decades to come. **Statistical Science, 5**, 327-339. - Runyon, R.P. and Haber, A. (1991). **Fundamentals of behavioral statistics, 7th edition.** New York: McGraw-Hill. - Peatman, J.G. (1947). **Descriptive and sampling statistics.** New York: Harper & Brothers. - Wainer, H. (1984). How to display data badly. **The American Statistician, 38**, 137-147. * **Motivação para estudar** * - Vídeo interessante: https://www.youtube.com/watch?v=q_llWwVsZ_U * **Recursos computacionais** * - Utilizaremos preferencialmente o pacote estatístico R (domínio público). Documentação para o pacote (inclusive em português) pode ser encontrada no sítio http://www.r-project.org/ * - Os alunos poderão utilizar os computadores do CEC (Centro de Ensino de Computação). * **Avaliação** - **Exercícios** (20%)\\ Grupos de 7 alunos. - **Provas** (80%)\\ Datas: 16/04/2020 e 18/06/2020\\ Duração: 2 horas (sem prorrogação) - **Critério de aprovação**: nota mínima = 5.0 e frequência mínima = 70% - **Reavaliação**: - **Notas**: http://www.ime.usp.br/~jmsinger/MAE0217/mae02172020notas.xlsx * **Conjuntos de dados** * **Listas** - Lista 1: Exercícios 4, 5 e 6 do capítulo 2 e 1 (analise uma variável de cada tipo), 6, 7, 12, 15, 17 18, 25 28 e 32 do Capítulo 3 de Morettin e Singer (2020). Entrega em 26/03/2020. - Lista 2: Exercício 33 do Capítulo 3 e Exercícios 1, 4, 5, 7, 12, 14, 19 e 23 do Capítulo 4 de Morettin e Singer (2020 versão março). Entrega em 16/04/2020. - Lista 3 Exercícios de Morettin e Singer (2020). Exercícios 1, 4, 8, 9 e 10 do Capítulo 5 de Morettin e Singer (2020 versão abr20). Entrega em 07/05/2020. - Lista 4 Exercícios de Morettin e Singer (2020). Exercícios 1, 2, 3, 5, 7 e 15 do Capítulo 6 de Morettin e Singer (2020 versão mai14). Entrega em 28/05/2020. - Lista 5 Exercícios de Morettin e Singer (2020). Exercícios 18, 19, 20, 21 e 22 do Capítulo 6 e 5 do Capítulo 8 de Morettin e Singer (2020 versão jun03). Entrega em 18/06/2020. - Lista 6 Exercícios de Morettin e Singer (2020). Exercícios 3 e 4 do Capítulo 7 de Morettin e Singer (2020 versão jun21). Entrega em 30/06/2020. - Estudo dirigido: http://www.ime.usp.br/~jmsinger/MAE0217/ANOVA.pdf - Link para detalhes sobre modelagem de pandemias: https://www.youtube.com/watch?v=gSqIwXl6IjQ&feature=youtu.be * **Aulas no período de quarentena** * Aulas virtuais: terças às 08:30 e quintas às 10:00 via Google meet. * Link para as aulas de terça feira: meet.google.com/rgd-ypdy-ekb * Link para as aulas de quinta feira: meet.google.com/hsv-pwms-ass