Nesta página apresentamos uma análise dos casos de infectados pelo vírus Sars-CoV2 (novo coronavírus) reportados diariamente em diferentes países,
nos estados e algumas cidades brasileiras.
A análise está baseada no ajuste, a partir de técnicas de seleção de modelos e detecção de pontos de mudança,
de uma funcão de regressão utilizando splines. Este trabalho ainda está em desenvolvimento, mas uma versão preliminar
da metodologia pode ser consultada neste preprint. O código em R utilizado para a
análise e geração dos gráficos também pode ser baixado aqui.
Clicando nos botões abaixo, você verá gráficos de países, estados e cidades brasileiras, e as previsões para os próximos 7 dias.
Os resultados foram obtidos usando splines lineares nos dados em escala logarítmica (modelo 1) e splines cúbicos naturais na escala linear (modelo 2).
Os dados foram suavizados, consideramos para cada data a média da observação do dia e dos seis dias anteriores.
As predições são obtidas a partir da função ajustada, para o período seguinte de 7 dias.
Em cada gráfico abaixo, barras cinzas indicam o número diário de casos em cada localidade (média de 7 dias consecutivos).
A linha sólida é o ajuste obtido pelo modelo para a variável em questão (média de 7 dias consecutivos).
A linha pontilhada é a previsão para os próximos 7 dias. A área sombreada indica o intervalo das estimativas.
Barras vermelhas indicam o número de mortes em cada localidade, considerando a mesma suavização (média de 7 dias consecutivos).
Linhas verticais tracejadas indicam datas em que houve mudanças no comportamento da curva de novos casos.
Os dados foram suavizados, consideramos para cada data a média da observação do dia e dos seis dias anteriores.
As predições são obtidas a partir da função ajustada, para o período seguinte de 7 dias.
Em cada gráfico abaixo, barras cinzas indicam o número diário de casos em cada localidade (média de 7 dias consecutivos).
A linha sólida é o ajuste obtido pelo modelo para a variável em questão (média de 7 dias consecutivos).
A linha pontilhada é a previsão para os próximos 7 dias. A área sombreada indica o intervalo das estimativas.
Barras vermelhas indicam o número de mortes em cada localidade, considerando a mesma suavização (média de 7 dias consecutivos).
Linhas verticais tracejadas indicam datas em que houve mudanças no comportamento da curva de novos casos.
Os dados foram suavizados, consideramos para cada data a média da observação do dia e dos seis dias anteriores.
As predições são obtidas a partir da função ajustada, para o período seguinte de 7 dias.
Em cada gráfico abaixo, barras cinzas indicam o número diário de casos em cada localidade (média de 7 dias consecutivos).
A linha sólida é o ajuste obtido pelo modelo para a variável em questão (média de 7 dias consecutivos).
A linha pontilhada é a previsão para os próximos 7 dias. A área sombreada indica o intervalo das estimativas.
Barras vermelhas indicam o número de mortes em cada localidade, considerando a mesma suavização (média de 7 dias consecutivos).
Linhas verticais tracejadas indicam datas em que houve mudanças no comportamento da curva de novos casos.
O vídeo de divulgação deste projeto foi premiado pela Pró-Reitoria de Pós-Graduação da USP no edital PRPG 12/2020,
que teve como objetivo divulgar as ações dos Programas de Pós-graduação da USP no combate ao covid-19.
Assista ao vídeo aqui:
Observações sobre esta análise e os dados utilizados:
A principal ideia desta análise é mostrar tendências (de crescimento, decrescimento ou estabilidade) dado o histórico observado
nos dias prévios à data atual.
Este estudo utiliza os dados de casos confirmados por dia, disponibilizados nos sites indicados no final desta página.
Estes dados apresentam alta variabilidade diária que pode ser devida a múltiplos fatores, como atraso nas notificações,
atraso no processamento das amostras e falta de testes. Por este motivo, os dados foram suavizados tomando-se a média das últimas
sete observações para cada data.
O intervalo de confiança para o número total de casos nos próximos 7 dias, com nível de 95%, está calculado sob a hipótese de
erros não correlacionados, que pode não ser uma hipótese adequada neste contexto de casos diários reportados de covid-19. Assim,
esta margem de erro pode estar muito subestimada e deve ser tomada com cautela.
Os gráficos apresentados refletem somente a tendência dos resultados positivos considerando o estado da testagem, esta
tendência pode ser muito diferente da real situação do número de infectados em cada localização. Além disso, esta modelagem
fica fortemente afetada por valores discrepantes na amostra e isto deve ser levado em consideração ao se tirar conclusões
sobre as tendências observadas.
A taxa de mortalidade reportada em cada local corresponde à fração entre o total de mortes e o total de casos reportados até a data atual.