O objetivo em análise de sobrevivência é estimar a função de sobrevida da variável em estudo. Uma metodologia interessante para tratar esse problema é a estimação não paramétrica, pois neste caso não impomos um modelo teórico para as falhas e/ou censuras observadas. A função de sobrevivência possui algumas propriedades, tais como, continuidade à esquerda, e
. A figura abaixo nos mostra a curva de sobrevivência de uma variável aleatória com distribuição exponencial.
Em (a) é apresentado a curva teórica, em (b) dividimos o tempo em partições iguais com amplitude de 0,5, em (c) dividimos em amplitudes de 0,1. Percebemos que se a amplitude tender a zero teremos a verdadeira curva de sobrevivência. Então poderemos definir a partição
um estimador para a curva de sobrevida seria uma função escada dada por
sendo as observações que falharam no intervalo
. No caso em que não temos censuras este seria o estimador da função de sobrevida, porém em análise de sobrevivência é necessário considerar as censuras no processo de estimação da curva de sobrevivência. Para isso definiremos algumas quantidades.
A função de sobrevivência pode ser escrita como
![]() |
![]() |
![]() |
|
![]() |
![]() |
||
![]() |
![]() |
||
![]() |
![]() |
||
![]() |
![]() |
Para o caso em que não existem censuras pode ser estimado por
, ou seja o número de falhas dividido pelo número de unidades em risco em
. Neste mesmo caso verifica-se que
, então teremos
![]() |
![]() |
![]() |
|
![]() |
![]() |
||
![]() |
![]() |
||
![]() |
![]() |
||
![]() |
![]() |
como já visto anteriormente, pois
. Para o caso de censuras, precisamos corrigir o denominador do estimador de
, pois o número de u.e. em risco está sendo sobre estimado. Se assumirmos que as unidades foram censuradas uniformemente ao longo do intervalo
, um estimador razoável para
seria
também conhecido como estimador tábua de vida. E sua variância é dada por (ver Lawless 1982)
O estimador produto-limite, também conhecido como estimador Kaplan-Meier é obtido quando a partição
é tal que a primeira falha ocorre em
a segunda falha ocorre em
, ... e a
ésima falha ocorre em
, assim o estimador é dado por
sendo o número de u.e. em risco em
e
o número de u.e. que falharam em
. Neste caso, estamos observando as falhas pontualmente, ou seja, no instante que ocorreu. No estimador tábua de vida, observamos as falhas em intervalos, sendo difícil conhecer o exato instante de cada falha. A variância para o estimador Kaplan-Meier da função de sobrevivência é dado por
Na seção mostramos algumas propriedades de martingais e uma justificativa mais formal de que
para
fixo.
Outro estimador conhecido para é o estimador de Breslow, que utiliza o estimador de Nelson-Aalen. Definiremos algumas quantidades antes de apresentar os estimadores de Nelson-Aalen e Breslow. Definimos
, sendo
a função taxa de falhas. Assim
Desta forma
ocorrer falha em
está em risco
e no instante de falha
essa quantidade pode ser estimada por
. O estimador de Nelson-Aalen para
é dado por
O estimador de Breslow para a função de sobrevivência é
Fleming-Harrington fizeram um estudo teórico do estimador de Breslow. Usando a aproximação
quando
é pequeno, verificamos que o estimador de Breslow é assintoticamente equivalente ao estimador Kaplan-Meier.
verifica-se que
pois estamos supondo que
.
A estimação não paramétrica de é muito útil mesmo quando queremos ajustar um modelo paramétrico, uma das forma de verificar se um modelo é adequado é fazer um gráfico de
versus
. Assim, se o modelo exponencial for adequado esse gráfico deverá ser próximo da relação
patriota 2006-04-29