Modelo funcional homocedástico com erro nas variáveis

Existem duas abordagens em modelos com erro nas variáveis, ou seja, o modelo funcional que não supõem uma distribuição para a verdadeira concentração, e o modelo estrutural que considera uma distribuição para a verdadeira concentração. Neste trabalho consideramos apenas o modelo funcional por ser menos restritivo em relação a distribuição da concentração, podendo a mesma ser assimétrica. Essa abordagem gera alguns problemas na consistência dos estimadores pois algumas condições de regularidade não estão satistifeitas. Ema dessas condições é que o número de parâmetros cresce com o tamanho da amostra, ou seja, o modelo considera que $ x_1,...,x_n$ são parâmetros incidentais. Considerando que os erros de medição seguem uma distribuição normal, o modelo funcional homocedástico é dado por

$\displaystyle Y_i \stackrel{iid}{\sim} N(\alpha + \beta x_i, \lambda)$

e

$\displaystyle X_i \stackrel{iid}{\sim} N(x_i, \kappa)$

de modo que a distribuição conjunta de ($ Y_i,X_i$) é dada por

$\displaystyle \left( \begin{array}{c} Y_i\\ X_i \end{array} \right) \sim N_2\le...
...t[ \begin{array}{cc} \lambda & 0 \\ \cdot & \kappa \end{array} \right] \right),$    

para $ i=\{1,2,\ldots, n\}$, sendo

$ Y_i:$ Valor observado da $ i$-ésima concentração medida pelo método novo;
$ X_i:$ Valor observado da $ i$-ésima concentração medida pelo método padrão;
$ x_i:$ Valor verdadeiro da $ i$-ésima concentração (não observado);
$ \alpha:$ Viés aditivo do modelo;
$ \beta:$ Viés multiplicativo do modelo.

Neste modelo $ Y_i$ é o valor da $ i$-ésima concentração observada pelo instrumento novo que pode possuir alguma vantagem em relação ao instrumento padrão, como por exemplo custos mais baixos, maior facilidade na manipulação do equipamento (métodos, instrumentos) de medição, menor tempo de treinamento para que uma pessoa o opere, entre outros. A variável $ X_i$ é o valor observado da $ i$-ésima concentração medida pelo método padrão, o instrumento padrão mensura a concentração com grande precisão, mas com algum custo operacional não desejado. O interesse principal é verificar se o método novo consegue mensurar sem viés a concentração desejada, para isso utilizamos a metodologia da máxima verossimilhança, sendo o loarítmo da função de verossimilhança dado por

$\displaystyle \ell($$\displaystyle \mbox{\boldmath {$\theta$}}$$\displaystyle ) = \sum_{i \in I } \ell_{i}($$\displaystyle \mbox{\boldmath {$\theta$}}$$\displaystyle ),$ (1)

sendo

$\displaystyle \ell_{i}($$ \theta$$\displaystyle )=-log(2\pi)-\frac{1}{2}log(\kappa)-\frac{1}{2}log(\lambda)-\frac{(y_{i}-\alpha - \beta x_{i})^2}{2\lambda}-\frac{(X_{i} - x_{i})^2}{2\kappa},$

e o parâmetro $ \theta$$ =($$ \beta$$ ^{\top},\lambda,\kappa,$$ x$$ ^{\top})^{\top}$, $ \beta$$ = (\alpha, \beta)^{\top}$ e $ x$$ =(x_1,\ldots, x_n)^{\top}$. Portanto, temos $ n+4$ parâmetros para serem estimados. Uma das formas de obter estimadores consistentes para o viés aditivo $ \alpha$ e para o viés multiplicativo $ \beta$ é maximizar a log-verossimilhança perfilada, ou seja substituir $ x_i$ pelo seu estimador de máxima verossimilhança (MV) dado por $ \hat{x}_i$ em ([*]) obtendo

$\displaystyle \ell^{p}($$\displaystyle \mbox{\boldmath {$\theta$}}$$\displaystyle ) = \sum_{i \in I } \ell^{p}_{i}($$\displaystyle \mbox{\boldmath {$\theta$}}$$\displaystyle ),$ (2)

sendo

$\displaystyle \ell_{i}^p($$ \theta$$\displaystyle )=-log(2\pi)-\frac{1}{2}log(\kappa)-\frac{1}{2}log(\lambda)-\frac...
...alpha - \beta \hat{x}_{i})^2}{2\lambda}-\frac{(X_{i} - \hat{x}_{i})^2}{2\kappa}$

e $ \hat{x}_i = \dfrac{\kappa \beta (Y_i - \alpha)+\lambda X_i}{\beta^2 \kappa + \lambda}$. Além desse problema verifica-se que a verossimilhança acima é ilimitada, gerando problemas de maximização, quando $ X_i = \hat{x}_i$ e $ \kappa \rightarrow 0$. Uma das formas de contornar este problema é considerar conhecido alguns parâmetros. Quando consideramos $ \sigma=\lambda/\kappa$ conhecido, (substituindo $ \lambda$ por $ \sigma \kappa$) a log-verossimilhança se torna limitada, porém o estimador de MV para $ \kappa$ não é consistente, ver Patefield 1978, um estimador consistente para $ \kappa$ é dado por $ 2\hat{\kappa}$ sendo que $ \hat{\kappa}$ é o estimador de MV. Patefield 1978 mostra que os estimadores para $ \alpha$, $ \beta$ e $ \kappa$ para o caso em que $ \sigma$ é conhecido são dados por

$\displaystyle \hat{\alpha}=\bar{Y} - \hat{\beta}\bar{X}$    , $\displaystyle \hat{\beta}= \dfrac{S_Y^2 - \sigma S_X^2 + \sqrt{(S_Y^2 - \sigma S_X^2)^2 - 4\sigma S_{YX}^2}}{2S_{YX}}$    e

$\displaystyle \hat{\kappa}= \sum_{i=1}^n \dfrac{(Y_i - \hat{\alpha} - \hat{\beta} X_i)^2}{n(\hat{\beta}^2 +\sigma)},
$

os quais serão consistentes se

$\displaystyle \lim_{n \rightarrow \infty} \sum_{i=1}^{n} x_i/n \rightarrow \mu_{*}$    e $\displaystyle \lim_{n \rightarrow \infty} \sum_{i=1}^{n} (x_i - \mu_{*})^2/n \rightarrow \nu_{*},$ (3)

sendo $ \mu_{*}$ e $ \nu_{*}$ constantes. Patefield 1977 deriva as variâncias assintóticas dos estimadores $ \hat{\alpha}$ e $ \hat{\beta}$ no caso ultraestrutural, ou seja, quando a verdadeira concentração $ x_i$ tem distribuição normal com média $ \mu_{x_i}$ e variância $ \sigma^2_x$. Fazendo $ \sigma_x^2 = 0$, temos como caso particular o modelo funcional. O estimador consistente para a matriz de covariâncias é dado abaixo

\begin{displaymath}\hat{\mbox{Var}}(\hat{\mbox{\boldmath {$\beta$}}})=
\dfrac{(\...
...\
-\bar{X}(1+\hat{\tau}) & (1+ \hat{\tau})
\end{array}\right]
\end{displaymath}

sendo $ \hat{\tau} = \dfrac{\sigma \hat{\kappa}\hat{\beta}}{(\sigma + \hat{\beta}^2)S_{YX}}$, $ S_{XY} = 1/n \sum_{i=1}^{n} (X_i - \bar{X})Y_i$ e $ S^2_X = 1/n \sum_{i=1}^n (X_i - \bar{X})^2$.

Assim é possível utilizar a estatística de Wald para testar $ H_0: (\alpha, \beta)^{\top} = (0,1)^{\top}$ contra $ H_1: (\alpha, \beta)^{\top} \neq (0,1)^{\top}$, ou seja, testar se não existe viés aditivo ($ \alpha=0$) e multiplicativo ($ \beta=0$) na medição do intrumento novo. A estatística Wald para este caso é dada por

\begin{displaymath}\xi_{W}=
\dfrac{nS_{YX}}{(\sigma+\hat{\beta}^2)\kappa\hat{\be...
...gin{array}{c}
\hat{\alpha}\\
\hat{\beta}-1
\end{array}\right)
\end{displaymath}

Pelas propriedades dos estimadores obtidos maximizando a log-verossimilhança perfilada, ver Mak, pode-se mostrar que a distribuição assintótica de $ \xi_{W}$ é uma quiquadrado com 2 graus de liberdade. Quando consideramos $ \kappa$ conhecido a log-verossimilhança perfilada se torna limitada, mas o estimador de MV para $ \beta$ não é consistente, (ver Fuller), assim o estimador de MV para o caso estrutural é usado para estimar $ \beta$ ( ver Cheng e Van Ness 1991). Estimadores consistentes para $ \alpha$, $ \beta$ e $ \lambda$, quando $ \kappa$ é conhecido, são dados por

$\displaystyle \hat{\alpha}=\bar{Y} - \hat{\beta}\bar{X}$ , $\displaystyle \hat{\beta}_e = \dfrac{S_{XY}}{S^2_X - \kappa}$    e

$\displaystyle \hat{\lambda} = S_Y^2 - \hat{\beta} S_{YX}.$

Cheng e Van Ness 1991 encontram a matriz de covariâncias assintótica de $ \hat{\mbox{\boldmath {$\beta$}}}$ que é dada por

\begin{displaymath}\hat{\mbox{Var}}(\hat{\mbox{\boldmath {$\beta$}}})=1/n
\left[...
...{\psi} \\
-\bar{X}\hat{\psi} & \hat{\psi}
\end{array}\right]
\end{displaymath}

sendo $ \hat{\psi} = \dfrac{\left\{(\hat{\nu}_{*} + \kappa)(\hat{\lambda} + \hat{\beta}^2\kappa) + \hat{\beta}^2\kappa^2\right\}}{\hat{\nu}_{*}^{2}}$ e $ \hat{\nu}_{*}= S_X^2 - \kappa$. Desta forma para testar se não existe viés no instrumento novo poderiamos utilizar a estatística de Wald de forma analoga ao caso em que $ \sigma=\lambda/\kappa$ é conhecido. A estatística é dada por

\begin{displaymath}
\xi_{W}=n
\left(
\begin{array}{c}
\hat{\alpha}\\
\hat{\beta...
...gin{array}{c}
\hat{\alpha}\\
\hat{\beta}-1
\end{array}\right)
\end{displaymath}

Poderiamos também considerar $ \lambda$ e $ \kappa$ conhecidos, assim os parâmetros $ \alpha$ e $ \beta$ são estimados consistentemente, fazendo $ \sigma=\lambda/\kappa$. Os estimadores encontrados usando a verossimilhança perfilada do viés aditivo e multiplicativo são dados por

$\displaystyle \hat{\alpha}=\bar{Y} - \hat{\beta}\bar{X}$    , $\displaystyle \hat{\beta}= \dfrac{S_Y^2 - \sigma S_X^2 + \sqrt{(S_Y^2 - \sigma S_X^2)^2 - 4\sigma S_{YX}^2}}{2S_{YX}}$

que coincidem com o caso em que apenas $ \sigma$ é conhecido. A matriz de covâriancias assintótica de $ \hat{\mbox{\boldmath {$\beta$}}}$ no caso em que ambas as variâncias são conhecidas é

\begin{displaymath}
\hat{\mbox{Var}}(\hat{\mbox{\boldmath {$\beta$}}})=1/n
\left...
...\psi} \\
-\bar{X}\hat{\psi} & \hat{\psi}
\end{array}\right],
\end{displaymath}

sendo $ \hat{\psi} = \dfrac{\left\{(\hat{\nu}_{*} + \kappa)(\lambda + \hat{\beta}^2\kappa) + \hat{\beta}^2\kappa^2\right\}}{\hat{\nu}_{*}^{2}}$ e $ \hat{\nu}_{*}= S_X^2 - \kappa$. A estatística Wald para testar o viés é dada abaixo

\begin{displaymath}
\xi_{W}=n
\left(
\begin{array}{c}
\hat{\alpha}\\
\hat{\beta...
...in{array}{c}
\hat{\alpha}\\
\hat{\beta}-1
\end{array}\right).
\end{displaymath}

A distribuição assintótica da estatística acima é quiquadrado com 2 graus de liberdade. (colocar aqui a referencia do Singer, 1993)

patriota 2006-04-16