9.2 Teorema de De Moivre-Laplace

O exemplo mais simples da aproximação Sn𝒩(nμ,nσ2)S_{n}\approx\mathcal{N}(n\mu,n\sigma^{2}) é quando lançamos uma moeda honesta nn vezes e contamos o número SnS_{n} de caras. Neste caso SnS_{n} tem distribuição Binom(n,12)\mathop{\mathrm{Binom}}\nolimits(n,\frac{1}{2}). Na Figura 9.1 vemos como essa distribuição, devidamente normalizada, se aproxima da distribuição normal padrão.

Teorema 9.4 (Teorema de De Moivre-Laplace).

Seja (Xn)n(X_{n})_{n\in\mathbb{N}} uma sequência de variáveis aleatórias independentes, com distribuição Bernoulli(p)\mathop{\mathrm{Bernoulli}}\nolimits(p), onde p=1q(0,1)p=1-q\in(0,1), e tome Sn=X1++XnS_{n}=X_{1}+\dots+X_{n}. Então para todos a<ba<b

(a<Snnpnpqb)12πabex22dx.\mathbb{P}\left(a<\frac{S_{n}-np}{\sqrt{npq}}\leqslant b\right)\to\frac{1}{% \sqrt{2\pi}}\int_{a}^{b}e^{-\frac{x^{2}}{2}}\,\mathrm{d}x.

O teorema foi provado inicialmente por De Moivre supondo que p=12p=\frac{1}{2} e generalizado por Laplace para 0<p<10<p<1. De fato, ele segue de uma aproximação muito mais fina:1515 15 Essa aproximação é conhecida como Teorema do Limite Local e é aparentemente a primeira vez na Matemática em que aparece a famosa função ex2/2e^{{-{x^{2}}/{2}}}.

n!k!(nk)!pkqnk12πnpqexk22,\frac{n!}{k!\,(n-k)!}\ p^{k}\ q^{n-k}\sim\frac{1}{\sqrt{2\pi npq}}e^{-\frac{x_% {k}^{2}}{2}}, (9.5)

onde

xk=xn,k=knpnpq.x_{k}=x_{n,k}=\frac{k-np}{\sqrt{npq}}.

Nesta seção, denotaremos por an,kbn,ka_{n,k}\sim b_{n,k} a propriedade de que

maxk:|xk|Man,kbn,k1 e mink:|xk|Man,kbn,k1\max_{k:|x_{k}|\leqslant M}\frac{a_{n,k}}{b_{n,k}}\to 1\quad\text{ e }\quad% \min_{k:|x_{k}|\leqslant M}\frac{a_{n,k}}{b_{n,k}}\to 1 (9.6)

quando nn\to\infty, para todo M<M<\infty fixo.

Essa aproximação é muito mais fina porque diz não apenas que a probabilidade de a flutuação estar dentro de um certo intervalo é bem aproximada pela normal, mas também que a função de probabilidade de cada um dos possíveis valores dentro de um intervalo fixo é aproximada pela densidade da normal.

Para entender de onde vem essa aproximação, primeiro precisamos de uma expressão mais palpável para n!n!. Qual a probabilidade de obtermos exatamente 6060 caras se lançamos uma moeda 120120 vezes? A resposta é fácil:

(S120=60)=120!60! 60!×12120.\mathbb{P}(S_{120}=60)=\frac{120!}{60!\,60!}\times\frac{1}{2^{120}}.

Essa expressão é simples e matematicamente perfeita. Porém, quanto vale essa probabilidade? Mais de 0,150{,}15? Menos de 0,050{,}05? Entre 0,050{,}05 e 0,100{,}10? Boas calculadoras científicas não têm capacidade de calcular 120!120!. Num computador esse cálculo resulta em 0,0726849790{,}072684979. Mas e se fossem 40.00040.000 lançamentos da moeda? E se estivéssemos interessados em calcular (S40.00019.750)\mathbb{P}(S_{40.000}\leqslant 19.750), faríamos um cálculo semelhante 250250 vezes para depois somar? As expressões com fatorial são perfeitas para a combinatória, mas impraticáveis para se fazer estimativas. Nosso socorro será a fórmula de Stirling

n!nnen2πn,n!\sim n^{n}\,e^{-n}\,\sqrt{2\pi n},

provada no Apêndice B. Essa aproximação de n!n! pela fórmula de Stirling é muito boa mesmo sem tomar nn grande. Ela aproxima 1!1! por 0,920{,}92, 2!2! por 1,921{,}92, 4!4! por 23,523{,}5, e a partir de 9!=362.8809!=362.880, que é aproximado por 359.537359.537, o erro é menor que 1%1\%. À primeira vista nnen2πnn^{n}\,e^{-n}\,\sqrt{2\pi n} não parece mais agradável do que n!n!. Mas vejamos como isso ajuda com o cálculo anterior. Temos:

(2k)!k!k!×122k(2k)2ke2k4πk(kkek2πk)2×122k=1πk\frac{(2k)!}{k!\,k!}\times\frac{1}{2^{2k}}\sim\frac{(2k)^{2k}e^{-2k}\sqrt{4\pi k% }}{(k^{k}e^{-k}\sqrt{2\pi k})^{2}}\times\frac{1}{2^{2k}}=\frac{1}{\sqrt{\pi k}}

que para k=60k=60 pode até ser calculado à mão, obtendo-se 0,07280{,}0728\dots. Mais do que isso, acabamos de obter a aproximação (9.5) no caso particular em que p=q=12p=q=\frac{1}{2} e xk=0x_{k}=0.

Vamos mostrar (9.5) para MM fixo. Aplicando a fórmula de Stirling obtemos

n!k!(nk)!pkqnk\displaystyle\frac{n!}{k!\,(n-k)!}\ p^{k}\ q^{n-k} nnen2πnpkqnkkkek2πk(nk)nkekn2π(nk)\displaystyle\sim\frac{n^{n}e^{-n}\sqrt{2\pi n}\,p^{k}\,q^{n-k}}{k^{k}e^{-k}% \sqrt{2\pi k}(n-k)^{n-k}e^{k-n}\sqrt{2\pi(n-k)}}
=(npk)k(nqnk)nk2πk(nk)/n.\displaystyle=\frac{(\frac{np}{k})^{k}(\frac{nq}{n-k})^{n-k}}{\sqrt{2\pi k(n-k% )/n}}.

Observe que, com a restrição |xk|<M|x_{k}|<M, vale

k=np+npqxknpenk=nqnpqxknq.k=np+\sqrt{npq}\,x_{k}\sim np\qquad\text{e}\qquad n-k=nq-\sqrt{npq}\,x_{k}\sim nq.

Daí obtemos

n!k!(nk)!pkqnk(npk)k(nqnk)nk2πnpq=f(n,k)2πnpq.\frac{n!}{k!\,(n-k)!}\ p^{k}\ q^{n-k}\sim\frac{\left(\frac{np}{k}\right)^{k}% \left(\frac{nq}{n-k}\right)^{n-k}}{\sqrt{2\pi npq}}=\frac{f(n,k)}{\sqrt{2\pi npq% }}.

Vamos estudar logf(n,k)\log f(n,k). Reescrevendo cada termo,

npk=1npqxkkenqnk=1+npqxknk.\dfrac{np}{k}=1-\frac{\sqrt{npq}\,x_{k}}{k}\qquad\text{e}\qquad\dfrac{nq}{n-k}% =1+\frac{\sqrt{npq}\,x_{k}}{n-k}.

A expansão de Taylor de log(1+x)\log(1+x) até o termo de segunda ordem nos dá

log(1+x)=xx22+r(x),onde r(x)x20 quando x0.\log(1+x)=x-\frac{x^{2}}{2}+r(x),\qquad\text{onde }\frac{r(x)}{x^{2}}\to 0% \mbox{ quando }x\to 0.

Assim,

logf(n,k)\displaystyle\log f(n,k) =k(npqxkknpqxk22k2+r(npqxkk))+\displaystyle=k\left(-\frac{\sqrt{npq}\,x_{k}}{k}-\frac{npqx_{k}^{2}}{2k^{2}}+% r(\tfrac{\sqrt{npq}\,x_{k}}{k})\right)+
+(nk)(npqxknknpqxk22(nk)2+r(npqxknk)).\displaystyle\qquad+(n-k)\left(\frac{\sqrt{npq}\,x_{k}}{n-k}-\frac{{npq}x_{k}^% {2}}{2(n-k)^{2}}+r(\tfrac{\sqrt{npq}\,x_{k}}{n-k})\right).

Note que os primeiros termos se cancelam e, quando nn\to\infty,

logf(n,k)npqxk22knpqxk22(nk)qxk22pxk22=xk22.\log f(n,k)\sim-\frac{npqx_{k}^{2}}{2k}-\frac{{npq}x_{k}^{2}}{2(n-k)}\sim-% \frac{qx_{k}^{2}}{2}-\frac{px_{k}^{2}}{2}=-\frac{x_{k}^{2}}{2}.

Daí segue que

f(n,k)exk22f(n,k)\sim e^{-\frac{x_{k}^{2}}{2}}

pois, sob a restrição |xk|<M|x_{k}|<M, podemos tomar a exponencial de ambos os lados e ainda manter a equivalência assintótica. Isso termina a prova de (9.5).

Somando sobre os possíveis valores de SnS_{n}, obtemos

(a<Snnpnpqb)=a<xkb(Sn=k)=a<xkbn!k!(nk)!pkqnk,\mathbb{P}\left(a<\tfrac{S_{n}-np}{\sqrt{npq}}\leqslant b\right)=\sum_{a<x_{k}% \leqslant b}\mathbb{P}(S_{n}=k)=\sum_{a<x_{k}\leqslant b}\frac{n!}{k!\,(n-k)!}% \,p^{k}\,q^{n-k},

onde os somatórios são sobre kk com a condição sobre xkx_{k}, que é dado por xk=knpnpqx_{k}=\frac{k-np}{\sqrt{npq}}. Observando que

xk+1xk=1npq,x_{k+1}-x_{k}=\frac{1}{\sqrt{npq}},

e substituindo (9.5), obtemos

(a<Snnpnpqb)a<xkbexk222πnpq=12πa<xkbexk22[xk+1xk].\mathbb{P}\left(a<\tfrac{S_{n}-np}{\sqrt{npq}}\leqslant b\right)\sim\sum_{a<x_% {k}\leqslant b}\frac{e^{-\frac{x_{k}^{2}}{2}}}{\sqrt{2\pi npq}}=\frac{1}{\sqrt% {2\pi}}\sum_{a<x_{k}\leqslant b}e^{-\frac{x_{k}^{2}}{2}}\cdot[x_{k+1}-x_{k}].

Aqui há um detalhe sutil a observar: a equivalência assintótica está relacionada com um certo limite quando nn\to\infty e, como a quantidade de valores de kk que entram no somatório acima varia com nn, é importante que estamos usando (9.6) como definição de equivalência assintótica.

Finalmente, observamos que o somatório acima é uma soma de Riemann. Pelo Teorema A.3, ela se aproxima de 12πabex22dx\frac{1}{\sqrt{2\pi}}\int_{a}^{b}e^{-\frac{x^{2}}{2}}\,\mathrm{d}x quando nn\to\infty. Isso termina a prova do Teorema 9.4.