Análise probabilística e algoritmos aleatorizados

Esta página é uma introdução à análise probabilística e aos algoritmos aleatorizados (= randomized). Em geral, a análise probabilística é usada para calcular o consumo médio de tempo de um algoritmo. Mas nesta página, para apresentar os conceitos, usaremos análise probabilística para cálcular o número médio de certas operações durante a execução de um algoritmo muito simples.

O problema da contratação

Para apresentar as ideias básicas da análise probabilística, usaremos o problema da contratação (= hiring problem) como exemplo. Imagine que preciso contratar um assistente pessoal. O assistente deve ser escolhido em um conjunto de n candidatos obedecendo o seguinte protocolo:

Ao longo de n semanas, entrevisto um candidato por semana. Se o candidato da semana for melhor que meu assistente atual, demito o assistente atual e contrato o candidato que acabei de entrevistar. (No início, não tenho assistente algum; portanto, o primeiro candidato será certamente contratado e ficará comigo por pelo menos uma semana.)

Quantas contratações farei até o fim do processo? Se o primeiro candidato for o melhor de todos, farei uma única contratação. Se os candidatos comparecerem em ordem crescente de qualidade, farei n contratações. Isso me preocupa, pois os trâmites de cada contratação são caros. Há como prever o número médio de contratações? Será que número médio de contratações é n/2? Ou que sabe (n+1)/2?

A próxima seção calcula o número médio de contratações depois de modelar o problema como o problema de encontrar o máximo de um vetor.

Número médio de contratações

Suponha dado um vetor A[1 .. n] cujos elementos são inteiros positivos. Em termos do problema da contratação, A[i] representa a qualidade do candidato i. Segue um algoritmo óbvio para o problema de encontrar um elemento máximo do vetor:

Quantas vezes, em média, o algoritmo atualiza o valor da variável max? Em outras palavras, qual o número médio de execuções da atribuição max := A[i] na linha 4 do algoritmo?

Comecemos com uma observação simples mas fundamental: o número de atualizações da variável max não depende dos valores dos elementos do vetor A mas apenas do índice de seu maior elemento, do índice de seu segundo maior elemento, do índice do terceiro maior elemento, etc. Assim, por exemplo, o vetor [88 55 99 22] é equivalente ao vetor [3 2 4 1]. Nada perdemos, portanto, ao supor que os elementos do vetor pertencem ao conjunto 1 .. n. Para tornar as coisas mais simples, suporemos também que os elementos do vetor são distintos dois a dois, e portanto que A[1 .. n] é uma permutação de 1 .. n. Com isso, temos o seguinte modelo do

Problema da contratação: Determinar o número médio de execuções da atribuição max := A[i] no algoritmo Máximo supondo que A[1 .. n] é uma permutação de 1 .. n.

No pior caso, a variável max é atualizado n vezes. No melhor caso, é atualizado só 1 vez. Será que o número médio de atualizações é n/2? Ou talvez (n+1)/2?

Para calcular o número médio, basta dividir por n! a soma dos números de atualizações de max provocados pelas n! permutações de 1 .. n.

Exemplo A: A tabela abaixo dá o número de execuções da atribuição max := A[i] na linha 4 do algoritmo Máximo para cada uma das 24 permutações de 1, 2, 3, 4.

1,2,3,4	4
1,2,4,3	3
1,3,2,4	3
1,3,4,2	3
1,4,2,3	2
1,4,3,2	2
2,1,3,4	3
2,1,4,3	2
2,3,1,4	3
2,3,4,1	3
2,4,1,3	2
2,4,3,1	2
3,1,2,4	2
3,1,4,2	2
3,2,1,4	2
3,2,4,1	2
3,4,1,2	2
3,4,2,1	2
4,1,2,3	1
4,1,3,2	1
4,2,1,3	1
4,2,3,1	1
4,3,1,2	1
4,3,2,1	1

Como se vê, o número médio de execuções da atribuição é 50/24.

Solução do problema

Para resolver o problema da contratação, vamos recorrer à linguagem e aos métodos da Teoria das Probabilidades.

Suponha que A[1 .. n] é uma permutação aleatória uniforme de 1 .. n. Em outras palavras, suponha que cada uma das n! permutações é igualmente provável. Seja X a variável aleatória que dá o número de execuções da atribuição max := A[i]. Estamos interessados no valor médio da variável X, ou seja, na esperança de X, que denotaremos por

Essa esperança é a soma ∑_{0 ≤ k ≤ n} k Pr[X = k], sendo Pr[X = k] a probabilidade de que a atribuição seja executada exatamente k vezes. Para facilitar o cálculo dessa probabilidade, convém introduzir as seguintes variáveis aleatórias indicadoras: para cada k de 1 a n,

A soma X₁ + ⋯ + X_n é igual a X. Assim, pela linearidade da esperança, E[X] é a soma dos E[X_k]. Cada E[X_k] é igual à probabilidade de que A[k] seja o elemento máximo de A[1 .. k]. Portanto,

já que todos os elementos do vetor são maiores que o valor inicial da variável max. Segue daí, finalmente, que

Portanto, a linha 4 do algoritmo Máximo é executada Θ(lg n) vezes em média. Em termos do problema da contratação, a notícia é muito boa: terei que fazer apenas Θ(lg n) contratações, em média, sendo n o número de candidatos.

Exercícios 1

Verifique que ln n ≅ lg n / 1.442 ≅ 0.693 lg n.
Quanto vale Pr[X = 1]? Quanto vale Pr[X = n]?
Quanto vale Pr[X = 2]?
Imite o exemplo A para calcular o número médio de execuções da linha 4 de Máximo no caso n = 3. Compare com 1/1 + 1/2 + 1/3. Use um computador para fazer os cálculos no caso n = 5.
Prove que E[X] = ∑_{0 ≤ k ≤ n} k Pr[X = k]. [Solução]
★ Números harmônicos. Para qualquer número natural não-nulo n, a soma 1/1 + 1/2 + ⋯ + 1/n é conhecida como n-ésimo número harmônico e denotada por H_n. (Veja o Apêndice.) Faça uma tabela de valores de H_n para n = 1, 2, … , 6. Verifique experimentalmente que ln n < H_n < 1 + ln n . Encontre a prova dessas desigualdades em seu livro de Cálculo favorito.
Use variáveis aleatórias indicadoras para calcular o valor médio da soma de n dados. (Cada dado produz um número de 1 a 6 com igual probabilidade.)
Seja A[1 .. n] um vetor de números distintos dois a dois. Se i < j e A[i] > A[j], o par (i, j) é uma inversão Suponha que A[1 .. n] é uma permutação aleatória uniforme de 1 .. n. Use variáveis aleatórias indicadoras para calcular o valor médio de inversões.

Algoritmo aleatorizado

A análise na seção anterior supõe que A[1 .. n] é uma permutação aleatória uniforme de 1 .. n. Para garantir que essa hipótese esteja satisfeita, basta permutar os elementos do vetor antes de invocar o algoritmo. Isso produz uma versão aleatorizada (= randomized) do algoritmo Máximo:

A linha 0 permuta os elementos de A[1 .. n] de modo que cada uma das n! permutações tenha a mesma probabilidade.

Decorre da análise que fizemos na seção anterior que o número esperado de execuções da linha 4 de Máximo-Aleatorizado é

Como o algoritmo é aleatorizado, não dizemos número médio mas número esperado. Não existe pior caso nem melhor caso, pois cada execução do algoritmo trabalha sobre uma permutação diferente (e aleatória) do vetor A[1 .. n].

Permutação aleatória. Resta entender como implementar o algoritmo auxiliar Permuta. Eis uma solução:

O comando Random (i, n) produz um número no intervalo i .. n com probabilidade uniforme, ou seja, com probabilidade 1 / (n−i+1) para cada número do intervalo. Existem implementações de Random que conseguem uma boa aproximação do igualmente prováveis e consomem uma quantidade de tempo constante, ou seja, independente de i e n.

Para provar a correção do algoritmo, convém usar a seguinte definição. Para qualquer k entre 1 e n, uma k-permutação do vetor A[1 .. n] é o vetor cujos elementos são A[p₁], A[p₂], … , A[p_k], nessa ordem, sendo p₁, p₂, … , p_k uma permutação de um subconjunto de 1 .. n que tem exatamente k elementos.

Para verificar que o algoritmo Permuta produz uma permutação aleatória uniforme de A[1 .. n], é preciso observar o seguinte invariante: no início de cada iteração, o subvetor A[1 .. i−1] tem probabilidade (n − i + 1)! / n! de ser qualquer uma das (i − 1)-permutações do vetor original. Portanto, no início da última iteração (quando i = n+1) o vetor A[1 .. n] tem probabilidade 1/n! de ser qualquer uma das permutações do vetor original.

Exercícios 2

Prove o invariante de Permuta.
★ Qual a diferença entre provar que um algoritmo está correto e descrever os passos do algoritmo em português (para cada i, escolhe um número aleatório entre i e c ….)
É verdade que o seguinte algoritmo produz, com igual probabilidade, qualquer permutação de A[1 .. n] que seja diferente da identidade?

Permuta-sem-Identidade (A, n)
1 . para i := 1 até n−1
2 .ooo j := Random (i+1, n)
3 .ooo troque A[ j] :=: A[i]
É verdade que o seguinte algoritmo produz, com igual probabilidade, qualquer permutação de A[1 .. n]?

Permuta-com-Todos (A, n)
1 . para i crescendo de 1 até n
2 .ooo j := Random (1, n)
3 .ooo troque A[ j] :=: A[i]

`X`_k	=	1 se `max` := `A`[`i`] é executada quando `i` = `k`
		0 caso contrário .