Survey - Geometria Computacional 2001

MAC 5747 - Geometria Computacional

Professor: José Coelho de Pina

Survey: Uma Introdução à Construção Incremental Aleatória

Uma Introdução à Construção Incremental Aleatória

Índice

    1.   Introdução
          1.1.   Algoritmos Aleatórios

    2.   Construção Incremental Aleatória
          2.1.   Problema do Par Mais Próximo
                        Algoritmo Incremental Aleatório
                        Análise do algoritmo
                        Estrutura de Dados
                        Teorema 2,1
          2.2.   Um outro exemplo: Interseção de Hiperplanos

    3.   Referências

1.Introdução

Este trabalho é uma pequena introdução à Construção Incremental Aleatória, uma técnica muito utilizada para resolução de problemas em Geometria Computacional. É uma variação da construção incremental (algoritmos incrementais) vistos em aula. Antes, teremos uma breve explanação sobre algoritmos aleatórios, para depois estudar dois problemas: o Par-Mais-Próximo e Interseção de Hiperplanos.

1.1 Algoritmos Aleatórios

A utilização de algoritmos aleatórios foi introduzida em 1976, em trabalhos independentes, por Rabin e por Solovay e Strassen. Atualmente, estes algoritmos (que podem tanto ser seqüenciais ou paralelos) são aplicados para obtenção de soluções eficientes em diversos problemas computacionais.

As duas principais vantagens apresentadas pelos algoritmos aleatórios, segundo Rajasekaran e Sen [1], são sua simplicidade e eficiência. Grande parte dos algoritmos aleatórios encontrados na literatura são simples e de fácil compreensão, se comparados com os algoritmos determinísticos mais eficientes para resolver o mesmo problema.

Em boa parte dos casos, os algoritmos aleatórios também são mais rápidos que os determinísticos correspondentes, de acordo com Karger [2]. Quando não são melhores, algumas idéias de randomização podem ser aplicadas para obtenção de algoritmos eficientes.

Os algoritmos aleatórios não necessariamente utilizam números aleatórios, como pode-se imaginar, mas sim tomam decisões aleatórias durante a execução, ou escolhem de forma aleatória um elemento da entrada em cada iteração, visando ganhar o tempo que muitos algoritmos determinísticos gastam com o pré-processamento (como ordenação das entradas).

Veremos na Seção 2 uma aplicação desta técnica em Geometria Computacional, a construção incremental aleatória, baseada no trabalho de Surender Baswana [3].

2. Construção Incremental Aleatória

Algoritmos incrementais, como os vistos em aula, utilizam a técnica de construção incremental, que consiste em resolver os problemas de uma maneira incremental. Um exemplo típico de algoritmo incremental é o insertion sort, onde inicialmente temos um conjunto vazio e adicionamos elementos sucessivamente neste conjunto, sempre mantendo em cada iteração a ordem (crescente ou decrescente) entre os elementos inseridos. De uma forma geral, um algoritmo incremental trabalha da seguinte maneira:

Sejam i₁, i₂, ... , i_n, os n elementos da entrada e o objetivo é computar uma função f({i₁, i₂, ... , i_n}). Começamos com um conjunto vazio S e f(f ), adicionamos elementos sucessivamente em S e mantemos f(S) a cada iteração do algoritmo. Então, teremos um total de n iterações no algoritmo e ao final obtemos a solução S para o problema.

A complexidade de tempo de um algoritmo incremental depende do tempo gasto em cada iteração de execução do mesmo. Em algumas instâncias (conjunto de entrada) de um problema a ser resolvido, pode ocorrer que a cada iteração, o tempo gasto seja muito alto, levando o algoritmo ao pior caso de tempo. Nestes casos, é vantajoso incrementar o conjunto S tomando-se elementos aleatoriamente.

A construção incremental aleatória (ou RIC - Randomized Incremental Construction) é a técnica na qual adicionamos elementos ao conjunto S aleatoriamente, com o objetivo de obter um limite para o tempo do cálculo de f(S) em cada iteração. Veremos a seguir um exemplo da aplicação da RIC, o Problema do Para Mais-Próximo em E², extraída do trabalho de Surender Baswana [3]..

2.1 Problema do Par-Mais-Próximo em E²

Este problema foi resolvido na disciplina através de algoritmos determinísticos. Teremos agora a aplicação da construção incremental aleatória para a resolução deste problema.

Problema do Par-Mais-Próximo: Dado um conjunto P com n pontos em duas dimensões, o objetivo é encontrar o par de pontos mais próximos entre si deste conjunto.

Para resolver o problema através de um algoritmo incremental, iniciamos com um conjunto de pontos S vazio, e incrementando este conjunto através de inclusões sucessivas de um ponto a cada iteração. O algoritmo incremental terá então n iterações, onde no final da i-ésima iteração teremos o conjunto S_i contendo i pontos. Na iteração i+1 devemos adicionar o ponto p_i+1 e calcular a distância d_i+1. Observe que se a menor distância d', entre p_i+1 e os pontos de S_ié menor que a distância d_i, então d_i+1:= d', senão d_i+1:= d_i. Como em todos os algoritmos incrementais, o tempo necessário para o cálculo de d_i+1 dado d_i determina a complexidade de tempo do algoritmo. Entretanto, precisamos de uma estrutura de dados que auxilie no cálculo do vizinho mais próximo de p_i+1de modo eficiente (melhor que o método de força bruta de tempo q(i) para calcular a distância entre p_i+1 e todos os i pontos do conjunto S_i). Devemos então utilizar uma estrutura de dados D que possui a seguinte funcionalidade:

Ao final da i-ésima iteração, a estrutura de dados mantém uma grade virtual em duas dimensões, onde cada lado tem comprimento d_i e armazena os pontos de S_i nas respectivas células desta grade. Note que uma célula da grade pode conter no máximo 4 pontos (caso contrário seria violado o fato de que d_i é a distância do par-mais-próximo entre os pontos de S_i).
Dado um ponto x, a célula que contém x pode ser obtida em O(log i) passos. Além disso, todos os pontos que estão em uma célula da grade virtual podem ser obtidos em O(log i) passos.
A estrutura de dados para i pontos pode ser construída em tempo O(log i).
O espaço desta estrutura de dados é linear ao tamanho dos dados de entrada.

No final desta seção, veremos como projetar a estrutura de dados D. Agora veremos o algoritmo incremental aleatório para a obtenção da distância d do par-mais-próximo de um conjunto P:

Algoritmo: Par-Mais-Próximo Incremental Aleatório
Entrada: um conjunto de P com n pontos em E²
Saída: a distância entre o par-mais-próximo de pontos de P

while (i < n) do
begin
    Passo 1:   encontre a célula da grade que contém ponto p_i+1, usando D(S_i).
    Passo 2:   procure o ponto p Î S_i mais próximo de p_i+1, e seja d' a distância entre p e p_i+1.
    Passo 3:   if (d' > d_i)
                        then Insira p_i+1 em S_i
                        else {
                            d_i+1¬d'
                            Construa D(S_i+1,d_i+1)
                        }
end

A (i+1)-ésima iteração do algoritmo acima, que consiste no inclusão de p_i+1 e cálculo de d_i+1 pode ser visualizada na figura abaixo:

Análise do Algoritmo Incremental Aleatório:

Agora analisaremos a complexidade de tempo dos três passos da (i+1)-ésima iteração do algoritmo, utilizando a estrutura D(S_i).

Passo 1: a localização da célula c, que contém o ponto p_i+1, pode ser executada em O(log i) passos, utilizando-se D(S_i)

Passo 2: Para encontrar o ponto de S_i mais próximo de p_i+1, precisamos encontrar a distância entre p_i+1e cada ponto da célula c e das células vizinhas a c. Desta forma, temos um total de 9 céluas (c e suas vizinhas) e no máximo 36 pontos (4 pontos por célula), todas potenciais candidatas a serem o ponto mais próximo de p_i+1. Assim, o Passo 2 envolve a localização das nove células vizinhas a c (o que requer O(log n) passos por célula) e calcular a distância entre p_i+1 e um número constante de pontos (no máximo 36). Usando D(S_i), podemos executar o Passo 2 em tempo O(log i).

Passo 3: O bloco if requer tempo O(log i). O bloco else é a operação mais complexa pois consiste na construção de D(S_i+1,d_i+1). Devido à funcionalidade da estrutura D (descrita anteriormente), este passo pode ser executado em tempo O((i+1) log(i+1))

Complexidade do Algoritmo:

Observe que permutamos os n pontos dados (com cada permutação igualmente possíveis). O tempo de execução na (i+1)-ésima iteração é portanto uma variável aleatória. Pela análise dos três passos do algoritmo, notamos que Passo1 e Passo 2 são executados em toda iteração a um custo de tempo c₁ log i, onde c₁ é uma constante. Se a inclusão do ponto p_i+1diminui a distância do par-mais-próximo, um custo adicional c₁i log i é necessário para a construção de D(S_i+1,d_i+1), caso contrário, o custo adicional é O(log i).

Desta forma, o tempo necessário na i-ésima iteração pode ser expressa como:

T(i) = c₁ log i + Prob[d_i+1< d_i] . c₂(i + 1) log (i + 1) (1)

onde, c₁ e c₂ são constantes e Prob[d_i+1< d_i] é a probabilidade de d_i+1< d_i.

Devemos agora calcular Prob[d_i+1< d_i]. Para isso, particionamos n! permutações em grupos g₁, g₂,..., g_Ltais que o conjunto dos primeiros i + 1 pontos em todas as permutações pertencentes a um grupo sejam idênticos. Utilizaremos o símbolo p para denotar uma permutação. Podemos escrever a seguinte equação:

Prob[d_i+1< d_i] = S_gk Prob[primeira p Î g_k] . Prob[d_i+1< d_i | p Îg_k] (2)

Agora limitaremos Prob[d_i+1< d_i | p Îg_k]. Seja C_i+1 o conjunto de i + 1 pontos que define o grupo de permutações g_i.

Se há apenas um par-mais-próximo em C_i+1, então d_i+1< d_i ocorre apenas se um dos pontos que definem o único par-mais-próximo aparece na (i + 1)-ésima posição. A probabilidade deste evento ocorrer dado um g_k particular é igual a 2 / (i + 1).
Se existem vários pares mais próximos em C_i+1, então d_i+1> d_isomente se existe um único ponto em S_i+1 que aparece em todos os pares mais próximos e este único ponto aparece na (i + 1)-ésima posição. A probabilidade deste evento ocorrer dado um g_k particular é igual a 1 / (i + 1). Então, podemos escrever que:

Prob[d_i+1< d_i | p Î g_k] <= 2 / (i + 1)

E, pela equação (2), segue que:

Prob[d_i+1< d_i] <= 2 / (i + 1) (3)

Das equações (3) e (1), concluímos que o tempo gasto na (i + 1)-ésima iteração é:

T(i + 1) = c₁ log i + [2 / (i + 1)] . c₂(i + 1) log (i + 1) = O( log (i + 1) )

A complexidade de tempo total do algoritmo é a soma das variáveis aleatórias T(i) para 1 < i < n. Logo, podemos concluir que a complexidade de tempo do algoritmo é O(n log n). Note que este tempo é o mesmo do algoritmo de divisão e conquista visto em aula (algoritmo determinístico ótimo).

Estrutura de Dados:

Considere um conjunto S_i de i pontos em 2-dimensões, cuja distância do par-mais-próximo de pontos seja igual a d_i. Para cada ponto p Î S_i, calculamos o intervalo na abscissa (eixo x) referente à sua coordenada x. Associamos um ponto (x₁, y₁) ao intervalo [(j d_i, (j + 1) d_i)] no eixo x tal que j d_i <= x₁< d_i(j + 1). Identificamos então cada ponto por este intervalo. Podemos construir agora uma árvore T com intervalos para o conjunto dos x-intervalos associados aos pontos. Podemos observar que cada folha é associada a um intervalo de tamanho d_i. Armazenamos os pontos do conjunto S_i nas folhas desta árvore (a inserção de cada ponto requer que seja percorrido o caminho da raiz de T até uma folha, o que determina um custo de O(log i) por ponto). Todos os pontos pertencentes aos mesmo x-intervalo estarão na mesma folha. Seja s_L Î S_i um conjunto de pontos pertencente à folha L. Nós construímos uma árvore similar de intervalos para a ordenada y para os pontos de s_L. Então a estrutura de dados D(S_i) é uma árvore de intervalos para a direção x, cujas folhas têm cada uma árvore de intervalos para a direção y. Desta forma, temos a estrutura da grade virtual mencionada anteriormente.

A partir da descrição da estrutura de dados, torna-se evidente que o tempo necessário para a construção de D(S_i) é O(i log i), pois o armazenamento de cada ponto exige que sejam percorridas duas árvores de intervalos, cada uma de tamanho menor ou igual a i. Assim, segue que a localização de uma célula para um novo elemento (assim como para inserção) pode ser executada em tempo O(log i). Desta forma, esta estrutura de dados atende aos requisitos apresentados no início desta seção.

Como conclusão, podemos enunciar o seguinte teorema:

Teorema 2.1: O par mais próximo para um conjunto de n pontos de 2-dimensões pode ser obtido utilizando construção incremental aleatória em complexidade de tempo O(n log n) e espaço linear para armazenamento.

2.2 Um outro exemplo: Interseção de Hiperplanos

Veremos agora, sem entrar em maiores detalhes, um outro exemplo da aplicação da construção incremental aleatória, a Interseção de Hiperplanos. Este exemplo foi extraído do trabalho de Gaurav e Soumyadeb [4].

Problema: dado um conjunto de n hiperplanos, queremos encontrar a região comum entre eles.

Para resolver este problema, utilizamos a construção incremental aleatória, na qual em cada passo adicionamos em um conjunto S um hiperplano, e então atualizamos a região comum a todos os hiperplanos adicionados a S até o passo atual.

Pela figura acima , podemos observar que a região comum aos hiperplanos pode ser obtida da seguinte forma: a cada iteração, adicionamos um hiperplano h_i+1 ao conjunto S. Se este hiperplano formar um ou mais triângulos com os hiperplanos que estão na fronteira do polígono que representa a região comum dos hiperplanos em S, então estes triângulos são adicionado à região de interseção dos hiperplanos, formando assim um novo polígono.

Ao final, a união de todos os triângulos determinará o região de interseção dos hiperplanos.

3. Referências

[1] Sanguthevar Rajasekaran e Sandeep Sen, Parallel Randomized Algorithms for Selection, Sorting, and Convex Hulls

[2] David Karger, Randomized Algorithms (6.856J) - Course Notes

[3] Surender Baswana, Randomized Incremental Construction: An introduction through examples

[4] Gaurav e Soumyadeb, Random Incremental Construction