Algoritmo Mergesort: análise da correção e do desempenho

Considere o problema de ordenação discutido em outro capítulo: rearranjar um vetor v[0 .. n-1] de tal modo que ele fique em ordem crescente, isto é, de tal modo que tenhamos v[0] ≤ . . . ≤ v[n-1]. O outro capítulo analisou alguns algoritmos simples para o problema. Aqueles algoritmos são quadráticos, ou seja, eles consomem uma quantidade de tempo proporcional a n².

O presente capítulo examina um algoritmo mais sofisticado e muito mais rápido que usa a estratégia da divisão-e-conquista. A ideia é simples: se a primeira metade do vetor já estiver em ordem crescente e a segunda metade também for crescente, então as duas metades podem ser rapidamente intercaladas de modo que o vetor todo fique em ordem crescente.

Intercalação de vetores ordenados

Antes de resolver nosso problema principal é preciso resolver o seguinte problema da intercalação (= merge): dados vetores crescentes v[p .. q-1] e v[q .. r-1], rearranjar v[p .. r-1] em ordem crescente.

Seria fácil resolver o problema da intercalação em tempo proporcional ao quadrado do tamanho do vetor v[p..r-1]: bastaria ignorar que as duas metades já estão ordenadas e usar um dos algoritmos básicos de ordenação. Mas é possível fazer algo bem mais rápido. Para isso, será preciso usar uma área de trabalho, digamos w[0..r-p-1], do mesmo tipo e mesmo tamanho que o vetor v[p..r-1].

A palavra-chave static indica que a função intercala tem caráter auxiliar, e não deve ser invocada diretamente pelo usuário do algoritmo de ordenação.

Desempenho. A função intercala consiste essencialmente em movimentar elementos do vetor v de um lugar para outro (primeiro de v para w e depois de w para v). A função executa

dessas movimentações, sendo n o tamanho do vetor v[p..r-1]. O tempo que intercala consome é proporcional ao número de movimentações. Portanto, o consumo de tempo da função é proporcional a n. Assim, o algoritmo é linear.

Exercícios 1

Escreva uma função que receba vetores disjuntos x[0..m-1] e y[0..n-1], ambos em ordem crescente, e produza um vetor z[0..m+n-1] que contenha o resultado da intercalação dos dois vetores dados. Escreva duas versões da função: uma iterativa e uma recursiva.
A função intercala está correta quando p é igual a q, ou seja, quando o vetor v[p..q-1] está vazio? E quando o vetor v[q..r-1] está vazio?
Troque as linhas 9 a 11 da função intercala pelas duas linhas a seguir. A função continua correta?
```
while (i < q)  w[k++] = v[i++];
for (i = p; i < j; ++i)  v[i] = w[i-p]; 
```

Troque o bloco de linhas 5 a 8 da função intercala pelas linhas abaixo. Critique o efeito da troca.

while (i < q && j < r) {
   if (v[i] <= v[j])  w[k++] = v[i++];
   if (v[i] > v[j])  w[k++] = v[j++]; }

Troque o bloco de linhas 3 a 10 da função intercala pelas linhas abaixo. A função continua correta?

i = p; j = q;
for (k = 0; k < r-p; ++k) {
   if (j >= r || (i < q && v[i] <= v[j])) 
      w[k] = v[i++];
   else 
      w[k] = v[j++]; }

Na função intercala, troque o bloco de linhas 5 a 10 pelas linhas abaixo. A função continua correta?

while (k < r-p) {
   while (i < q && v[i] <= v[j]) 
      w[k++] = v[i++];
   while (j < r && v[j] <= v[i]) 
      w[k++] = v[j++]; }

Invariantes. Quais são os invariantes do primeiro while na função intercala?
Mostre que o consumo de tempo da função intercala não é proporcional ao número de comparações entre elementos do vetor.
A seguinte variante da função intercala faz a intercalação in loco, ou seja, sem usar vetor auxiliar. (Ela insere cada elemento de v[q..r-1] em v[p..q-1] como o algoritmo Insertionsort.) Critique a função.
```
while (q < r) {
   int x = v[q], int i;
   for (i = q-1; i >= p && v[i] > x; --i) 
      v[i+1] = v[i];
   v[i+1] = x;
   q++; }
```
A seguinte solução do problema da intercalação está correta? Quais os invariantes do while? (Observe que a função faz a intercalação in loco, ou seja, sem usar vetor auxiliar.) Qual o consumo de tempo?
```
int i, k, x;
i = p; 
while (i < q && q < r) {
   if (v[i] >= v[q]) {
      x = v[q];
      for (k = q - 1; k >= i; --k) 
         v[k+1] = v[k];
      v[i] = x;
      ++q; }
   ++i; }
```
Desafio: intercalação in loco. Invente um função de intercalação tão eficiente quanto intercala que resolva o problema in loco, ou seja, sem usar um vetor auxiliar.
Um algoritmo de intercalação é estável se não altera a posição relativa de elementos iguais. A função intercala discutida acima é estável? E se a comparação v[i] <= v[j] for trocada por v[i] < v[j]?
Intercalação de listas encadeadas. Digamos (para efeito deste exercício) que uma lec é uma lista encadeada (sem cabeça) que contém uma sequência crescente de números inteiros. Escreva uma função que intercale duas lecs, produzindo assim uma terceira. Sua função não deve alocar novas células na memória, mas reaproveitar as células das duas listas dadas.
União de listas encadeadas. Digamos que uma lec é uma lista encadeada (sem cabeça) que contém uma sequência estritamente crescente de números inteiros. (Portanto, uma lec representa um conjunto de números.) Escreva uma função que faça a união de duas lecs. A lista resultante deve ser uma lec e deve ser construída com as células das duas listas dadas.

Intercalação com sentinelas

Sedgewick escreve o algoritmo de intercalação de uma maneira mais interessante. Primeiro, copia o vetor v[p..q-1] para o espaço de trabalho w[0..q-p-1]; depois, copia v[q..r-1] para o espaço w[q-p..r-p-1] em ordem inversa. Com isso, a metade esquerda de w serve de sentinela para a metade direita, e vice-versa, durante o processo de intercalação. Assim, não há necessidade de verificar, a cada iteração, as condições de fronteira i < q-p e j ≥ q-p.

Tal como a versão anterior, esta consome tempo proporcional ao tamanho do vetor v[p..r-1].

Exercícios 2

Discuta o seguinte código alternativo de s_intercala:

for (i = 0, k = p; k < q; ++i, ++k) 
   w[i] = v[k];
for (j = r-p-1, k = q; k < r; --j, ++k) 
   w[j] = v[k];
i = 0; j = r-p-1;
for (k = p; k < r; ++k)
   if (w[i] <= w[j]) v[k] = w[i++];
   else v[k] = w[j--];

[Sedgewick 8.6] Mostre que a função s_intercala discutida acima não é estável. Que modificações é preciso introduzir para que ela se torne estável?

Algoritmo Mergesort

O algoritmo Mergesort usa a estratégia da divisão-e-conquista para ordenar o vetor dado. A fase da divisão é simples: basta quebrar o vetor em dois. A fase da conquista foi implementada acima pela função intercala.

A função recursiva abaixo rearranja o vetor v[p..r-1] em ordem crescente. A base da recursão é formada pelas instâncias em que p ≥ r-1 ; nessas instâncias, o vetor tem no máximo 1 elemento e portanto não é preciso fazer nada para deixar o vetor fique em ordem crescente.

(Notas: 1. Você pode trocar intercala por s_intercala na linha 5 pois essas duas funções são equivalentes. 2. O resultado da divisão por 2 na expressão (p+r)/2 é automaticamente truncado. Por exemplo, (3+6)/2 vale 4.)

Se p < r-1, a instância v[p..r-1] do problema é reduzida ao par de instâncias v[p..q-1] e v[q..r-1]. Essas duas instâncias são estritamente menores que a instância original, uma vez que q < r e q > p (confira!) no fim da linha 2. Assim, por hipótese de indução, o vetor v[p..q-1] estará em ordem crescente no fim da linha 3 e o vetor v[q..r-1] estará em ordem crescente no fim da linha 4. Portanto, no fim da linha 5, o vetor v[p..r-1] estará em ordem crescente, graças à operação de intercalação.

Para rearranjar em ordem crescente um vetor v[0..n-1], como quer a formulação original do problema, basta executar mergesort (0, n, v).

Exercícios 3

Mostre que p < q < r no fim da linha 2 de mergesort.
Que acontece se trocarmos (p+r)/2 por (p+r-1)/2 no código da função mergesort? Que acontece se trocarmos (p+r)/2 por (p+r+1)/2?
Submeta um vetor indexado por 1..4 à função mergesort. Teremos a seguinte sequência de invocações da função (observe a indentação):
```
mergesort (1,5,v)
    mergesort (1,3,v)
        mergesort (1,2,v)
        mergesort (2,3,v)
    mergesort (3,5,v)
        mergesort (3,4,v)
        mergesort (4,5,v)
```
Repita o exercício com um vetor indexado por 1..5.
Pegadinha. Quais são os invariantes da função mergesort?
Teste de correção. Escreva um programa para testar, experimentalmente, a correção de sua implementação do algoritmo Mergesort. (Veja o exercício análogo para o Insertionsort.)
A ordenação produzida pela função mergesort é estável?
Overflow. Se o tamanho do vetor estiver próximo de INT_MAX, a execução da função mergesort pode descarrilar na linha 2 em virtude de um overflow aritmético. Como evitar isso?

Animações do Mergesort

A animação à direita (copiada da Wikipedia) mostra a ordenação de um vetor v[0..99] que contém uma permutação aleatória de 0..99. (Veja uma versão mais lenta da animação.) Cada elemento v[i] é representado pelo ponto de coordenadas (i, v[i]).

Exercícios 4

A seguinte função promete rearranjar v[p..r-1] em ordem crescente. A função está correta?

void mergesort1 (int p, int r, int v[]) {
    if (p < r-1) {
       int q = (p + r) / 2;
       mergesort1 (p, q, v);  
       mergesort1 (q, r, v);
       intercala (p, q+1, r, v); } }

A seguinte função promete rearranjar v[p..r-1] em ordem crescente. A função está correta?

void mergesort2 (int p, int r, int v[]) {
    if (p < r) {
       int q = (p + r) / 2;
       mergesort2 (p, q, v);  
       mergesort2 (q, r, v);
       intercala (p, q, r, v); } }

Esta função está correta? Ela promete rearranjar v[p..r-1] em ordem crescente.

void mergesort3 (int p, int r, int v[]) {
    if (p < r-1) {
       int q = (p + r - 1) / 2;
       mergesort3 (p, q, v);  
       mergesort3 (q, r, v);
       intercala (p, q, r, v); } }

Esta função rearranja v[p..r-1] em ordem crescente? E se trocarmos (p+r)/2 por (p+r+1)/2?

void mergesort4 (int p, int r, int v[]) {
    if (p < r-1) {
       int q = (p + r) / 2;
       mergesort4 (p, q-1, v);  
       mergesort4 (q-1, r, v);
       intercala (p, q-1, r, v); } }

Esta função rearranja v[p..r-1] em ordem crescente?

void mergesort5 (int p, int r, int v[]) {
   if (p < r-1) {
      q = r - 2;
      mergesort5 (p, q, v);
      if (v[r-2] > v[r-1]) {
         int t = v[r-2]; 
         v[r-2] = v[r-1]; 
         v[r-1] = t; }
      intercala (p, q, r, v); } }

Esta função rearranja v[p..r-1] em ordem crescente?

void mergesort6 (int p, int r, int v[]) {
   if (p < r-1) {
      q = r - 1;
      mergesort6 (p, q, v);
      intercala (p, q, r, v); } }

Suponha que sua biblioteca tem uma função mrg (p, q, r, v) que recebe um vetor v tal que v[p..q] e v[q+1..r-1] são crescentes e rearranja o vetor de modo que v[p..r-1] fique crescente. Use mrg para implementar o algoritmo Mergesort.
Suponha que sua biblioteca tem uma função interc (v, p, q, r) que recebe um vetor v tal que v[p..q-1] e v[q..r-1] estão em ordem crescente e rearranja o vetor de modo que v[p..r-1] fique em ordem crescente. (Qual o menor valor de q que interc deve aceitar? Qual o maior valor?) Use interc para escrever uma função mrgsrt (v, p, r) que rearranje um vetor v[p..r] em ordem crescente.

Desempenho do algoritmo Mergesort

Aplique a função mergesort a um vetor v[0..n-1]. O tamanho do vetor é reduzido à metade a cada passo da recursão. Na primeira rodada, a instância original do problema é reduzida a duas menores: v[0..n/2-1] e v[n/2..n-1]. Na segunda rodada, temos quatro instâncias:

E assim por diante, até que, na última rodada, cada instância tem no máximo 1 elemento. O número total de rodadas é aproximadamente log n (portanto também aproximadamente lg(n)).

Em cada rodada, a função intercala executa 2n movimentações de elementos do vetor v[0..n-1]. Assim, o número total de movimentações para ordenar v[0..n-1] é aproximadamente

É fácil constatar que o consumo de tempo da função mergesort é proporcional ao número total de movimentações, e portanto proporcional a

Diz-se que o algoritmo é linearítmico. O número n log n cresce muito mais devagar que n² e apenas um pouco mais rapidamente que n. Assim, se um vetor de tamanho N exige T unidades de tempo, um vetor de tamanho 2N exigirá menos que 2.2 T unidades de tempo, desde que N seja maior que 2¹⁰. Da mesma forma, um vetor de tamanho 4N exigirá menos que 4.4 T unidades de tempo, desde que N seja maior que 2²⁰. (Confira as contas!)

O consumo de tempo do Mergesort é proporcional a n log n enquanto o dos algoritmos elementares é proporcional a n². Mas o fator de proporcionalidade é maior para o Mergesort, pois o código é mais complexo. Assim, o Mergesort só se torna realmente mais rápido que os algoritmos elementares quando n é suficientemente grande.

Exercícios 5

Como o consumo de tempo do seguinte fragmento de código varia com n?

int c = 1;
for (int i = 0; i < n; i *= 2) 
   for (int 0 = 1; j < n; ++j) 
      c += 1;

Versão truncada. Escreva uma versão do algoritmo Mergesort com cutoff para vetores pequenos: quando o vetor a ser ordenado tiver menos que M elementos, a ordenação passa a ser feita pelo algoritmo Insertionsort. O valor de M pode ficar entre 10 e 20. (Esse truque é usado na prática porque o algoritmo Insertionsort é mais rápido que o Mergesort puro quando o vetor é pequeno. O fenômeno é muito comum: algoritmos sofisticados são tipicamente mais lentos que algoritmos simplórios quando o volume de dados é pequeno.)
Alocação/desalocação excessivos. A função mergesort acima chama as funções malloc e free muitas vezes (as chamadas acontecem dentro de intercala). Escreva uma versão da função que contenha o código da função de intercalação e chame malloc uma só vez.
Desafio: Mergesort in loco. Invente uma implementação de Mergesort que façam o serviço in loco, ou seja, dispensem o uso de um vetor auxiliar.
Ordem decrescente. Escreva uma versão recursiva do algoritmo Mergesort que rearranje um vetor v[p..r-1] em ordem decrescente. Sua função deve conter o código da intercalação (que deve começar com v[p..q-1] e v[q..r-1] decrescentes e terminar com v[p..r-1] decrescente).
A seguinte função recursiva pretende encontrar o valor de um elemento máximo do vetor v[p..r], não necessariamente ordenado. É claro que o problema só faz sentido se p ≤ r.
```
int max (int p, int r, int v[]) {
   if (p == r) return v[r];
   else {
      int q = (p + r)/2;
      int x = max (p, q, v);
      iny y = max (q+1, r, v);
      if (x >= y) return x;
      else return y; } }
```
A função está correta? Ela é mais rápida que a função iterativa óbvia? Quantas vezes a função chama a si mesma? Suponha que p e r valem 0 e 6 respectivamente e mostre a sequência, devidamente indentada, das chamadas de max.
Teste de desempenho. Escreva um programa para cronometrar sua implementação do Mergesort. (Veja o exercício análogo para o Insertionsort. Para o Mergesort, você pode fazer testes para uma sequência maior de valores de n, talvez 2⁸, 2⁹, … , 2²⁹, 2³⁰.)

Versão iterativa do Mergesort

A versão iterativa do algoritmo Mergesort rearranja um vetor v[0..n-1] em ordem crescente. A cada iteração, o algoritmo intercala dois blocos consecutivos de b elementos cada: o primeiro bloco com o segundo, o terceiro com o quarto, etc. A variável b assume os valores 1, 2, 4, 8, . . .

Há muitas animações e visualizações interessantes da versão iterative do Mergesort:

Exercícios 6

Invariantes. Quais são os invariantes do while externo na função mergesort_i? E os invariantes do while interno?
Segmentos crescentes. A função mergesort_i começa por quebrar o vetor original em segmentos de comprimento 1. Por que não começar com segmentos crescentes maximais? Exemplo: os segmentos crescentes maximais do vetor 1 2 3 0 2 4 6 4 5 6 7 8 9 são 1 2 3 , 0 2 4 6 e 4 5 6 7 8 9 . Explore esta ideia.

Exercícios 7

Listas encadeadas. Escreva uma versão do algoritmo Mergesort que rearranje uma lista encadeada em ordem crescente. Sua função não deve alocar novas células na memória. Faça duas versões: uma recursiva e uma iterativa.
Número de inversões. O número de inversões de um vetor v[0..n-1] é o número de pares ordenados (i,j) tais que 0 ≤ i < j < n e v[i] > v[j]. Escreva uma função que calcule o número de inversões de um vetor dado. O consumo de tempo de sua função deve ser proporcional a n log n no pior caso.
Distância tau de Kendall. Suponha dadas duas permutações, digamos x[0..n-1] e y[0..n-1], de um mesmo conjunto de números. A distância tau entre x e y é o número de pares de elementos do conjunto que estão em ordem diferente em x e y, ou seja, a cardinalidade do conjunto X − Y onde X é o conjunto de todos os pares (x[i],x[j]) tais que i < j e Y é o conjunto de todos os pares (y[i],y[j]) tais que i < j. (A definição não é assimétrica como parece pois os conjuntos X − Y e Y − X têm a mesma cardinalidade.) Escreva uma função eficiente que calcule a distância tau entre x e y.

`p`						`q-1`		`q`			`r-1`
111	333	555	555	777	999	999		222	444	777	888

`0`	`1`	`2`	`3`	`4`	`5`	`6`	`7`	`8`	`9`	`10`
111	999	222	999	333	888	444	777	555	666	555

`0`				`p`		`p+b`		`p+2b`		`n-1`
111	999	222	999	333	888	444	777	555	666	555

Mergesort: ordenação por intercalação

Intercalação de vetores ordenados

Exercícios 1

Intercalação com sentinelas

Exercícios 2