Como fazer busca, inserção e remoção em um vetor

. . . there is a huge difference
between working programs and good programs.
A good program not only works,
but is easy to read and maintain.
— P. A. Darnell, Ph. E. Margolis,
Software Engineering in C

Programs must be written for people to read,
and incidentally for machines to execute.
— H. Abelson, G. Sussman,
The Structure and Interpretation of Computer Programs

A Computação anda sobre três pernas:
a correção, a eficiência e a elegância.
— prof. Imre Simon

Um vetor, ou arranjo (= array), é uma estrutura de dados que armazena uma sequência de objetos, todos do mesmo tipo, em posições consecutivas da memória RAM (= random access memory) do computador. Essa estrutura permite acesso aleatório: qualquer elemento do vetor pode ser alcançado diretamente, sem passar pelos elementos anteriores (o décimo elemento, por exemplo, pode ser alcançado sem que seja necessário passar antes pelo primeiro, segundo, etc., nono elementos).

Como procurar um determinado objeto em um vetor? Como inserir um novo objeto no vetor? Como remover um elemento do vetor? Esses problemas serão usados como pretexto para exibir exemplos de algoritmos e para ilustrar os conceitos de correção, eficiência e elegância de código. Os três problemas — busca, inserção e remoção — reaparecerão, em outros contextos, em muitas páginas deste sítio.

Imagine que queremos armazenar n números inteiros num vetor v. O espaço ocupado pelo vetor na memória pode ter sido criado pela declaração

sendo N uma constante (possivelmente uma macro definida por um #define). Se os números forem armazenados nas posições 0, 1, … , n-1, diremos que

É claro que devemos ter 0 ≤ n ≤ N. Se n == 0, o vetor v[0..n-1] está vazio. Se n == N, o vetor está cheio.

Exercícios 1

[Sedgewick 3.11] Diga (sem usar o computador) qual o conteúdo do vetor v depois das seguintes instruções:
```
int v[99];
for (i = 0; i < 99; ++i) v[i] = 98 - i;
for (i = 0; i < 99; ++i) v[i] = v[v[i]];
```
Inversão. Suponha que um vetor v[1..n] contém uma permutação de 1..n. Escreva uma função que inverta essa permutação: se v[i] == j no vetor original, queremos ter v[j] == i no fim da execução da função.

Busca

O problema da busca (= search problem) consiste no seguinte: Dado um inteiro x e um vetor v[0..n-1] de inteiros, encontrar x em v, ou seja, encontrar um índice k tal que v[k] == x.

Uma solução desse problema é um algoritmo que recebe os valores de x, n, v e devolve um índice k. Somos imediatamente confrontados por uma decisão de projeto: que coisa nosso algoritmo deve devolver se não existir k tal que v[k] == x? Em outras palavras, o que nosso algoritmo deve fazer se a instância do problema não tiver solução?

Nossa decisão de projeto: devolva -1 se a instância não tem solução. Esta é uma boa convenção pois -1 não pertence ao conjunto 0..n-1 de índices válidos. Para implementar essa convenção, convém varrer o vetor do fim para o começo:

É fácil verificar que a função está correta. A função também é eficiente e elegante: ela não perde tempo à toa, não tem instruções nem variáveis desnecessárias, e não trata de casos especiais (como, por exemplo, o caso n == 0) em separado.

Um código igualmente correto, eficiente e elegante pode ser escrito com um for no lugar do while:

Maus exemplos. Para fazer contraste com a função busca acima, eis algumas funções deselegantes, ineficientes ou incorretas. A primeira, muito popular, usa uma variável booleana de passagem, ou de sinalização:

A segunda, também muito popular, trata do vetor vazio em separado, sem necessidade:

A próxima função é ineficiente (pois continua calculando depois de ter encontrado uma solução) e deselegante (pois inicializa uma variável desnecessariamente):

Algumas funções parecem razoáveis à primeira vista, mas estão simplesmente erradas. No seguinte exemplo, a última iteração comete o erro de examinar v[-1]:

(As comparações deveriam ter sido feitas na ordem correta: k >= 0 && v[k] != x.)

Função com sentinela. Podemos tomar uma decisão de projeto diferente e devolver n, em lugar de -1, se x não estiver em v[0..n-1]. Nesse caso, é melhor percorrer o vetor do começo para o fim:

A função ficaria ainda melhor se usássemos uma sentinela para evitar as repetidas comparações de k com n:

(Estamos supondo aqui que o vetor não está cheio e portanto há espaço para a sentinela.)

Exercícios 2

Qual o invariante do processo iterativo na função busca? [Solução]
Suponha que o vetor v[0..n-1] tem dois ou mais elementos iguais a x. Qual deles será apontado pela função busca?
Quantas comparações entre x e elementos do vetor v a função busca faz?

Critique a seguinte versão da função busca:

int k = 0;
while (k < n && v[k] != x) k += 1;
if (v[k] == x) return k;
else return -1;

Critique a seguinte versão da função busca:

int sol;
for (int k = 0; k < n; ++k) {
   if (v[k] == x) sol = k;
   else sol = -1; 
}
return sol;

Versão booleana. Escreva uma função que receba x, v e n e devolva 1 se x está em v[0..n-1] e 0 em caso contrário.

Máximo. A função abaixo promete encontrar o valor de um elemento máximo de v[0..n-1]. A função cumpre a promessa?

int maxi (int n, int v[]) {       
   int m = v[0];
   for (int j = 1; j < n; ++j)
      if (v[j-1] < v[j]) m = v[j];
   return m;
}

Máximo. A seguinte função promete calcular o valor de um elemento máximo de um vetor v[0..n-1]. O problema faz sentido quando n vale 0? A função está correta?
```
int maximo (int n, int v[]) { 
   int x = v[0];
   for (int j = 1; j < n; j += 1)
      if (x < v[j]) x = v[j];
   return x;
}
```
Faz sentido trocar x = v[0] por x = 0, como fazem alguns programadores descuidados? Faz sentido trocar x = v[0] por x = INT_MIN? Faz sentido trocar x < v[j] por x <= v[j]? [Solução parcial: ./solucoes/array10.html]
★ Segmento máximo de zeros. Escreva uma função que calcule o comprimento do mais longo segmento de zeros (ou carreira de zeros) em um vetor de números inteiros. Procure examinar o menor número possível de elementos do vetor.

Busca recursiva

Como isso funciona? O número de elementos relevantes de v é n. Se n é 0 então v[0..n-1] é vazio e portanto x não está em v[0..n-1]. Agora suponha que n > 0; nesse caso, x está em v[0..n-1] se e somente se

Resumindo: o código reduz a instância que busca x em v[0..n-1] à instância que busca x em v[0..n-2].

Mau exemplo. A seguinte alternativa para a função busca_r é muito deselegante. Ela coloca o caso n == 1 na base da recursão e com isso complica as coisas sem necessidade. (Além disso, só funciona se n ≥ 1.)

Exercícios 3

Suponha que o vetor v[0..n-1] tem dois ou mais elementos iguais a x. Qual deles será apontado pela função busca_r?
Quantas comparações entre x e elementos do vetor v a função busca_r faz?

Critique a seguinte variante da função busca_r:

int busc (int x, int n, int v[]) {
   if (n == 0) return -1;
   int k = busc (x, n-1, v);
   if (k != -1) return k;
   if (x == v[n-1]) return n-1;
   return -1; 
}

Critique a seguinte variante da função busca_r:

int busc (int x, int n, int v[]) {
   if (v[n-1] == x) return n-1;
   else return busc (x, n-1, v); 
}

Critique a seguinte variante da função busca_r:

int busc (int x, int n, int v[]) {
   if (v[n-1] == x || n == 0) return n-1;
   else return busc (x, n-1, v); 
}

Escreva uma função recursiva que receba um inteiro x, um vetor v e índices i e m e devolva um índice k no conjunto i..m-1 tal que v[k] == x; se tal k não existe, devolva i-1.

Remoção

Digamos que quero remover o elemento de índice k do vetor v[0..n-1]. Para isso, basta deslocar o segmento v[k+1..n-1] do vetor para as posições k..n-2. Por exemplo, o resultado da remoção do elemento de índice 3 do vetor 0 11 22 33 44 55 é o vetor 0 11 22 44 55 . É claro que o problema faz sentido se e somente se 0 ≤ k < n.

Note como tudo funciona bem até mesmo quando k vale n-1 e quando k vale 0. (Mas é claro que a remoção haverá de consumir tanto mais tempo quanto menor for k.)

Como usar a função? Para remover o elemento de índice 51 de v[0..n-1] (estou supondo que 51 < n), por exemplo, basta dizer

Versão recursiva. É um bom exercício escrever uma versão recursiva de remove. O tamanho de uma instância do problema é medido pela diferença n-k e a instância é considerada pequena se n-k vale 1. Portanto, a base da recursão é o caso em que k vale n-1.

[Carlos A. Estombelo-Montesco mostrou que uma versão anterior dessa função estava errada.]

Exercícios 4

Que acontece se trocarmos v[j-1] = v[j] por v[j] = v[j+1] no código da função remove?

Critique as seguintes versões de remove:

for (int j = n-1; j > k; --j)  
   v[j-1] = v[j];

for (int j = k+1; j < n; ++j)  
   v[j-1] = v[j];
v[n-1] = 0;

if (k < n - 1) 
   for (int j = k+1; j < n; ++j)  
      v[j-1] = v[j];

Escreva uma versão da função remove que cuide de decrementar o valor de n depois da remoção. (Sugestão: Passe o endereço da variável n à função remove.)

Discuta a seguinte versão de remove_r:

int remove_r2 (int k, int n, int v[]) {
   int x = v[k];
   if (k < n-1) {
      remove_r2 (k, n-1, v);
      v[n-2] = v[n-1]; }
   return x; 
}

Rediscuta o problema da remoção sob condições mais gerais: Suponha que a parte relevante do vetor é v[i..m-1]; para remove v[k], puxe v[k+1..m-1] para a esquerda ou empurre v[i..k-1] para a direita, dependendo de qual das alternativas for mais rápida. (E não esqueça de atualizar os valores de i e m.)

Inserção

Dado um vetor de números v[0..n-1], queremos inserir um novo número x entre os elementos de índices k-1 e k. Isso faz sentido não só quando 1 ≤ k ≤ n-1 como também quando k vale 0 (insere no início) e quando k vale n (insere no fim). Em suma, faz sentido para qualquer k no conjunto 0..n.

É claro que você só deve inserir x se tiver certeza de que o vetor não está cheio; caso contrário, teremos um transbordamento (= overflow). Portanto, certifique-se de que n+1 ≤ N antes de chamar a função.

Note como insere funciona bem até mesmo quando quero inserir no início do vetor e quando quero inserir no fim!

Para inserir um novo elemento com valor 999 entre as posições 50 e 51 (estou supondo que 51 ≤ n) basta dizer

Versão recursiva. É um bom exercício escrever uma versão recursiva de insere:

Exercícios 5

Escreva uma função que insira x entre as posições k e k+1 de um vetor v[0..n-1]. Escreva também uma boa documentação da função.
Escreva uma versão da função insere que cuide de incrementar o valor de n depois da inserção. (Sugestão: Passe o endereço da variável n à função insere.)

Discuta a seguinte versão de insere_r:

int insere_r2 (int k, int x, int n, int v[]) {
   if (k == n) {
      v[n] = x;
      return n + 1; }
   else {
      int y = v[k];
      v[k] = x;
      return insere_r2 (k+1, y, n, v); } 
}

Rediscuta o problema da inserção sob condições mais gerais: Suponha que a parte relevante do vetor v é v[i..m-1]; para inserir x entre v[k-1] e v[k] você tem duas opções: empurrar v[k..m-1] para a direita ou puxar v[i..k-1] para a esquerda; escolha a opção mais rápida. (E não esqueça de atualizar os valores de i e m.)

Busca e remoção

Considere agora uma combinação dos problemas de busca e remoção. Suponha que queremos remover todos os elementos nulos do vetor v[0 .. n-1]. É claro que o problema faz sentido com qualquer n ≥ 0 (o caso em que n == 0 é trivial). Por exemplo, se n vale 7 e v[0..6] é

então o vetor resultante deve ser 11 22 33 44 . Embora o enunciado do problema não peça isso explicitamente, vamos exigir que a função devolva o número de elementos do vetor depois da remoção dos zeros.

(A instrução v[i++] = v[j] tem o mesmo efeito que v[i] = v[j]; i += 1.) No início de cada iteração temos o seguinte invariante: v[0..i-1] é o vetor que resulta da remoção dos zeros de v[0..j-1]; é claro que i ≤ j.

Note como a coisa funciona bem até mesmo quando n vale 0. Também funciona bem quando o vetor dado não tem zero algum. Também funciona bem quando o vetor dado só tem zeros.

Maus exemplos. Eis uma versão pior, que desperdiça espaço (pois usa um vetor auxiliar de n elementos):

Segue mais uma versão deselegante e ineficiente. Esta versão é ineficiente porque a instrução v[j] = v[j+1] é repetida um número excessivo de vezes, uma vez que não copia v[j+1] para o seu lugar definitivo:

Para melhor sentir a ineficiência desta versão, considere o seguinte exemplo. Suponha que n é 100 e que todos os elementos de v exceto v[99] são nulos. A versão acima copia elementos de v de um lugar para outro 4950 vezes enquanto a primeira versão de tirazeros faz isso uma só vez!

Segue uma versão ainda mais deselegante e ineficiente. A alteração do valor de i dentro do for controlado por i é uma péssima maneira de obter o efeito desejado. Além disso, a variável j é inicializada desnecessariamente e a condição i < n-1 no if é supérflua.

A versão seguinte não é mais eficiente que a anterior, mas pelo menos não é tão torta:

Versão recursiva. Para terminar, eis uma versão recursiva de tirazeros. Note como a instrução v[m] = v[n-1] coloca v[n-1] no seu lugar definitivo.

Segue uma versão torta e ineficiente. Ao contrário da versão anterior, ela não coloca cada elemento do vetor no seu lugar definitivo de uma só vez. (Note que há duas chamadas recursivas da função e que as duas chamadas têm forma diferente. Mau sinal!)

Às vezes, a versão recursiva de uma função exige parâmetros adicionais, como aconteceu aqui com o parâmetro k. É essencial explicar ao usuário, como fizemos acima, qual o papel do parâmetro adicional. (Mas é claro que nem a melhor das explicações pode tornar boa uma função malconcebida.)

Exercícios 6

Critique a seguinte função. Ela promete eliminar os zeros de v[0..n-1], deixar o resultado em v[0..m-1] e devolver m.

int tira0 (int n, int v[]) {
   int z = 0;
   for (int i = 0; i < n; ++i) {
      if (v[i] == 0) z += 1;
      v[i-z] = v[i]; }
   return n - z; 
}

Critique a seguinte função. Ela promete eliminar os zeros de v[0..n-1], deixar o resultado em v[0..m-1] e devolver m.

int tira0 (int n, int v[]) {
   int z = 0;
   for (int i = 0; i < n - z; ++i) {
      if (v[i] == 0) {
         z += 1;
         for (int k = i; k < n - z; ++k) 
            v[k] = v[k+1];
         --i; } }
   return n - z; 
}

Escreva uma função recursiva que apague todos os # de um vetor c[0..n-1] de caracteres ASCII. Exemplo: Se n vale 7 e o vetor contém a b c # # d # então o resultado deve ser a b c d .
★ Escreva uma função que receba duas strings ASCII, str e del, e apague de str todos os bytes que estão em del. Por exemplo, se str é "aaa*$-bbb#ccc*" e del é "$#*", o estado final de str deve se "aaa-bbbccc". Procure escrever uma função que seja eficiente. Sua função não deve alocar nenhum vetor novo.
Pequena Aplicação. Escreva um programa para administrar uma coleção de números digitados pelo usuário. A coleção pode conter mais de uma ocorrência de um mesmo número. O usuário pode inserir números na coleção e remover números que já estão lá. Se o usuário digitar
```
i 222
```
(seguido de ↵) o número 222 é inserido na coleção. Se digitar
```
r 333
```
então uma ocorrência do número 333 é removido da coleção (se não houver ocorrência alguma, o comando é ignorado). Se o usuário digitar qualquer outro caractere que não 'i' ou 'r', a execução do programa termina. Depois de cada inserção ou remoção, o programa deve exibir a coleção. A coleção deve ser mantida em ordem crescente. [Solução: ./solucoes/array2.html]

Exercícios 7: desafios

Problema de Josephus. Imagine uma roda de n pessoas numeradas de 1 a n. (A pessoa seguinte à n é 1.) Percorra a roda em sentido crescente a partir de 1. À medida que for percorrendo a roda, elimine cada m-ésima pessoa até que a roda tenha apenas uma pessoa. Qual o número da sobrevivente?
Segmento constante. Digamos que um segmento v[i..j] de um vetor v[0..n-1] é constante se todos os seus elementos têm o mesmo valor. Escreva uma função simples e eficiente que calcule o comprimento de um segmento constante de v[0..n-1] que tenha comprimento máximo.
Subsequência. Um subvetor de um vetor v é o que sobra depois que alguns dos elementos de v são apagados. (Por exemplo, 12 13 10 3 é um subvetor de 11 12 13 11 10 9 7 3 3 mas não de 11 12 10 11 13 9 7 3 3.) Escreva uma função eficiente que decida se x[0..m-1] é subvetor de v[0..n-1].
Subsequência crescente máxima. Um subvetor de um vetor v é o que sobra depois que alguns dos elementos de v são apagados. Escreva uma função eficiente que determine um subvetor crescente de comprimento máximo de um vetor v[0..n-1].
Segmento de soma máxima. A soma de um vetor v[i..k] de inteiros é o número v[i] + v[i+1] + ... + v[k]. A altura de um vetor v[1..n] é a soma de um segmento não vazio de v[1..n] que tenha soma máxima. Em outras palavras, a altura de v[1..n] é a maior soma da forma v[i] + v[i+1] + ... + v[k] com 1 ≤ i ≤ k ≤ n. (Exemplo: Um dos segmentos do vetor 20 -30 15 -10 30 -20 -30 30 tem soma 15 - 10 + 30 = 35. Existe algum segmento com soma maior?) Escreva uma função que calcule a altura de um vetor v[1..n]. Use o algoritmo mais eficiente que puder.
Soma de dois elementos distantes. Dado um vetor v[0..n-1] de números e um inteiro d tal que 0 ≤ d ≤ n-1 encontrar o maior número da forma v[i] + v[j] com j - i ≥ d.

Perguntas e respostas

Pergunta: Uma das funções acima usa a expressão while (k >= 0 && v[k] != x). Eu não deveria escrever while ((k >= 0) && (v[k] != x))?
Resposta: Não. Os parênteses adicionais são supérfluos porque os operadores >= e != têm precedência sobre &&.
Pergunta: Por que deixar um espaço entre o nome de uma função e a lista de seus argumentos?
Resposta: Eu prefiro funcao (arg1, arg2) a funcao(arg1, arg2) porque na segunda alternativa o nome da função fica encavalado com o primeiro argumento, dificultando a leitura. Veja o capítulo Leiaute.
Pergunta: Posso alocar um vetor estaticamente com número não-constante de elementos? Por exemplo, posso dizer
```
int v[n];
```
se o valor de n só se torna conhecido durante a execução do programa?
Resposta: Não. É melhor não fazer isso.

`0`	`0`								`n-1`
443	222	555	111	333	444	555	666	888	777	888	999
`x`	`v`

`0`					`i`			`j`				`n`
999	999	999	999	999	000	999	000	999	000	999	000	999
versão sem zeros do `v[0..j-1]` original					lixo lixo

Vetores

Exercícios 1

Busca

Exercícios 2

Busca recursiva

Exercícios 3

Remoção

Exercícios 4

Inserção

Exercícios 5

Busca e remoção

Exercícios 6

Exercícios 7: desafios

Perguntas e respostas