DjVu (Déjà Vu, do francês) é um formato extraordinário para guardar imagens e textos simultaneamente e disponibilizá-los pela teia. O formato é um concorrente do pdf, apresentando inúmeras vantagens em compressão, versatilidade e eficiência de transmissão. É um formato aberto (embora proprietário), cujas especificações estão disponíveis sob a licença GPL.
Originalmente desenvolvido nos Bell Labs da AT&T, a partir de 1995, o formato hoje está sendo comercialmente explorado pela empresa Lizardtech e ao mesmo tempo está sendo desenvolvido, como software aberto, pelo projeto DjVuLibre, conduzido pelos próprios inventores da tecnologia.
Para maiores informações e para inúmeros exemplos remetemos o leitor para os sítios abaixo. A título de exemplo maior recomenda-se a leitura do famoso artigo de Claude Shannon que lançou as bases da Teoria da Informação (descubra, num instante, que a palavra "entropy" aparece neste artigo pela primeira vez na página 393).
Observamos ainda que o CiteSeer tem o texto completo de mais de 100.000 artigos científicos de Ciência da Computação no formato DjVu (apenas na forma de imagem, sem texto por enquanto).
Como o pdf, o DjVu exige um visualizador para a sua leitura. O visualizador é gratuito e pode ser instalado como um plugin nos browsers mais comuns. Visualizadores para Windows, Mac e Linux encontram-se em: LizardTech, Inc. Downloads
Para sistemas Unix, o projeto DjVuLibre disponibiliza visualizadores com o programa fonte. Existem ainda pacotes binários para as principais distribuições do Linux. Alguns deles são:
Para outros Unices, como SGI Irix, Solaris: veja http://djvu.sourceforge.net/
Utilitários sofisticados para criar e manipular arquivos DjVu estão comercialmente disponíveis. Estão disponíveis também excelentes utilitários com código aberto no projeto DjVuLibre. Estes utilitários incluem programas para manipulação das imagens e dos textos, implementando, inclusive algumas interfaces em XML. Um pacote Debian, com binários de alguns dos programas de desenvolvimento é o djvulibre-dev.
Uma das aplicações do formato DjVu é guardar e disponibilizar na rede páginas impressas escaneadas. À imagem acrescenta-se o texto decifrado por algum software de OCR. Em particular, o sistema de software livre claraocr, http://www.claraocr.org/ desenvolvido por Ricardo Ueda, pode ser usado de forma fácil e eficiente para esta finalidade. A versão eletrônica do livro Aspectos Teóricos da Computação, de Cláudio L. Lucchesi, Imre Simon, Istvan Simon, Janos Simon e Tomasz Kowaltowski, foi produzido desta forma.
e-mail:
Imre Simon <is@ime.usp.br>