Arquivos em DjVu


DjVu (Déjà Vu, do francês) é um formato extraordinário para guardar imagens e textos simultaneamente e disponibilizá-los pela teia. O formato é um concorrente do pdf, apresentando inúmeras vantagens em compressão, versatilidade e eficiência de transmissão. É um formato aberto (embora proprietário), cujas especificações estão disponíveis sob a licença GPL.

Originalmente desenvolvido nos Bell Labs da AT&T, a partir de 1995, o formato hoje está sendo comercialmente explorado pela empresa Lizardtech e ao mesmo tempo está sendo desenvolvido, como software aberto, pelo projeto DjVuLibre, conduzido pelos próprios inventores da tecnologia.

Para maiores informações e para inúmeros exemplos remetemos o leitor para os sítios abaixo. A título de exemplo maior recomenda-se a leitura do famoso artigo de Claude Shannon que lançou as bases da Teoria da Informação (descubra, num instante, que a palavra "entropy" aparece neste artigo pela primeira vez na página 393).

Observamos ainda que o CiteSeer tem o texto completo de mais de 100.000 artigos científicos de Ciência da Computação no formato DjVu (apenas na forma de imagem, sem texto por enquanto).

Como o pdf, o DjVu exige um visualizador para a sua leitura. O visualizador é gratuito e pode ser instalado como um plugin nos browsers mais comuns. Visualizadores para Windows, Mac e Linux encontram-se em: LizardTech, Inc. Downloads

Para sistemas Unix, o projeto DjVuLibre disponibiliza visualizadores com o programa fonte. Existem ainda pacotes binários para as principais distribuições do Linux. Alguns deles são:

Para outros Unices, como SGI Irix, Solaris: veja http://djvu.sourceforge.net/

Utilitários sofisticados para criar e manipular arquivos DjVu estão comercialmente disponíveis. Estão disponíveis também excelentes utilitários com código aberto no projeto DjVuLibre. Estes utilitários incluem programas para manipulação das imagens e dos textos, implementando, inclusive algumas interfaces em XML. Um pacote Debian, com binários de alguns dos programas de desenvolvimento é o djvulibre-dev.

Uma das aplicações do formato DjVu é guardar e disponibilizar na rede páginas impressas escaneadas. À imagem acrescenta-se o texto decifrado por algum software de OCR. Em particular, o sistema de software livre claraocr, http://www.claraocr.org/ desenvolvido por Ricardo Ueda, pode ser usado de forma fácil e eficiente para esta finalidade. A versão eletrônica do livro Aspectos Teóricos da Computação, de Cláudio L. Lucchesi, Imre Simon, Istvan Simon, Janos Simon e Tomasz Kowaltowski, foi produzido desta forma.


e-mail: Imre Simon <is@ime.usp.br>

Last modified: Tue Feb 4 15:18:53 BRST 2003