[Prévia cron] [Próxima Cron] [Prévia por assunto] [Próxima por assunto]
[Índice cronológico]
[Índice de assunto]
[Índice de autor]
Nova Maquina de Busca Nacional: TodoBR
- Subject: Nova Maquina de Busca Nacional: TodoBR
- From: Marcelo Brito dos Santos <brito@ime.usp.br>
- Date: Fri, 26 Nov 1999 17:06:51 -0200
Novo Site de Busca Nacional: TodoBR
Colaboração: Edleno Silva de Moura [edleno@dcc.ufmg.br]
O Departamento de Ciencia da Computacao da Universidade Federal de Minas
Gerais esta lancando uma maquina de busca para a web brasileira, o
TodoBR
(http://www.todobr.com.br).
Aqui vao algumas das caracteristicas e vantagens da Maquina de Busca
TodoBR:
Ao se concentrar na Web brasileira, TodoBR focaliza o conjunto de
documentos a pesquisar, retornando respostas precisas e de maior
relevancia para o usuario.
TodoBR coleta e armazena permanentemente toda a Web brasileira, cerca de
5 milhoes de paginas, o que garante cobertura completa de todos os sites
".BR".
TodoBR coleta e disponibiliza para pesquisa documentos em formatos
variados tais como texto, HTML, Postscript (PS), Doc (Word) e PDF.
O sistema de coleta de paginas do TodoBR representa o estado da arte e,
por isto, e' capaz de revisitar todos os documentos da Web brasileira em
poucos dias.
A maquina de busca do TodoBR tem outra caracteristica exclusiva, que
permite ao usuario buscar informacao focalizando qualquer estado ou
regiao do Brasil, aumentando dramaticamente a qualidade das respostas.
Pode-se, por exemplo, localizar pessoas mais rapidamente e evitar
encontrar muitos homonimos informando o estado onde moram.
A maquina de busca do TodoBR permite a formulacao de consultas
utilizando acentos, melhorando a qualidade das respostas. Pode-se, por
exemplo, buscar paginas sobre o passaro sabia' ou sobre o estado do
Para'. Esta e' outra caracteristica exclusiva da tecnologia
desenvolvida.
TodoBR permite que o usuario procure por frases exatas como "regiao
metropolitana de Belo Horizonte". A busca por frases exatas pode ser
combinada com a busca por estados (ou regioes) e a busca por acentos,
levando diretamente à informacao desejada.
TodoBR utiliza algoritmos originais de compressao no estado da arte,
acelerando extraordinariamente o processamento de consultas. TodoBR
utiliza algoritmos originais que tiram proveito de hardware distribuido
e paralelo, proporcionando ganhos diferenciados em desempenho. Em sua
versao beta, o TodoBR utiliza 4 maquinas conectadas por uma rede a 1
Gbps (gigabits por segundo), com 2.8 Gbytes em memoria e 280 Gbytes de
capacidade de
armazenamento em disco.
[ Fonte: Dicas-l - http://www.dicas-l.unicamp.br/ ]
--
Marcelo Brito
Mestrando em Ciencia da Computacao - IME/USP
http://www.ime.usp.br/~brito
brito@ime.usp.br
Sao Paulo -SP