[Prévia cron] [Próxima Cron] [Prévia por assunto] [Próxima por assunto]
[Índice cronológico] [Índice de assunto] [Índice de autor]

Nova Maquina de Busca Nacional: TodoBR



Novo Site de Busca Nacional: TodoBR



Colaboração: Edleno Silva de Moura [edleno@dcc.ufmg.br] 

O Departamento de Ciencia da Computacao da Universidade Federal de Minas
Gerais esta lancando uma maquina de busca para a web brasileira, o
TodoBR
(http://www.todobr.com.br). 

Aqui vao algumas das caracteristicas e vantagens da Maquina de Busca
TodoBR: 

Ao se concentrar na Web brasileira, TodoBR focaliza o conjunto de
documentos a pesquisar, retornando respostas precisas e de maior
relevancia para o usuario. 

TodoBR coleta e armazena permanentemente toda a Web brasileira, cerca de
5 milhoes de paginas, o que garante cobertura completa de todos os sites
".BR". 

TodoBR coleta e disponibiliza para pesquisa documentos em formatos
variados tais como texto, HTML, Postscript (PS), Doc (Word) e PDF. 

O sistema de coleta de paginas do TodoBR representa o estado da arte e,
por isto, e' capaz de revisitar todos os documentos da Web brasileira em
poucos dias. 

A maquina de busca do TodoBR tem outra caracteristica exclusiva, que
permite ao usuario buscar informacao focalizando qualquer estado ou
regiao do Brasil, aumentando dramaticamente a qualidade das respostas.
Pode-se, por exemplo, localizar pessoas mais rapidamente e evitar
encontrar muitos homonimos informando o estado onde moram. 

A maquina de busca do TodoBR permite a formulacao de consultas
utilizando acentos, melhorando a qualidade das respostas. Pode-se, por
exemplo, buscar paginas sobre o passaro sabia' ou sobre o estado do
Para'. Esta e' outra caracteristica exclusiva da tecnologia
desenvolvida. 

TodoBR permite que o usuario procure por frases exatas como "regiao
metropolitana de Belo Horizonte". A busca por frases exatas pode ser
combinada com a busca por estados (ou regioes) e a busca por acentos,
levando diretamente à informacao desejada. 

TodoBR utiliza algoritmos originais de compressao no estado da arte,
acelerando extraordinariamente o processamento de consultas. TodoBR
utiliza algoritmos originais que tiram proveito de hardware distribuido
e paralelo, proporcionando ganhos diferenciados em desempenho. Em sua
versao beta, o TodoBR utiliza 4 maquinas conectadas por uma rede a 1
Gbps (gigabits por segundo), com 2.8 Gbytes em memoria e 280 Gbytes de
capacidade de
armazenamento em disco. 


[ Fonte: Dicas-l - http://www.dicas-l.unicamp.br/ ]
-- 

	Marcelo Brito
	Mestrando em Ciencia da Computacao - IME/USP
	http://www.ime.usp.br/~brito
	brito@ime.usp.br
	Sao Paulo -SP