Título: Mineração de Classes Hierárquicas de Documentos Digitais Palestrante: Evelyn Cristina Pinto Resumo: Um problema fundamental na mineração de textos é extrair automaticamente uma categorização hierárquica de fluxos de documentos que chegam continuamente no tempo. Mensagens eletrônicas e artigos de notícias são dois exemplos naturais de tais fluxos. Todos caracterizados por tópicos que aparecem, crescem em intensidade num período de tempo, e então vão embora. A literatura publicada num campo particular de pesquisa pode exibir o mesmo fenômeno sobre uma escala de tempo bem mais longa. O surgimento de um tópico num fluxo de documentos é sinalizado por uma "explosão de atividade", com certas características que crescem incisivamente na freqüência com que o tópico emerge. Nesse seminário, apresentaremos uma aproximação formal para modelagem de tais "explosões" e extração de tópicos, proposta por Jon Kleinberg. Também será apresentada uma implementação de tal modelagem e alguns resultados obtidos a partir de artigos das conferências STOC-FOCS entre 1969 e 1997.