1
e-dictor:
Uma Ferramenta Integrada para anotação de edição e classe de palavras
Maria Clara Paixão de Sousa | Fábio Natanael Kepler

1. Visão Geral | 2. Motivações | 3. Apresentação da Ferramenta | 4. Aspectos Técnicos | 5. Balanço e Perspectivas | Referências

 

 

1. Visão Geral

Apresentaremos aqui uma ferramenta de edição eletrônica e anotação morfológica desenvolvida para corpora baseados em textos antigos, o E-Dictor, em versão experimental.

A técnica se funda em dois sistemas já consolidados:

O E-Dictor integra os dois planos de anotação numa interface gráfica amigável, e representa uma alternativa à anotação direta com XML, com vantagens sobre aos aplicativos abertos atualmente disponíveis.

 

 

 2. Motivações

A ferramenta de edição E-dictor foi desenvolvida para facilitar o trabalho de edição eletrônica de textos antigos para fins de análise lingüística automática.

A perspectiva histórica sobre a Língua Portuguesa vem alcançando importância central nas últimas décadas, com a retomada do interesse pelo olhar diacrônico e a renovação da relevância teórica dos estudos da mudança lingüística em diferentes quadros [Mattos e Silva 1988, Kato & Roberts 1993, Castilho 1998]. Esse processo trouxe, como conseqüência, a intensificação do trabalho com textos antigos no Brasil [Megale & Cambraia, 1999]. Para algumas pesquisas realizadas a partir da década de 1990, a junção dos estudos diacrônicos com a prática de edição de textos passa a conferir centralidade para um terceiro campo: a Lingüística de Corpus.

Os estudos históricos realizados com base em textos antigos dependem, antes de tudo, da garantia da fidelidade às formas originais dos textos – sendo este o pilar de sustentação que qualquer estudo lingüístico, em qualquer quadro teórico, deve pressupor. Entretanto, no caso dos corpora eletrônicos, esse pressuposto fundamental precisa ser integrado com requerimentos impostos pela vertente computacional e lingüística dos estudos – tais sejam: a necessidade de quantidade, agilidade e automação no trabalho estatístico de seleção de dados.

O desenvolvimento de ferramentas de anotação como a que apresentamos aqui é um dos caminhos possíveis na direção desses dois objetivos.


img2

 

A forma mais fiel de se reproduzir um texto antigo no meio digital é sem dúvida o fac-simile. Entretanto, para pesquisas lingüísticas é necessário trabalhar o texto como seqüências de caracteres, não como imagens.

A solução de transposição automática da imagem em texto via programas de OCR não é uma opção satisfatória por enquanto, uma vez que as características tipográficas dos textos mais antigos são desafiantes para os programas de OCR disponíveis.

No trabalho de preparação de textos para o Corpus Tycho Brahe, a saída de curto prazo escolhida foi a transcrição dos originais, enquanto se pesquisam formas de adequação do reconhecimento automático (tanto via OCRs aprimorados como via sistemas de correção posterior). >

 
g_008_or

A transcrição deve ser fidedigna ao original, para satisfazer os objetivos lingüísticos das pesquisas.

Entretanto, as características gráficas e grafemáticas dos textos mais antigos (preservadas nas transcrições conservadoras) dificultam o processamento automático posterior (anotação morfológica).

Assim, para cumprir o objetivo de processamento automático, portanto, o texto original precisa ser preparado, ou editado. >

 
g_008_ed_mini

A edição dos textos inclui a modernização das grafias e a normalização dos aspectos grafemáticos, tornando-o assim adequado para o processamento automático.

Neste processo, entretanto, não desejamos perder as características do texto original, importantes para o estudo histórico da língua.

O desenvolvimento do sistema de edições críticas eletrônicas teve como objetivo solucionar essas demandas conflitantes. >

 

<section_title>
  <v id="v_373">
      <ed id="e_373">Capítulo</ed>
      <or id="o_373">Capit.</or></v> Primeiro, De como
  <v id="v_374">
      <ed id="e_374">se</ed>
      <or id="o_374">ſe</or></v>
  <v id="v_375">
    <ed id="e_375">descobriu<nl/></ed>
    <or id="o_375">deſ-<nl/>cobrio</or></v> esta
  <v id="v_376">
    <ed id="e_376">província</ed>
    <or id="o_376">prouincia</or></v>,
  <v id="v_377">
    <ed id="e_377">e</ed>
    <or id="o_377">&</or></v> a
  <v id="v_378">
    <ed id="e_378">razão</ed>
    <or id="o_378">razam</or></v> porque
  <v id="v_379">
    <ed id="e_379">se</ed>
    <or id="o_379">ſe</or></v>
  <v id="v_380">
    <ed id="e_380">deve</ed>
    <or id="o_380">deue</or></v><nl/> chamar
  <v id="v_381">
    <ed id="e_381">Santa</ed>
    <or id="o_381">Sancta</or></v> Cruz, e
  <v id="v_382">
    <ed id="e_382">não</ed>
    <or id="o_382">nam</or></v><nl/>
  <v id="v_383">
    <ed id="e_383">Brasil</ed>
    <or id="o_383">Braſil</or></v><nl/>
</section_title>

A edição é realizada sob forma de uma anotação em XML (eXtensible Markup Language) sobre a transcrição do texto. Nesta anotação, são codificados os itens originais e as interferências do editor. Cada uma dessas categorias pode ser mais tarde selecionada isoladamente do arquivo (via XSLT), atendendo portanto o objetivo de facilitar o processamento ao mesmo tempo em que se preservam as informações históricas.

Ao lado se vê um trecho da anotação XML que gera as edições original e modernizada. Atualmente, a anotação é realizada manualmente, no processador Emacs. >

 

A etapa posterior é a anotação morfológica (POS) automática, realizada com base numa das versões geradas via XSLT:

transcrição
edição
anotação POS
REINANDO aquelle muy catho- lico & ſereniſsimo Principe elRey Dom MANVEL , fezſe hũa frota pera a India de que hia por capitam mór Pedralua- rez Cabral Reinando aquele mui católico
e sereníssimo Príncipe el-Rei Dom Manuel, fez-se uma frota para a Índia de que ia por capitão mór Pedro Álvares Cabral
 
Reinando/VB-AN aquele/D mui/ADV católico/ADJ e/CONJ sereníssimo/ADJ-S Príncipe/NPR el-Rei/NPR Dom/NPR Manuel/NPR ,/, fez/VB-D se/SE uma/D-UM-F frota/N para/P a/D-F Índia/NPR de/P que/WPRO ia/VB-D por/P capitão/N mór/ADJ-R Pedro/NPR Álvares/NPR Cabral/NPR

O resultado da anotação POS automática precisa ser corrigido manualmente, apesar de seu elevado índice de acertos. A correção é feita também no processador Emacs, no modo "lex". >

livros

Esse sistema de anotação de edição foi aplicado a 48 textos portugueses escritos entre os séculos 16 e 19 (2.279.455 palavras). Metade desses textos recebeu anotação automática para classes de palavras, e serviu de base para teses, dissertações e outros trabalhos sobre a morfologia e a sintaxe do português clássico, cumprindo assim seus objetivos iniciais.

A partir do ano de 2006, esse sistema de edição foi experimentado por outros grupos de pesquisa interessados na produção de corpora do português antigo e clássico (notadamente, o Programa para a História da Língua Portuguesa, PROHPOR -UFBa).

Desse processo de ampliação nasce a primeira motivação para o desenvolvimento de uma ferramenta de anotação específica para textos históricos.

De fato, embora o XML tenha uma definição bastante simples, a marcação direta com XML nos arquivos pode ser desafiante para não-especialistas, e é trabalhosa para todos. Surge então a idéia de facilitar a aplicação do sistema e ampliar seu uso para diferentes grupos de editores.

O desenvolvimento do E-Dictor se integra, ainda, às preocupações do grupo temático “Protección del patrimonio literario através de formatos digitales”, da Associação Internacional de Literatura Comparada, que pesquisa programas computacionais aplicáveis à digitalizações de obras raras em geral. >

 

 

A segunda motivação para o desenvolvimento da ferramenta foi a idéia de conjugar num mesmo ambiente dois planos de anotação: variação de grafia e classes de palavras.

O sistema original de anotação funciona em módulos separados, sendo cada tarefa desempenhada num ambiente de processamento diferente.

 

esquema

Tendo em vista o aperfeiçoamento da gestão do sistema, tornou-se interessante desenvolver uma ferramenta que permitisse trabalhar com maior segurança e em menor variedade de ambientes.

esquema_2

0 | 1 | 2 | 3 | 4 | 5 | 6

 

3. Apresentação da Ferramenta

 

Teste: Uma Carta Brasileira

carta_1>

Corpus: Carneiro, Zenaide de Oliveira Novais (2005). “Cartas Brasileiras (1808-1904): Um Estudo Lingüístico-Filológico”. Tese de Doutoramento, Instituto de Estudos da Linguagem, Universidade Estadual de Campinas. Anexo - Carta 1.

Ilustríssimo e Excelentíssimo Senhor Manoel Ignacio da Cunha e Menezes
Rio 13 de Dezembro de 1829.

Meu amigo e Senhor. A sua carta de 6 do mês próximo passado
me deu grande satisfação por trazer-me não só
a notícia da sua feliz viagem, como a de ter
achado com saúde toda a sua Família, à quem
rendo os meus respeitos, que igualmente são dirigidos
por minha mulher, a qual agradece os cumprimentos
de Vossa Excelência , dando-lhe os parabéns de se achar
restituído ao seio da sua cara Família , sendo
nestes sentimentos acompanhada por meu sogro, e
sogra, que muito se recomendam .

Desejando à Vossa Excelencia saúde, e venturas
passo à solicitar com instância que me empregue
no seu serviço, pois sempre me achará
pronto por ser

Rogo á Vossa Excelência me recomende
aos Excelentíssimos Senhores Telles, e Antonio
Augusto.

De Vossa Excelencia
Amigo reconhecido, e criado obrigado
Antonio Rodriguez de Araujo Basto.

>

<w id="s_1#0" pos="ADJ-S">Ilustríssimo</w>
<w id="s_1#1" pos="CONJ">e</w>
<w id="s_1#2" pos="ADJ-S">Excelentíssimo</w>
<w id="s_1#3" pos="NPR">Senhor</w>
<w id="s_1#4" pos="NPR">Manoel</w>
<w id="s_1#5" pos="NPR">Ignacio</w>
<w id="s_1#6" pos="P+D-F">da</w>
<w id="s_1#7" pos="NPR">Cunha</w>
<w id="s_1#8" pos="CONJ">e</w>
<w id="s_1#9" pos="NPR">Menezes</w>
</s>
<s t="" id="s_2">
<w id="s_2#0" pos="NPR">Rio</w>
<w id="s_2#1" pos="NUM">13</w>
<w id="s_2#2" pos="P">de</w>
<w id="s_2#3" pos="NPR">Dezembro</w>
<w id="s_2#4" pos="P">de</w>
<w id="s_2#5" pos="NUM">1829</w>
<w id="s_2#6" pos=".">.</w>
</s>
</p>
<p>
<s t="" id="s_3">
<w id="s_3#0" pos="PRO$">Meu</w>
<w id="s_3#1" pos="N">amigo</w>
<w id="s_3#2" pos="CONJ">e</w>
<w id="s_3#3" pos="NPR">Senhor</w>
<w id="s_3#4" pos=".">.</w>
<w id="s_3#5" pos="D-F">A</w>
<w id="s_3#6" pos="PRO$-F">sua</w>
<w id="s_3#7" pos="N">carta</w>
<w id="s_3#8" pos="P">de</w>
<w id="s_3#9" pos="NUM">6</w>
<w id="s_3#10" pos="D">do</w>
<w id="s_3#11" pos="N">mês</w>
<w id="s_3#12" pos="N">próximo</w>
<w id="s_3#13" pos="N">passado</w>
<w id="s_3#0" pos="CL">me</w>
<w id="s_3#1" pos="VB-D">deu</w>
<w id="s_3#2" pos="ADJ">grande</w>
<w id="s_3#3" pos="N">satisfação</w>
<w id="s_3#4" pos="P">por</w>
<w id="s_3#5" pos="VB+CL">trazer-me</w>
<w id="s_3#6" pos="NEG">não</w>
<w id="s_3#7" pos="FP">só</w>
<w id="s_5#0" pos="D">a</w>
<w id="s_3#1" pos="N">notícia</w>
<w id="s_3#2" pos="D+F">da</w>
<w id="s_3#3" pos="PRO$">sua</w>
<w id="s_3#4" pos="ADJ">feliz</w>
<w id="s_3#5" pos="N">viagem</w>
<w id="s_3#6" pos=",">,</w>
<w id="s_3#7" pos="CONJS">como</w>
<w id="s_3#8" pos="D-F">a</w>
<w id="s_3#9" pos="P">de</w>
<w id="s_3#10" pos="TR">ter</w>
<w id="s_3#0" pos="VB-AN">achado</w>
<w id="s_3#1" pos="P">com</w>
<w id="s_3#2" pos="N">saúde</w>
<w id="s_3#3" pos="Q-F">toda</w>
<w id="s_3#4" pos="D-F">a</w>
<w id="s_3#5" pos="PRO$-F">sua</w>
<w id="s_3#6" pos="NPR">Família</w>
<w id="s_3#7" pos=",">,</w>
<w id="s_3#8" pos="D-F">a</w>
<w id="s_3#9" pos="WPRO">quem</w>
<w id="s_3#0" pos="VB-AN">rendo</w>
<w id="s_3#1" pos="D">os</w>
<w id="s_3#2" pos="PRO$">meus</w>
<w id="s_3#3" pos="N-P">respeitos</w>
<w id="s_3#4" pos=",">,</w>
<w id="s_3#5" pos="C">que</w>
<w id="s_3#6" pos="ADV">igualmente</w>
<w id="s_3#7" pos="SR-P">são</w>
<w id="s_3#8" pos="VB-AN">dirigidos</w>
<w id="s_3#0" pos="P">por</w>
<w id="s_3#1" pos="PRO$-F">minha</w>
<w id="s_3#2" pos="N">mulher</w>
<w id="s_3#3" pos=",">,</w>
<w id="s_3#4" pos="D-F">a</w>
<w id="s_3#5" pos="WPRO">qual</w>
<w id="s_3#6" pos="VB-P">agradece</w>
<w id="s_3#7" pos="D-P">os</w>
<w id="s_3#8" pos="N">cumprimentos</w>
<w id="s_3#0" pos="P">de</w>
<w id="s_3#1" pos="NPR">Vossa</w>
<w id="s_3#2" pos="NPR">Excelência</w>
<w id="s_3#3" pos=",">,</w>
<w id="s_3#4" pos="VB-G+CL">dando-lhe</w>
<w id="s_3#5" pos="D-P">os</w>
<w id="s_3#6" pos="N-P">parabéns</w>
<w id="s_3#7" pos="P">de</w>
<w id="s_3#8" pos="SE">se</w>
<w id="s_3#9" pos="VB">achar</w>
<w id="s_3#0" pos="VB-PP">restituído</w>
<w id="s_3#1" pos="P+D">ao</w>
<w id="s_3#2" pos="N">seio</w>
<w id="s_3#3" pos="P+D-F">da</w>
<w id="s_3#4" pos="PRO$">sua</w>
<w id="s_3#5" pos="N">cara</w>
<w id="s_3#6" pos="NPR">Família</w>
<w id="s_3#7" pos=",">,</w>
<w id="s_3#8" pos="SR-G">sendo</w>
<w id="s_3#0" pos="P+D">nestes</w>
<w id="s_3#1" pos="N">sentimentos</w>
<w id="s_3#2" pos="VB-AN-F">acompanhada</w>
<w id="s_3#3" pos="P">por</w>
<w id="s_3#4" pos="PRO$">meu</w>
<w id="s_3#5" pos="N">sogro</w>
<w id="s_3#6" pos=",">,</w>
<w id="s_3#7" pos="CONJ">e</w>
<w id="s_3#0" pos="N">sogra</w>
<w id="s_3#1" pos=",">,</w>
<w id="s_3#2" pos="WPRO">que</w>
<w id="s_3#3" pos="Q">muito</w>
<w id="s_3#4" pos="SE">se</w>
<w id="s_3#5" pos="VB-P">recomendam</w>
<w id="s_3#6" pos=".">.</w>
</s>
</p>
<p>
<s t="" id="s_4">
<w id="s_4#0" pos="VB-G">Desejando</w>
<w id="s_4#1" pos="P+D-F">à</w>
<w id="s_4#2" pos="NPR">Vossa</w>
<w id="s_4#3" pos="NPR">Excelencia</w>
<w id="s_4#4" pos="N">saúde</w>
<w id="s_4#5" pos=",">,</w>
<w id="s_4#6" pos="CONJ">e</w>
<w id="s_4#7" pos="N">venturas</w>
<w id="s_4#0" pos="N">passo</w>
<w id="s_4#1" pos="P+D-F">à</w>
<w id="s_4#2" pos="VB">solicitar</w>
<w id="s_4#3" pos="P">com</w>
<w id="s_4#4" pos="N">instância</w>
<w id="s_4#5" pos="C">que</w>
<w id="s_4#6" pos="CL">me</w>
<w id="s_4#7" pos="VB-SP">empregue</w>
<w id="s_4#0" pos="P+D">no</w>
<w id="s_4#1" pos="PRO$">seu</w>
<w id="s_4#2" pos="N">serviço</w>
<w id="s_4#3" pos=",">,</w>
<w id="s_4#4" pos="CONJ">pois</w>
<w id="s_4#5" pos="ADV">sempre</w>
<w id="s_4#6" pos="CL">me</w>
<w id="s_4#7" pos="VB-RA">achará</w>
<w id="s_4#0" pos="N">pronto</w>
<w id="s_4#1" pos="P">por</w>
<w id="s_4#2" pos="SR">ser</w>
</s>
</p>
<p>
<s t="" id="s_5">
<w id="s_5#0" pos="VB-P">Rogo</w>
<w id="s_5#1" pos="P+D-F">à</w>
<w id="s_5#2" pos="NPR">Vossa</w>
<w id="s_5#3" pos="NPR">Excelência</w>
<w id="s_5#4" pos="CL">me</w>
<w id="s_5#5" pos="VB-SP">recomende</w>
<w id="s_5#0" pos="P+D-P">aos</w>
<w id="s_5#1" pos="ADJ-S">Excelentíssimos</w>
<w id="s_5#2" pos="NPR">Senhores</w>
<w id="s_5#3" pos="NPR">Telles</w>
<w id="s_5#4" pos=",">,</w>
<w id="s_5#5" pos="CONJ">e</w>
<w id="s_5#6" pos="NPR">Antonio</w>
<w id="s_5#0" pos="NPR">Augusto</w>
<w id="s_5#1" pos=".">.</w>
</s>
</p>
<p>
<s t="" id="s_6">
<w id="s_6#0" pos="NPR">De</w>
<w id="s_6#1" pos="NPR">Vossa</w>
<w id="s_6#2" pos="NPR">Excelência</w>
<w id="s_6#0" pos="NPR">Amigo</w>
<w id="s_6#1" pos="ADJ">reconhecido</w>
<w id="s_6#2" pos=",">,</w>
<w id="s_6#3" pos="CONJ">e</w>
<w id="s_6#4" pos="ADJ">criado</w>
<w id="s_6#5" pos="ADJ">obrigado</w>
</s>
<s t="" id="s_7">
<w id="s_7#0" pos="NPR">Antonio</w>
<w id="s_7#1" pos="NPR">Rodriguez</w>
<w id="s_7#2" pos="P">de</w>
<w id="s_7#3" pos="NPR">Araujo</w>
<w id="s_7#4" pos="NPR">Basto</w>
<w id="s_7#5" pos=".">.</w>

3.1 Etapas de Anotação com o E-Dictor

3.1.1 Modo Reprodução:
                Transcrição ou Correção da Digitalização

edictor_1

3.1.2 Modo Edição de Grafia

edictor_2

3.1.3 Modo Anotação de Classes de Palavras:
               Correção da etiquetação automática

edictor_3

 

0 | 1 | 2 | 3 | 4 | 5 | 6

 

4. Aspectos Técnicos

O desenvolvimento do E-Dictor procurou incluir três características principais:

  • integração de planos de anotação;
  • interface amigável;
  • flexibilidade de conteúdos.

O E-Dictor foi implementado na linguagem de programação Python, possui código-fonte aberto, e está disponível à comunidade. Apesar de desenvolvido em Ubuntu/Linux, deve ser facilmente portado aos outros dois principais ambientes (MacOS e Windows).

  • Python possui bibliotecas e funções adequadas para a leitura e gravação de arquivos, e também para a manipulação de arquivos XML.

  • Na leitura de um arquivo XML, é gerada uma estrutura de dados na forma de árvore, cujos nós são os elementos XML, e a partir da qual pode-se acessar facilmente a hierarquia das anotações e preencher seus valores nos campos adequados da interface de janelas da ferramenta.

  • O contrário é análogo: valores são lidos dos campos de entrada das janelas e atribuídos aos nós correspondentes da árvore, que então pode ser gravada em um arquivo no formato XML com o vocabulário de marcação desejado.

Outras ferramentas (abertas) de anotação lingüística disponíveis, diferentemente da que propomos, não fornecem uma interface gráfica amigável e nem são adaptáveis a diferentes tipos de anotação; a maioria delas possui um vocabulário fixo de marcação (e diferente do nosso) e permite apenas a modificação manual do arquivo XML.

Essas características técnicas (integração de planos de anotação, interface amigável e flexibilidade de conteúdos) remetem aos três objetivos principais que motivaram o desenvolvimento da ferramenta.

0 | 1 | 2 | 3 | 4 | 5 | 6

 

5. Balanço e Perspectivas

Como já mencionamos, a versão do E-Dictor aqui apresentada é experimental. Para o pleno funcionamento da ferramenta, estamos ainda desenvolvendo as seguintes funções:

(1) Modo Reprodução:
       Incorporação total das anotações de estrutura de texto utilizadas no Sistema de        Edição Eletrônica (Paixão de Sousa, 2007) à criação automática de documentos        XML pela ferramenta.

(2) Modo Edição de Grafia:
       Absorção do sistema de geração de versões por XLST ao ambiente da ferramenta;        Resolução de alguns desafios na edição de segmentação (ressegmentação de duas        palavras em uma).

(3) Modo Anotação Morfológica:
       Absorção integral do programa de etiquetação automática ao ambiente da        ferramenta.

(4) Modo Anotação Sintática:
        Tudo a fazer!


O desenvolvimento de ferramentas como o E-Dictor responde aos desafios hoje colocados para a formação de compilações eletrônicas de textos históricos.

O trabalho com os esse material deve articular três planos de demandas:

  • as demandas filológicas, como a garantia da fidedignidade ao texto original pelo controle das interferências na forma dos textos;

  • as demandas computacionais, como a uniformidade de codificação de caracteres;

  • as demandas da análise lingüística, como o volume de textos e a adequação descritiva da anotação.

Na confluência dessas três vertentes se forma uma fronteira de pesquisa, para cuja exploração o
E-Dictor é uma resposta tecnológica experimental.

0 | 1 | 2 | 3 | 4 | 5 | 6

 

Referências



BRITTO, H. & FINGER, M. (1999). Constructing a Parsed Corpus of Historical Portuguese. <http://www.ime.usp.br/~tycho/participants/britto/britto_finger.htm>

CASTILHO, Ataliba Teixeira de (1998) “Para a história do português brasileiro”. São Paulo:Humanitas. Vol I: Primeiras idéias.

FINGER, M. (2000) . Técnicas de otimização da precisão empregadas no etiquetador Tycho Brahe. <http://www.ime.usp.br/~tycho/participants/finger/propor2000.pdf>

KATO, Mary A. & ROBERTS, Ian. (orgs.) (1993) “Português brasileiro: uma viagem Diacrônica”. Campinas: Editora da Unicamp.

MATTOS E SILVA, Rosa Virgínia. (1988) Fluxo e refluxo: uma retrospectiva da lingüística histórica no Brasil. D.E.L.T.A., 4.1: 85-113. São Paulo.

MEGALE, Heitor & CAMBRAIA, César Nardelli (1999). Filologia Portuguesa no Brasil. D.E.L.T.A, vol. 15, número especial:1:22. São Paulo.

PAIXÃO DE SOUSA, M.C. (2004). Memórias do Texto: Aspectos tecnológicos na construção de um corpus histórico do português. Projeto de pós-doutorado. Unicamp - Fapesp. <http://www.ime.usp.br/~tycho/participants/psousa/memorias/index.html>

PAIXÃO DE SOUSA, M.C. (2007). Sistema de Edições Eletrônicas do Corpus Tycho Brahe: Fundamentos, Diretrizes e Procedimentos <http://www.ime.usp.br/~tycho/corpus/manual/prep/index.html>.

PAIXÃO DE SOUSA, Maria Clara (2005). Memórias do Texto. Revista Texto Digital, ISSN 1807-9288, ano 2 n.1 2006.<http://www.textodigital.ufsc.br/num02/paixao.htm>

PAIXÃO DE SOUSA, M.C. (2006). Hypertext: concepual and methodological frontiers. Comunicação ao Seminário Internacional Literaturas: del Texto al Hipertexto. Faculdade de Filología, Universidade Complutense de Madrid. Madri, 22 de Setembro, 2006.

TRIPPEL, T. & PAIXÃO DE SOUSA, M. C. (2006). “Metadata and XML standards at work: a corpus repository of Historical Portuguese texts”. Papers from the V International Conference on Language Resources and Evaluation (LREC 2006).

W3C (1997). “Extensible Markup Language”. <http://www.w3.org/XML>

0 | 1 | 2 | 3 | 4 | 5 | 6

 

img3<
0 | 1 | 2 | 3 | 4 | 5 | 6
img3<
0 | 1 | 2 | 3 | 4 | 5 | 6