OS CLÍTICOS NO PORTUGUÊS BRASILEIRO:

ELEMENTOS PARA UMA ABORDAGEM

SINTÁTICO‑FONOLÓGICA

 

 

Charlotte Galves (UNICAMP)

Maria Bernadete Marques Abaurre (UNICAMP)

 

 

 

 

Introdução

 

        Este trabalho tem por objetivo definir questões relevantes para uma abordagem preliminar da interface sintaxe/fonologia no português brasileiro falado, a partir de considerações sobre a sintaxe e a fonologia dos clíticos pronominais da língua. Os dados considerados são os do corpus mínimo do Projeto da Gramática do Português Falado.

        Do ponto de vista sintático, a questão a ser investigada é a da “próclise vs. ênclise”.  Não se dispõe, até o momento, de uma explicação teoricamente coerente para o fato de que, ao lado de construções como Tinham‑me visto, não se tem Me tinham visto, mas Tinham me visto. Isso mostra que, além de haver, na língua, próclise vs. ênclise, a cliticização não se faz ao mesmo elemento (auxiliar, no primeiro caso, particípio, no segundo).

        Do ponto de vista da fonologia, a análise dos clíticos pronominais coloca necessariamente em evidência a questão da demarcação dos limites da palavra, entendida, no componente lexical, como domínio de aplicação das regras de acento primário e, subseqüentemente, de aplicação do algoritmo de acento secundário, para a construção dos pés métricos. Em outras palavras, é possível considerar os clíticos pronominais como parte integrante da palavra, ou como elementos morfologicamente autônomos. Do ponto de vista da investigação que propomos iniciar, interessa saber se a opção por qualquer dessas duas alternativas tem conseqüências significativas para a construção dos pés métricos no âmbito das palavras, bem como para a definição dos padrões rítmicos dos enunciados.

        Nossa hipótese é a de que a integração ou não dos clíticos pronominais ao domínio da palavra pode estar em parte definida pela sintaxe desses elementos em uma língua como PB. A partir dessa hipótese, faremos considerações preliminares sobre as conseqüências rítmicas, no nível dos enunciados, da opção sintática que parece fazer a língua pela próclise dos clíticos ao verbo, opção que corresponde à interpretação desses elementos como sintagmas (projeções máximas), do ponto de vista sintático, e como palavras autônomas, do ponto de vista fonológico. Quando enclíticos, os clíticos serão considerados como integrantes da palavra.

        As representações sintáticas aqui propostas para as orações com clíticos pressupõem a Teoria da Gramática Gerativa. As grades métricas pressupõem as representações fonológicas não‑lineares da Fonologia Métrica.

        A definição dos limites da palavra é crucial para as discussões voltadas para a compreensão da interface fonologia/sintaxe. Os elementos clíticos, pela sua natureza híbrida, situam‑se necessariamente nos limites da fonologia e da sintaxe.  Ao abordá‑los, neste trabalho, pretendemos contribuir para uma melhor definição dos problemas que envolvem a discussão da interface fonologia/sintaxe nos estudos sobre o português brasileiro.

        A discussão do problema aqui focalizado pressupõe uma análise preliminar rigorosa e sistemática do acento secundário e do ritmo em PB, dentre outros motivos porque tal análise deve necessariamente preocupar‑se com a questão do estabelecimento de limites precisos das palavras fonológicas, domínio de aplicação do algoritmo de acento secundário (determinar, por exemplo, se é ou não adequado considerar os clíticos do PB como palavras autônomas, depende de considerações mais gerais sobre o rendimento de uma ou outra opção em termos da análise do ritmo da língua como um todo).

        Dada a questão teórica que nos interessa investigar, não faremos aqui uma análise do acento e do ritmo em PB, remetendo o leitor para trabalhos como os de Bisol (1992) e Collischonn (1993). Por esse motivo, mais do que como propostas efetivas de análise do ritmo de enunciados com clíticos do PB, as grades métricas e as regras de ajuste rítmico mencionadas neste texto devem ser tomadas como indicativas da orientação que a discussão pode tomar em trabalhos futuros.

 

I ‑ A Análise Fonológica do Ritmo

 

1 ‑ Pressupostos básicos

 

        Os trabalhos sobre o ritmo do português do Brasil têm‑se concentrado em uma análise dos aspectos fonéticos do ritmo (Abaurre‑Gnerre, 1979; Abaurre, 1981; Major, 1981, 1985; Cagliari, 1981, 1985; Abaurre & Cagliari, 1986; Moraes & Leite, 1987; Simões, 1987, 1987a). Trabalhos mais recentes, como os de Bisol (1992) e Collischonn (1993) por tratarem, respectivamente, do acento primário e secundário, fornecem elementos para a caracterização do ritmo do PB dentro de uma perspectiva fonológica, nos moldes da fonologia não-linear.

        Se, do ponto de vista fonético, o ritmo das línguas naturais pode ser percebido como uma repetição de padrões em que elementos fônicos proeminentes ocorrem em alternância com elementos não‑proeminentes, do ponto de vista fonológico é mais adequado caracterizar o ritmo lingüístico em termos de um esquema regulador abstrato que contém esse fluxo fônico, a ele impondo firmeza e limites (cf. Allen, 1968).

        Uma das características desse “esquema regulador”, freqüentemente apontada nos trabalhos sobre a fonética do ritmo, é a chamada isocronia. Assim, os enunciados de uma língua como o inglês, e.g., têm sido, em termos rítmicos, caracterizados como consistindo de uma seqüência de pulsos isocrônicos. A própria noção de isocronia tem, no entanto, sido objeto de acalorados debates, uma vez que a isocronia ideal pressuposta na organização rítmica subjacente à produção e percepção da fala , embora relevante para a sustentação da hipótese da realidade psicológica dessa organização, não se tem revelado como facilmente mensurável, em termos acústicos, pairando sempre muitas dúvidas sobre os limites da variação de tempo aceitável para a definição de intervalos que podem ser considerados isocrônicos (cf. Lehiste, 1977). Comentando esse aparente impasse, Selkirk (1984) diz que o problema reside no fato de se tentar resolver o problema dos esquemas rítmicos em termos puramente fonéticos, sendo necessário abordar a questão em termos abstratos. Traduzindo uma preocupação crescente das teorias fonológicas atuais com a análise abstrata do ritmo nas línguas naturais, Selkirk faz o comentário seguinte: “we feel that much of this debate, and the apparent lack of resolution on the question, stems from a failure to understand rhythm, and the isochrony of its basic pulses, in sufficiently abstract terms” (Selkirk, op. cit., pág. 39).

        Uma análise abstrata do ritmo lingüístico, como a preconizada, e.g., por Allen e Selkirk, pressupõe uma concepção não‑linear do componente fonológico das línguas naturais, bem como a definição precisa da forma de interação das representações fonológicas com as representações sintáticas dos enunciados (uma vez que a discussão verdadeiramente significativa a respeito de padrões rítmicos pressupõe que os dados sejam representativos de domínios maiores do que palavras).

        Com relação às representações fonológicas abstratas, os modelos não‑lineares postulam que elas compreendem dois tipos de organização hierárquica: uma estrutura prosódica de constituintes (representada nas chamadas árvores métricas) e uma estrutura rítmica das sentenças (representada nas chamadas grades métricas). Dispomos hoje, portanto, de um quadro teórico bastante elaborado, no âmbito das fonologias não‑lineares, para a condução de pesquisas sobre o ritmo das línguas naturais em termos suficientemente abstratos.

Sobre a estrutura prosódica, as grades métricas e a questão da interface entre a sintaxe e a fonologia, cf. Selkirk (1984):

 

(The) prosodic constituent structure (...) is a structure of the same general sort that is familiar from syntactic description, one in which linguistic units are grouped into larger units, constituting a well‑formed labeled bracketing or tree. The syllables (and their internal constituents) are clearly units of this hierarchy, as are, above them, intonational phrases. What units, if any, may intervene between syllables and intonational phrases in this prosodic constituent structure is a matter of some debate (...).

Rythmic structure per se can be represented as a metrical grid (Liberman 1975). A metrical grid is a representation of a hierarchy of temporal periodicities. It consists of a hierarchy of metrical levels, each level in turn consisting of a sequence of positions (beats) that stand for points in (abstract) time and define the recurring periodicities of rhythm; it is not a tree. The rhythmic structure of a sentence is the alignment of its syllables with a metrical grid. (pp. 7‑8)

 

        Nas considerações que faremos, neste texto, sobre o ritmo de alguns enunciados do PB onde ocorrem clíticos, estaremos pressupondo a organização fonológica abstrata desse ritmo em termos de alguma versão da grade métrica proposta originalmente por Liberman (1985).

        Cabe inicialmente chamar a atenção para o fato de que na grade métrica estão representados os padrões de proeminência acentual. Vale lembrar, também, que foi o postulado da grade métrica que acabou por permitir a elaboração de sofisticadas teorias sobre os sistemas acentuais e os padrões rítmicos das línguas naturais (cf., e.g., Halle & Vergnaud, 1985, 1987; Hayes, 1991).

        Em linhas muito gerais, pode‑se dizer que estão representadas, na grade, as batidas (beats) — correspondentes a pulsos rítmicos — assim como a distinção entre batidas fortes e fracas e os vários níveis hierárquicos em que tais distinções podem manifestar‑se. Uma grade métrica tem a configuração que é ilustrada abaixo:

 

(1)

 

x                         x

x         x               x

x   x     x   x     x     x   x

x x x x x x x x x x x x x x x x x

 

        São consideradas fracas as batidas que não coincidem com nenhuma outra batida nos níveis superiores da grade. São consideradas fortes, por outro lado, todas as batidas que coincidem com alguma outra batida nos níveis métricos hierarquicamente superiores. Para uma apresentação mais detalhada das propriedades formais da grade métrica remete‑se o leitor para os trabalhos de Liberman (1975) e Liberman & Prince (1977), e para o resumo apresentado em Selkirk (1984).

Apresentamos, a seguir, a grade métrica (simplificada) do enunciado Aquilo me chocou tanto (inquérito: DID/SP), construída com base nas informações sobre saliências fornecidas pela árvore prosódica e no conhecimento pressuposto sobre a localização do acento primário das palavras do português:

 

(2)

 

                        x      linha 2 (Acento de sintagma)

   x               x    x      linha 1 (Acentos primários)

x  x   x  x    x   x    x  x   linha 0 (rimas)

A qui   lo  me        cho     cou       tan   to

 

        Uma noção importante, para a discussão sobre os padrões rítmicos que se manifestam nas línguas naturais, é a de alternância rítmica. Nota‑se uma forte tendência, em qualquer tipo de atividade ritmicamente regulada, para uma alternância entre as batidas fortes e as fracas, o que resulta em um sistema binário. Como uma variante da organização rítmica binária, encontram‑se por vezes organizações ternárias (uma batida forte acompanhada de duas fracas). A partir, portanto, do pressuposto de que as línguas são reguladas por um Princípio de Alternância Rítmica (“entre duas batidas fortes sucessivas intervêm pelo menos uma e no máximo duas batidas fracas”), pode‑se estudar o padrão rítmico de enunciados específicos procurando compreender como esse princípio é implementado em combinações sintáticas particulares, dado que muitas vezes as estruturas sintáticas superficiais constituem‑se em inputs “arrítmicos” do ponto de vista das alternâncias aceitáveis. Quando tais configurações ocorrem, faz‑se necessário postular regras que, aplicadas à grade métrica após a construção dos pés, “reajustam” o ritmo do enunciado, tornando‑o ritmicamente aceitável a partir do princípio básico da eurritmia, entendido do ponto de vista da língua em questão.

        A resposta à pergunta sobre se as grades métricas são mais ou menos eurrítmicas, ou seja, sobre a maneira como implementam o Princípio de Alternância Rítmica acima mencionado, depende crucialmente também da distribuição dos acentos secundários com base em um algoritmo específico, que será apresentado, para o PB, na seção II 2, a seguir. Na grade acima, indicam‑se apenas as proeminências relativas aos acentos primários das palavras lexicais e ao acento principal de sintagma. As informações sobre proeminências fornecidas nas linhas 0 e 1 serão levadas em conta na atribuição do acento secundário, como se verá mais adiante.

        A análise do acento primário dos morfemas da língua — importantíssimo na determinação do ritmo das sentenças — deve, evidentemente, preceder qualquer investigação sobre a métrica de palavras (uma vez que elas podem ser compostas por mais de um morfema portador de acento primário), e, conseqüentemente, qualquer investigação sobre o ritmo de agrupamentos fônicos maiores do que palavras. Pressuporemos, neste trabalho, a análise do acento primário para o português brasileiro proposta por Bisol (1992), conduzida segundo os pressupostos aqui adotados das fonologias não‑lineares. Remete‑se, portanto, o leitor, ao trabalho citado de Bisol, onde se formulam e exemplificam regras de atribuição de acento primário aos nomes e verbos do PB, no domínio palavra.

 

2 ‑ A Representação do Ritmo dos Enunciados em PB

 

        Dados os objetivos deste trabalho, não apresentaremos, aqui, uma análise exaustiva do ritmo dos enunciados do PB. Para que possamos, no entanto, discutir o ritmo dos enunciados onde ocorrem clíticos, faz‑se necessário apresentar pelo menos os pressupostos teóricos dessa análise, baseados principalmente em trabalhos recentes sobre Fonologia Lexical (Kiparsky, 1983) e Fonologia Métrica (Halle & Vergnaud, 1987; Hayes, 1991). Para a análise de questões específicas relacionadas ao PB, baseamo‑nos também na análise do acento  primário proposta por Bisol (1992), e na análise de acento secundário em espanhol proposta por Roca (1986).

        Nosso pressuposto inicial é o de que o ritmo de enunciados de extensão variável, onde alternam batidas fortes e fracas em todas as sílabas, é um produto da interação entre os acentos primários e secundários. O acento primário, nos morfemas que o portam, é função de um algoritmo que define um conjunto de procedimentos a serem aplicados ciclicamente a esses morfemas, nos estratos lexicais relevantes, nos moldes da proposta de Bisol (1992). O acento primário será apenas indicado, portanto, nas representações, sem que se discuta o algoritmo em questão, uma vez que não pairam dúvidas sobre os resultados de sua aplicação às palavras da língua.

        Em PB, é necessário distinguir três tipos de acento:

 

       Acento Primário de Palavra: correspondente à mais alta proeminência na palavra lexical (que pode resultar, simplesmente, da atribuição de acento primário a um único morfema, ou de uma eventual combinação de morfemas aos quais tenham sido atribuídos acentos primários em diferentes estratos lexicais, com posterior apagamento de todos os acentos à exceção do último à direita da palavra).

       Acento Principal de Sintagma: assinala o pico acentual (proeminência mais forte) no sintagma (que pode ser um grupo de força ou um grupo tonal). O acento principal de sintagma deve necessáriamente corresponder a uma sílaba previamente marcada como portadora de acento primário de palavra.

       Acento Secundário: qualquer outra proeminência, na cadeia das sílabas, em qualquer dos domínios anteriormente mencionados.

 

        O algoritmo que atribui acento primário (cf. Bisol, 1992) é de aplicação cíclica, nos estratos lexicais relevantes para o português, como ilustrado a seguir (onde Sn é o último extrato lexical relevante para a aplicação das regras cíclicas, e Sn‑1 é um dos extratos lexicais anteriores):

(3) Componente Lexical:

 

        Observe‑se que no último estrato lexical é necessário postular uma regra de Apagamento de Acento, uma vez que se assume que as palavras do português contêm um único acento primário. Essa regra pode ser informalmente estipulada como:

 

(4) Apagamento de Acento:

 

Apague todos os acentos à exceção do último à direita, na palavra.

 

        Observe‑se, ainda, que essas regras do componente lexical são categóricas. Enquanto as regras de Silabificação e Atribuição de Acento Primário são de aplicação cíclica, a regra de Apagamento de Acento pode‑se aplicar uma única vez, no último extrato lexical.

        Quanto ao acento principal de sintagma e ao acento secundário, ambos são atribuídos no componente pós‑lexical da fonologia, de forma categórica. Interagem com uma série de outras regras pós‑lexicais, dentre as quais é imprescindível mencionar aqui:

 

a)      Regra Rítmica: desfaz arritmias resultantes da colisão de acentos primários nas grades métricas, movendo o primeiro de dois acentos primários para a sílaba imediatamente à esquerda, se esta for uma sílaba fraca. É uma regra de aplicação não categórica (variável) em PB.

b)      Um conjunto de regras de sândi externo, de aplicação variável, que, para fins deste trabalho, estarão subentendidas pelo rótulo Regra de Simplificação Silábica (mas cf. Bisol, 1992a, para uma formalização e discussão mais detalhada das regras de sândi externo em PB). Essas regras, quando se aplicam, alteram o input para o algoritmo de atribuição de acento secundário, uma vez que reduzem o número de sílabas dos enunciados. Não ofereceremos, aqui, uma formulação para essas regras, uma vez que, para fins deste trabalho, é suficiente assinalar o(s) contexto(s) em que pode ocorrer redução no número de sílabas, em determinada derivação.

c)      Apagamento de colisão acentual: desfaz arritmias resultantes da colisão de proeminências secundárias (produzidas pelo algoritmo de acento secundário ao construir certos pés métricos degenerados – pés com uma batida, apenas), com as batidas fortes dos pés binários construídos pelo mesmo algoritmo, nas grades métricas. É de aplicação categórica, da esquerda para a direita, e formula‑se provisoriamente como se segue:

 

(5)

 

condição: linha 2 não pode conter . na sílaba imediatamente à direita da proeminência a ser enfraquecida

 

        Voltemos, agora, às regras que atribuem acento principal de sintagma e acento secundário aos enunciados.

Em português, a proeminência mais forte está localizada à direita, nos sintagmas. A regra categórica que marca essa proeminência será formulada nos seguintes termos:

 

(6) Acento principal de sintagma:

 

        Quanto ao acento secundário, o algoritmo que o distribui é formulado de modo a dar conta do ritmo trocaico do português, ou seja, de um ritmo de alternância basicamente binária, em que os acentos secundários são localizados em sílabas alternadas, contadas à esquerda do acento primário. Esse algoritmo pode ser formalizado como se segue, segundo proposta de Halle e Vergnaud 1987), para o que chamam de Alternator Rule:

 

(7) Acento secundário:

 

a.     marque todas as rimas silábicas na linha 0

b.      os constituintes (pés) a serem construídos na linha 0 têm cabeça à esquerda.

c.      construa constituintes binários na linha 0, da direita para a esquerda.1

 

        O algoritmo pressupõe um input como a grade acima exemplificada, com várias linhas onde se localizam as proeminências relativas nos vários níveis prosódicos, sendo a linha 0 aquela onde serão assinaladas com um x todas as rimas silábicas, elementos que podem receber acento. O algoritmo pressupõe, ainda, que na construção dos pés sejam obedecidos os acentos primários assinalados em sua linha própria (linha 2, nas grades a seguir). Um exemplo de aplicação do algoritmo:

 

(8)

 

        O fato de se dever atribuir proeminência, na linha 1, aos pés degenerados (com apenas uma batida) assinalados pelo algoritmo na linha zero, cria, na linha 1 do exemplo acima, uma colisão acentual que levará à aplicação da regra de Apagamento de Colisão, já mencionada anteriormente, o que resultará no enfraquecimento da primeira sílaba.

        Enquanto Halle & Vergnaud propõem que o algoritmo de atribuição de acento secundário no espanhol construa pés com cabeça à esquerda, Roca (1986) propõe que os pés do espanhol tenham cabeça construída à direita. Seu argumento é o de que essa parametrização daria conta de observações como as encontradas em Navarro Tomás (1967), sobre a ocorrência de uma intensidade foneticamente perceptível nas últimas sílabas das proparoxítonas, bem como de alguns fatos envolvendo a localização do acento à direita, em algumas seqüências de clíticos. Reconhece, no entanto, que o assunto é controvertido. Carvalho (1989) argumenta a favor de construção de pés com cabeça à direita para o português do Brasil, trabalhando com a hipótese de que a direcionalidade na construção dos pés seria parametrizada de forma diferente em PB (cabeça à direita) e PE (cabeça à esquerda). Assumimos aqui a parametrização que nos parece intuitivamente mais adequada para PB, ou seja, a de que os pés são construídos com a cabeça à esquerda. Em trabalhos posteriores, no entanto, achamos importante avaliar o rendimento da outra parametrização em termos da possibilidade de explicação de outros fenômenos que não os puramente rítmicos, como as reduções vocálicas pré‑tônicas e pós‑tônicas.

        É, pois, o algoritmo do acento secundário que define os pés métricos do PB como troqueus binários (batida forte seguida de batida fraca), e, em conseqüência, a base desse ritmo como trocaica. Considerando que o parsing determinado pelo algoritmo acaba por deixar, em algumas circunstâncias, a última sílaba à esquerda não‑acentuada, alguns enunciados terão um início anacrústico, pois o último pé à esquerda terá sua batida forte silenciosa, nesses casos. Note‑se que a sílaba inicial de inconstitucionalíssimo é um exemplo desse caso, uma vez que deve tornar‑se fraca após a regra de Apagamento de Colisão.

        Identificadas as regras relevantes para a definição dos esquemas rítmicos dos enunciados de PB, é necessário estabelecer sua ordem de aplicação. Consideramos válida, para o português, a argumentação feita por Roca (1986) para a ordenação da regra de acento secundário entre as regras do componente pós‑lexical do espanhol. No componente pós‑lexical ela deverá vir necessariamente após a regra de acento principal de sintagma. Assumiremos aqui a seguinte ordem para as regras relevantes:

 

(9) Componente lexical:

 

1. Silabificação (cíclica)

2. Acento primário (cíclica)

3. Apagamento de acento (não‑cíclica, último estrato)

 

Componente pós‑lexical:

4. Regra rítmica

5. Acento principal de sintagma

6. Simplificação silábica

7. Acento secundário

8. Apagamento de colisão acentual

        Podemos, agora, ilustrar a aplicação das regras do componente pós‑lexical a uma frase fonológica como esdrúxula habilidade:

 

(10) Componente pós‑lexical:

 

 

        É importante observar, para os propósitos da discussão que se fará na seção IV deste trabalho, que muitas vezes a aplicação da regra categórica de Apagamento de Colisão de proeminências secundárias em pés degenerados situados à esquerda das batidas fortes dos pés binários normalmente construídos na grade métrica, acaba por produzir dátilos (pés foneticamente constituídos de uma batida forte seguida de duas batidas fracas). Nesses momentos o ritmo dos enunciados de PB acaba por distanciar‑se da estrutura rítmica baseada na Grade Perfeita que, no caso, prevê a seqüência de pés trocaicos. Será interessante verificar, em pesquisas futuras, em que medida esses momentos de aparente “arritmia” tendem a ser resolvidos pela língua em termos de ulteriores aplicações das regras que reduzem o número de sílabas com o objetivo de recuperar o ritmo previsto na Grade Perfeita, ou mesmo de maximizar a ocorrência de dátilos (o que leva, pelo menos, a um ritmo mais regular).

        Em Abaurre‑Gnerre (1979), Abaurre (1981) e Abaurre & Cagliari (1986), sugeríamos já, a partir da observação de processos fonológicos segmentais que alteram as estruturas silábicas do PB, a existência de uma forte relação entre a ocorrência desses processos e a opção por determinados esquemas rítmicos. Acreditamos que os modelos fonológicos não‑lineares, na medida em que oferecem um quadro teórico que permite a análise fonológica do ritmo em termos dos princípios universais e das parametrizações específicas que o regulam nos vários sistemas lingüísticos, permitem a busca de explicações para a verdadeira natureza da relação entre os fatos prosódicos e os fatos da camada segmental. Assim, se a nossa suposição estiver correta, no caso específico que aqui consideramos, a predição da ocorrência de seqüências de troqueus ou de dátilos, feita pelas grades métricas, pode ser também indicativa de contextos preferenciais de aplicação de regras que reajustam a cadeia segmental por motivações de ordem rítmica. Essas regras, de aplicação pós‑lexical e variável, terão, por hipótese, sua aplicação maximizada nos estilos mais coloquiais/rápidos de fala.

        Em todos os exemplos analisados daqui para a frente estaremos pressupondo todas as fases da derivação ilustradas anteriormente. Faremos referência, portanto, apenas aos momentos das derivações considerados essenciais para a discussão. Nas representações das grades métricas, seguimos basicamente a proposta mais recente de Halle & Vergnaud (1987). As regras de ajuste rítmico são inspiradas em Roca (1986).

 

3 ‑ Os Clíticos na Teoria Fonológica

 

        Na análise rítmica dos enunciados de PB onde ocorrem clíticos pronominais, a questão que nos orientou foi basicamente a seguinte: em que medida a escolha, por parte de PB, de uma determinada ordem de constituintes na organização de suas estruturas sintáticas pode favorecer a manifestação, em termos rítmicos, de esquemas preferenciais de alternância no interior de unidades prosódicas de extensão variável (no caso do PB, por hipótese, o ritmo trocaico binário, caracterizado pela seqüência de alternâncias de batidas fortes seguidas de batidas fracas, segundo predição do algoritmo de acento secundário apresentado em I 2)? Haveria alguma relação entre a ordem desses constituintes e a maneira como, nas grades métricas, se produzem ou solucionam momentos de arritmia (resultantes de colisões acentuais e/ou ocorrências inesperadas de dátilos entre seqüências regulares de troqueus)? Antes de voltar a essas indagações, na seção III deste trabalho, concluiremos esta seção com uma breve apresentação da abordagem dada pelas teorias fonológicas aos chamados clíticos fonológicos.

        Os chamados clíticos fonológicos têm merecido a atenção das teorias fonológicas que, em virtude do estatuto peculiar desses elementos, consideram‑nos acentualmente inertes (invisíveis para as regras de acento), o que permite de certa forma explicar a tendência que eles manifestam para “apoiar‑se” no constituinte acentuado que está à sua direita ou à sua esquerda. Vincula‑se freqüentemente, também, a sua natureza fonologicamente considerada “fraca”, ao fato de serem em sua maior parte monossilábicos e sujeitos a reduções fonológicas consideráveis em termos segmentais. Os clíticos fonológicos constituem uma classe maior do que a classe dos chamados clíticos sintáticos e compreendem grande parte das chamadas palavras funcionais como preposições, conjunções, determinantes, verbos modais e auxiliares e pronomes pessoais. Embora possam receber acento enfático em circunstâncias especiais, ocorrem, na maior parte das vezes, em forma átona, o que pode justificar a opção de alguns autores por considerá‑los formas híbridas (cf. Crystal 1980: “a clitic is a form which resembles a word, but which cannot stand on its own as a normal utterance”). Para fins do presente trabalho, interpretaremos os clíticos pronominais do PB, quando proclíticos ao verbo, como palavras autônomas, com base na argumentação sintática (cf. seção II 2.2) segundo a qual esses clíticos são sintagmas determinantes (projeções máximas, portanto) e movem‑se como sintagmas em todos os níveis da gramática. A próclise desses elementos pronominais é pois considerada a realização default desses clíticos em PB.

        Do ponto de vista da fonologia, consideraremos esses clíticos como não portadores de acento primário, por serem todos monossilábicos e muitas vezes sujeitos, em termos da realização fonética dos enunciados, a processos de redução fonológica (sobretudo quando antecedem imediatamente uma sílaba de outra palavra, portadora de acento primário). No entanto, o fato de poderem ser considerados palavras do ponto de vista sintático, como se verá em II, permite que não sejam vistos como fonologicamente “inertes”. Serão considerados, nesse sentido, como elementos que podem receber os acentos secundários distribuídos pelo algoritmo específico mencionado na seção 2, acima.Em termos de representação do ritmo, nas grades métricas, a opção por não atribuir acento primário aos clíticos têm como conseqüência imediata a ausência de um asterisco na linha 2, alinhado com esses elementos. Decorre também, da mesma opção, o fato de que na construção dos pés na linha 0, pelo algoritmo do acento secundário, um pé nunca terá de necessariamente começar em um clítico pronominal (embora isso possa, evidentemente ocorrer), já que aí não ocorrerão acentos primários.

        Nos pouquíssimos casos de ênclise superficial de elementos pronominais (realização marcada, em PB) ocorrentes no corpus, os clíticos serão interpretados como última sílaba das palavras às quais se integram (nesses casos, para fins de aplicação do algoritmo de atribuição de acento primário, serão provavelmente considerados sílabas extramétricas).

        Limitar‑nos‑emos, pois, a descrever e comentar a estrutura rítmica e sintática dos enunciados com clíticos pronominais em PB, esperando que os fatos preliminares apontados neste trabalho, possam vir a contribuir para a discussão teórica envolvendo as hipóteses de análise dos clíticos fonológicos.

 

II ‑    Elementos para uma Análise Fono-Sintática dos Clíticos no Português Brasileiro

 

1 ‑ Os clíticos no corpus piloto

 

        A primeira observação é a pouca freqüência dos clíticos pronominais, pelo menos se nos ativermos aos elementos considerados como tais pela gramática tradicional. Ao todo são 172 ocorrências, das quais 83 se encontram nas orações matriz4 e 89 nas orações subordinadas ou adjuntas, apontando para um paralelismo entre os dois tipos de orações no que diz respeito ao uso desses elementos, paralelismo que se verifica também na distribuição por forma:

 

(11)

 

principais

subordinadas

total

- se

49

56

105

- me

27

21

48

- o/a

3

7

10

- nos

2

3

5

- te

1

2

3

- lhe

1

0

1

total

83

89

172

 

        Observa‑se, nos dois contextos, uma nítida proeminência do pronome se5, o que pode parecer paradoxal uma vez que vários trabalhos recentes apontaram para a seu desaparecimento (Galves 1987, Nunes 1990 etc.). Contudo, uma observação mais detalhada revela que a grande maioria dessas ocorrências (65) corresponde a usos lexicalizados (verbos com uso pronominal – calar‑se, referir‑se, virar‑se, lembrar‑se etc.), havendo somente 17 casos de reflexivos, 26 de indeterminação, e 2 de recíprocos. A única discrepância que encontramos na repartição dos clíticos entre os dois tipos de orações diz respeito ao se indeteminador, que aparece mais nas subordinadas e adjuntas do que nas orações matriz, respectivamente 17 e 9 ocorrências. Não nos deteremos nesse fenômeno, que necessitará um estudo mais aprofundado dos recursos de indeterminação, com um maior número de dados.

        Com respeito ao me, as diferentes funções são mais equitativamente repartidas. Temos 9 casos de verbos pronominais e 12 casos em que o clítico pode ser considerado como argumento do verbo, direto ou indireto, sendo que em 4 casos é reflexivo. Deve‑se notar um emprego particular em situação de aula, em que o pronome não se refere ao enunciador, mas a uma personagem, numa espécie de discurso direto:

 

ora a maneira do homem pré‑histórico era basicamente eu preciso comer e eu preciso me defender dos animais e eu preciso me esquentar na medida do possível, certo? (EF‑SP)

 

        A quase ausência de te, contrastando com me, pode ser atribuída a dois fatores. O primeiro é discursivo e diz respeito às condições de produção dos textos.  Mas um fator lexico‑gramatical pode interferir fortemente. Como notado por Galves (1987), existe uma ausência de paralelismo, no português brasileiro culto, entre o paradigma da primeira e da segunda pessoa: enquanto que o uso do pronome tônico você concorre com o uso do clítico na segunda pessoa, sendo nisso coerente com o uso do pronome ele em posição objeto, tal não acontece na primeira pessoa, onde eu objeto é fortemente estigmatizado. Esta hipótese, que será melhor explicitada mais abaixo (cf. seção III 2), deverá ser verificada em outros momentos da pesquisa, em que se estudem as formas alternativas.6

        A mesma observação vale para as ocorrências extremamente reduzidas de nos e lhe, o que pode ser devido tanto às condições de produção dos diálogos quanto à importância do uso de formas alternativas (por ex.: a gente, para você).

        No que diz respeito a esse conjunto de clíticos, deve‑se notar ainda a ausência na amostra de outros usos comumente encontrados nas línguas românicas, tais como benefativos7 ou possessivos.

        Notem‑se enfim as poucas ocorrências do clítico acusativo de 3a. pessoa a/o8: 10 ocorrências em 172, das quais 5 aparecem no mesmo inquérito, o D2 de São Paulo. Esta observação vem corroborar o que já foi dito em outros trabalhos: no que diz respeito à terceira pessoa, o uso do clítico vem sendo substituído pelo pronome tônico por um lado, alternando com um objeto nulo submetido a poucas restrições.9 Neste caso, contudo, observa‑se uma ligeira discrepância entre orações matriz e orações não matriz, as segundas parecendo favorecer o aparecimento desse pronome. Mas o que o favorece, na realidade, é a presença de um verbo no infinitivo, ao qual vem enclítico. 6 dos 7 casos em orações dependentes são desse tipo:

 

(12)

 

porque é uma tarefa assim muito séria de encaminhá‑la para o caminho certo (D2‑SP)

os outros mesmos não se incumbem de colocá‑la (D2‑SP)

os outros mesmos se encarregam de eh fazer exatamente de colocá‑lo (D2‑SP)

não seria conveniente mudá‑lo (D2‑Poa)

isso vai levá‑lo a encontrar uma cristianização (D2‑RE).

 

        A oposição pertinente não é, portanto, matriz vs. dependente, mas frase com tempo finito vs frase infinitiva. E já podemos constatar que essa mesma oposição tem incidência sobre a posição do clítico, já que todos os casos acima são de ênclise, ao avesso da tendência geral da língua para a próclise, como veremos a seguir.

 

a. Posição em relação ao verbo

 

        Com tempo finito, só há 6 casos de ênclise. Dois se encontram no mesmo locutor numa situação de aula (EF/Bahia),

 

(13)

 

Então a isso, chama‑se de ginecomastia (EF‑Ba)

Esses tubérculos, chegou‑se à conclusão (EF‑Ba)

 

3 em receitas, também no mesmo inquérito,

 

(14)

 

parte‑se um ovo (D2‑Poa)

e serve‑se (D2‑Poa)

depois dele limpo, tira‑se o lombinho (D2‑Poa).

 

Enfim, encontramos um caso de ênclise numa encaixada:

 

(15)

 

que chamam‑se regionais (Did‑Poa).

 

        Chama particularmente a atenção o fato de que, em todos os casos, o clítico envolvido é o se, no seu uso indeterminador. O fato de só aparecer se poderia ser atribuído ao fato de que se trata, de longe, do clítico mais freqüente, como mostramos acima. Porém, lembramos que não é essa a sua função mais freqüente no corpus, uma vez que em 105 ocorrências, só 26 são interpretáveis como indeterminação do sujeito. Ora, em todos os seis casos de ênclise ilustrados acima, a sua função é essa. Por outro lado, podemos observar outros condicionamentos claros: o fato de se tratar de discursos bem definidos: discurso didático e receitas de cozinha. Ambos têm natureza prescritiva, favorecem a indeterminação do sujeito e privilegiam um registro de língua em que, marginalmente, a ênclise ainda se mantém na língua. É interessante contrastar, com os seis casos acima, os quatro exemplos seguintes de se indeterminador com próclise:

 

(16)

 

também se diz (EF‑Re)

então se entra nos mínimos detalhes (D2‑SP)

hoje se faz (D2‑Re)

Já se chamam habilidades mentais (EF‑SP).

 

        Estas quatro orações têm em comum o fato de serem iniciadas por um advérbio. Nas frases acima com ênclise, ao contrário, se o pronome fosse preverbal, ele estaria em primeira posição na oração. O recurso à ênclise pode ser considerado, portanto, como a aplicação da chamada Lei de Tobler Mussafia, que proíbe um pronome clítico de aparecer em posição inicial de frase.10 Porém, o caso da subordinada com que se afasta fortemente da norma portuguesa, e da aplicação da Lei Tobler Mussafia em geral. O que se pode concluir, então, é que, apesar de os falantes, em situação formal, mostrarem sensibilidade à restrição do clítico em primeira posição, a escolha entre ênclise e próclise não deriva dos mesmos princípios da gramática do Português europeu. A ênclise é favorecida pelo se indeterminador, em contextos discursivos particulares, e a conjunção subordinante não constitui um fator categórico de próclise. Por outro lado, veremos logo que a restrição ao clítico em primeira posição é várias vezes violada no nosso corpus, inclusive em elocução formal. Esses fatos mostram que, mesmo quando a sintaxe dos falantes cultos parece aproximar‑se da norma portuguesa, ela tem características próprias que são totalmente incompatíveis com esta. Veremos, por outro lado, que as alternativas ênclise/próclise parecem derivar, também no PB, de condicionamentos prosódicos.

        Com infinitivo, há 8 casos de ênclise. Os 6 casos com o/a já foram apresentados acima. Note‑se que não há nenhuma ocorrência deste pronome em próclise a um verbo no infinitivo. Os dois outros casos encontram‑se na mesma frase, envolvendo ambos um se reflexivo:

 

(17)

 

era justamente isso, era parar pra meditar, para conhecer‑se, para decifrar‑se (D2‑Re).

 

        Em conclusão, observamos dois tipos de ênclise: uma, que envolve o pronome se, e é fortemente condicionada por fatores discursivos e estilísticos. A outra, envolvendo o pronome o/a, e que parece de natureza mais genuinamente sintática, uma vez que é condicionada pela forma do verbo: a ênclise nunca aparece com tempo finito e é categórica com infinitivo. Na seção III 2, tentaremos propor elementos de análise para estes dois casos.

        Todo o resto é próclise, que se verifica com todos os pronomes:

 

(18)

 

Aí você me pegou (Did‑SP)

A salada se resume a alface e tomate (Did‑Recife)

Eu o levo (D2‑SP)

Eu a coloquei no maternal (Did‑Sa)

Quando eu te falei da peça Hair (Did‑SP)

E nos viram sempre jogando (Did‑Poa)

Eu não posso no momento lhe dar (Did‑Recife).

 

        Note‑se que todos os pronomes podem aparecer nessa ordem, contrariamente ao que verificamos com a ênclise. Mas deve ser ressaltado que, em muitos casos, a ordem é a priori ambígua. Observem‑se os dois casos com gerúndio:

 

(19)

 

Eu estou me referindo... (EF‑Rio)

Está se referindo ao padrão de vida (D2‑Rio)

 

        Os clíticos, nestes exemplos, tanto podem ser enclíticos ao auxiliar quanto proclíticos ao gerúndio. Contudo, temos um caso com infinitivo — já citado acima — que é muito revelador da posição exata do clítico, já que aparece um advérbio entre o modal e o verbo,

 

(20)

 

não posso no momento lhe dar (Did‑Re).

 

        Nesse exemplo, fica patente a ausência de “subida” do clítico (em ênclise) para o modal, já que entre os dois aparece um advérbio.11 Por outro lado, esse dado evidencia um aspecto importante da sintaxe dos clíticos no PB: a negação não interfere na sua posição. Compare‑se este enunciado com as duas realizações possíveis da mesma frase no português europeu: “não lhe posso no momento dar e não posso no momento dar‑lhe”, sendo agramatical a forma que aparece no PB. Como foi enfatizado por Pagotto (1992), as locuções verbais são reveladoras das diferenças do português brasileiro em relação ao português clássico, do qual se diferenciou. O português clássico era mais proclítico do que o português europeu moderno, mas tinha o mesmo uso que este no que diz respeito aos enunciados acima. Os dados do corpus piloto vêm reforçar a observação de que a regra geral, nas locuções verbais, é de próclise ao verbo que atribui função temática ao pronome (com exceção do pronome o/a, cf. § 2.3). Essa ordem encontra‑se também em todas as ocorrências de V+infinitivo que sempre apresentam V cl inf, e nunca cl V inf, estrutura que corresponderia a uma subida do clítico, em próclise, para o verbo flexionado. Isso se verifica tanto nos casos em que o verbo flexionado é um modal ou um auxiliar temporal,

 

(21)

 

alguém já poderia me dizer (EF‑Re)

ela vai se constituir numa categoria (EF‑Poa)

 

quanto em complementos no infinitivo de verbos não auxiliares

 

(22)

 

eu preciso me defender (EF‑SP)

 

        E, como vimos acima, essa ordem não é afetada pela presença de um chamado “atrator”, como a negação, ou um complementador:

 

(23)

 

agora não tinha me lembrado (Did‑Poa)

essas indústrias novas que estão se implantando (D2‑Sa).

 

        Note‑se também que a próclise ao verbo no infinitivo é a regra, menos para o/a, nos contextos em que o verbo é regido por preposição:

 

(24)

 

esta preocupação vital do homem pré‑histórico de se conservar vivo (EF‑SP)

... dava impulso com os pés para se agarrar o outro (Did‑Poa)

para que ele viesse a se manifestar nas urnas (D2‑Re).

 

        Encontramos de novo uma diferença em relação ao uso do PE, que distingue o infinitivo regido por verbo (ênclise ao verbo no infinitivo ou subida para o verbo flexionado) e o regido por preposição (próclise ao verbo no infinitivo). O PB parece, pelo contrário, apresentar um esquema extremamente regular de próclise ao verbo principal.12

        A próclise se mantém com o imperativo:

 

(25)

 

Eduardo me diga uma coisa (EF‑Re).

 

        Nisso, o PB se distingue fortemente não só do PE, mas de outras línguas como o francês e o italiano, onde é o único caso de ênclise obrigatória com verbo finito.

 

b. Posição na oração

 

        Verifica‑se no corpus a conhecida inovação do PB em relação a fases anteriores da língua bem como ao PE moderno: a ausência de restrição quanto à primeira posição na oração.  Em outros termos, a próclise não é restrita pela Lei de Tobler Mussafia, pelo menos não da mesma forma que no PE. Constatamos quatro ocorrências em posição absolutamente inicial do enunciado

 

(26)

 

me chocou tremendamente (Did‑SP)

se cala (D2‑SP)

se acusam (D2‑SP)

se ressente, a gente se ressente muito13 (Did‑Rio)

 

às quais se podem acrescentar várias ocorrências depois de elementos muito “leves”, que não autorizam a próclise no PE moderno: as conjunções e e mas.

 

(27)

 

E a utiliza da mesma maneira (EF‑Poa)

e se impôs essa atitude sua (D2‑SP)

e te pergunta do quarto dele se tem aula (D2‑SP)

mas me disseram que é uma miséria (D2‑Sa)

e nos viram sempre jogando (Did‑Poa).

 

2 ‑ Uma proposta de análise sintática da posição dos clíticos no português do Brasil

 

        2.1 ‑ Os clíticos na teoria gerativa

 

        2.1.1 ‑ Os clíticos são núcleos

 

        Podemos distinguir clíticos sintáticos e clíticos fonológicos. Os clíticos fonológicos nem sempre são clíticos em sintaxe. Esta afirmação implica uma definição sintática de clítico.

        A gramática gerativa distingue sintagmas (SX) e núcleos (X0). Do ponto de vista sintático, os clíticos pronominais são analisados como núcleos e não como sintagmas, por oposição aos pronomes tônicos. No final da derivação (na chamada estrutura‑S) eles não ocupam uma posição argumental, ou seja, de sujeito ou objeto, mas encontram‑se afixados a um elemento verbal, estando dominados, como ele, pela categoria Flexão. Isso implica que se movam como núcleos. Em outras palavras, os clíticos são originalmente núcleos de um sintagma ocupando alguma função gramatical na oração, e são extraídos de dentro desse sintagma por um movimento que os afixa a um outro elemento nuclear da oração. Voltaremos abaixo à questão da sua natureza categorial.

        O clítico sintático é sempre também um clítico fonológico, no sentido de que corresponde a um item lexical sem acento primário que se apóia necessariamente em outra palavra. O inverso nem sempre é verdadeiro: nem todo clítico fonológico é um clítico sintático no sentido acima definido. Um exemplo de pronome fonologicamente mas não sintaticamente clítico encontra‑se em francês: segundo Rizzi (1987), o pronome sujeito je/tu não é um clítico sintático, mas ocupa em estrutura‑S a posição do sintagma nominal sujeito. A cliticização fonológica é portanto um fenõmeno mais amplo, e não inteiramente condicionado pela sintaxe.

 

        2.1.2 ‑ Próclise e ênclise

 

        A teoria da sintaxe tem procurado explicar esses dois fenômenos por análises sintáticas. Segundo, por exemplo, Kayne (1991), a ordem normal é a próclise. A ordem V‑cl é tida por muitos autores como decorrendo de um movimento independente do verbo para uma posição mais alta, motivada, ou bloqueada, por razões sintáticas. Para eles, portanto, a ênclise corresponderia a uma estrutura em que o verbo e o clítico não estão dominados pelo mesmo núcleo. O clítico continua em Flexão, mas o verbo está numa posição mais alta cuja natureza é objeto de discussão na literatura recente.14 Outros autores argumentam que o verbo e o clítico estão sempre dominados pelo mesmo núcleo, mas que a ênclise supõe a existência de um movimento, tanto do verbo quanto do clítico, para uma categoria funcional mais alta do que a flexão.15 A hipótese da existência de tal categoria é, assim, um ponto comum às duas análises.

        Sendo a ênclise um fenômeno altamente marginal em PB, faremos a hipótese de que nesta língua não se aplica nenhuma regra que desloque o verbo, ou o verbo e o clítico, para uma categoria funcional dominando Flexão. Mais abaixo, proporemos regras marcadas para explicar os fenômenos marginais de ênclise nesta língua.

 

        2.2 ‑ Os clíticos do PB

 

        No PB, a regra geral é a próclise. Constatamos, além disso, que o clítico aparece junto ao verbo temático. Ou seja, contrariamente ao que acontece em PE (e em outras línguas românicas), ele não aparece obrigatoriamente junto ao elemento verbal flexionado, em estruturas com particípio passado ou gerúndio.

        O PB distingue‑se também das outras línguas românicas, em particular do PE, por um outro aspecto, o quase desaparecimento do clítico o/a, também visível na total ausência das seqüências lhas(s)/lho(s). O paradigma dos clíticos é assim praticamente reduzido às formas ambíguas quanto à função e ao caso que lhes é associado (me, te, se, lhe): essas formas podem ser objeto direto (acusativo) ou indireto (dativo). Tal ambigüidade, que aparece também nas outras línguas românicas na primeira e segunda pessoa, estende‑se no PB à terceira, onde lhe, em certos dialetos, pode ser interpretado como um objeto direto: “Eu lhe vi”. O que tende a desaparecer no PB é portanto o clítico puramente acusativo (o/a), que é também aquele menos tônico.

        Um caminho natural é procurar uma correlação entre a natureza do clítico na língua e seu comportamento sintático. Uriagereka (1992), baseado numa proposta original de E. Torrego, atribui aos clíticos de 3ª pessoa uma natureza de determinante – hipótese para a qual a identidade entre o clítico acusativo e o artigo vem trazer uma forte justificação empírica. A idéia de que os clíticos são determinantes é coerente com a afirmação feita acima, de que são núcleos e se movem como núcleos.  Acrescenta a idéia de que não são categorias lexicais, mas funcionais, como Flexão. Aliás, volta‑se assim à tradição gramatical que considera os pronomes como uma categoria diferente dos nomes. Nessa visão, os pronomes tônicos são Sintagmas Determinantes (SDs).

        Uriagereka propõe por outro lado distinguir os clíticos de primeira e segunda pessoa, que ele chama de “clíticos fortes”16, em relação aos de terceira pessoa.  Segundo ele, no caso dos primeiros, a “extração” do núcleo de dentro do sintagma se faz depois do movimento deste para uma posição de adjunção à oração (SFlex). Ou seja, os “clíticos fortes” movem‑se primeiro como sintagmas, e só depois de se adjungirem à oração é que o seu núcleo se cliticiza à Flexão.17 Proporemos que, no PB, todos os clíticos são clíticos “fortes”, inclusive o de terceira pessoa lhe, que se alinhou no resto do paradigma uma vez desaparecido (ou em via de desaparecimento) o clítico o/a. E todos se movem como sintagmas. Mas, contrariamente ao que, segundo a análise de Uriagereka, acontece em outras línguas, não há finalmente cliticização sintática ao nódulo Flexão. Em estrutura-S, o clítico se mantém numa posição de adjunção à oração, mais especificamente, à projeção que contém imediatamente o verbo que lhes atribui sua função. Em outras palavras, no PB, os clíticos não são clíticos sintáticos em nenhum nível de representação. Na realidade, eles se comportam como pronomes deslocados.

        Essa mudança no estatuto dos clíticos pode ser relacionada com a mudança na estruturação sintática da língua. Se assumirmos que na sua “subida” na oração, os clíticos (sintáticos) procuram um núcleo de concordância, chegamos à conclusão de que, para poderem mover‑se como núcleo, deve haver uma posição de concordância na oração. Galves (1991) propõe explicar um conjunto importante de particularidades sintáticas do português pela seguinte propriedade da flexão nessa língua: o seu elemento de concordância é fraco, tanto morfologica quanto interpretativamente. Sua fraqueza morfológica é visível na perda do morfema de segunda pessoa (‑s). Sua fraqueza interpretativa aparece na possibilidade de interpretação indeterminada do sujeito nulo das frases com tempo, além da tendência a preencher a posição sujeito com sujeito lexical (cf. Tarallo 1983). De um ponto de vista sintático, o desaparecimento dos clíticos núcleos é assim explicado pelo enfraquecimento da concordância.

        Propomos assim as seguintes representações para as frases com clíticos no Português Brasileiro:

 

(28)

 

com um só verbo