O mercado para esse tipo de produto é simplesmente imenso. O surgimento de blocos políticos e econômicos, como a NAFTA, a Comunidade Européia, o COMECON e o MERCOSUR aumentou muito a necessidade de tradução de todos os tipos de documentos, desde acordos e contratos, até manuais técnicos e folhetos de divulgação de produtos. Na Comunidade Européia, por exemplo, trabalham mais de 40.000 tradutores, a um custo enorme, e a cada país que entra na Comunidade, como a Grécia, a Turquia e Portugal, multiplica-se a necessidade de traduções mútuas entre todas as linguagens existentes (já são doze !). A globalização da economia e da cultura também têm criado grande demanda para serviços de tradução de alta qualidade, em pouquissimo tempo. Estimou-se, por exemplo, que se existisse apenas um tradutor para cada combinação duas a duas de todas as linguagens conhecidas, seriam necessárias 30 milhões de pessoas !
Como funciona um programa de tradução automática ? Qual é a qualidade de tradução se consegue ?
As primeiras tentativas, feitas 30 anos atrás nos EUA, utilizavam um programa relativamente simples, que traduzia as palavras, baseado apenas em um dicionário, e que conhecia um pouco de gramática, tal como os verbos são flexionados, os plurais, etc. Logo se descobriu que esse tipo de programa não funcionava adequadamente, e produzia traduções cheias de erros primários.
A tecnologia mais avançada usada hoje se baseia na Inteligência Artificial, pois se chegou à conclusão que somente o conhecimento da léxica (vocabulário) e sintaxe (gramática) não é suficiente para fazer uma boa tradução. A semântica (significado das palavras) e o conhecimento do contexto (cultura) também são essenciais. Por exemplo: a tradução da frase "o menino apagou a vela do bolo de aniversário", ao ser traduzido para o inglês, poderá gerar frases totalmente distintas, pois a palavra "vela" pode ser traduzida para "candle" (vela de cera) e "sail" (vela de barco). O que diferencia a tradução correta é o entendimento do contexto (nesse caso, "bolo de aniversário"). Outro complicador é o fato de que as linguagens surgiram de forma fonética, antes de terem a forma escrita, por isso existem sutilezas de pronúncia que não podem ser captadas por programas de tradução, e que fazem uma enorme diferença quanto ao significado (o Livro Guiness de Recordes cita uma palavra em chinês que tem 21 significados diferentes, conforme a maneira com que é pronunciada !).
As linguagens naturais (humanas) são cheias de coisas como essa, por isso é dificílimo fazer um programa de computador que traduza perfeitamente, baseado em contexto, pois ele teria que ser tão inteligente e bem informado quanto um ser humano adulto. É o que os americanos chamam de "common sense", ou o conhecimento comum a todas as pessoas de uma cultura, que não está escrito em lugar nenhum. Evidentemente, esse conhecimento é difícil de se colocar em um computador. Assim, tem muita gente que acha que ainda vai demorar muitas décadas até que surja um programa de tradução automática com a mesma capacidade de um tradutor profissional.
No entanto, mesmo com todas essas dificuldades, já existem produtos práticos no mercado. A Comunidade Européia desenvolveu um sistema chamado SYSTRAN, que é capaz de traduzir entre todas as linguagens européias, e o tem utilizado intensamente para traduzir documentos burocráticos e técnicos. A Organização Panamericana de Saúde, sediada em Washington, também desenvolveu um software que traduz textos de medicina em três idiomas, português, espanhol e inglês. A ONU é outra entidade internacional que desenvolve programas nesse sentido.
Recentemente, tive a oportunidade de testar o SYSTRAN, através da Internet. A empresa que desenvolveu o software colocou uma homepage de demonstração, que é muito interessante (http://www.systranmt.com/translate.html). Você fornece o endereço URL da página que quer traduzir, e escolhe o par de idiomas (por exemplo, inglês-português). Em questão de segundos, você recebe a homepage totalmente traduzida, montada exatamente como a original (inclusive com as mesmas imagens) e pode gravá-la em disco usando o Netscape ou Internet Explorer. O serviço é gratuito, mas está limitado a páginas menores do que 10K caracteres. Os idiomas que o demo da SYSTRAN é capaz de traduzir são: português, inglês, francês, espanhol, alemão, italiano e russo.
Os resultados são heterogêneos. Como o vocabulário do SYSTRAN é genérico (não tem palavras de campos especializados, como informática ou medicina), ele erra muito em textos técnicos. Frases e sentenças comuns e expressas em linguagem simples são traduzidas praticamente sem erros. Textos mais complexos, que usam muitas expressões idiomáticas, voz passiva, figuras literárias, etc, são traduzidas miseravelmente. Em resumo, o sistema é bom para dar uma idéia inicial da tradução do texto, para pessoas que não conhecem nada da língua original, para ver se vale a pena o investimento de uma tradução especializada. Também pode servir como primeiro trabalho "braçal" de tradução de um texto longo, suplementado por uma revisão por tradutor humano.
Mas não tenho dúvidas de que esse tipo de software ainda
vai evoluir muito, e que eventualmente será mais um dos programas
de computador que utilizaremos rotineiramente no nosso dia a dia, principalmente
se acoplado com a navegação na Internet.
Publicado em: Jornal Correio Popular, Campinas, 25/12/96
Autor: Email: sabbatin@nib.unicamp.br
Copyright © 1997 Correio Popular, Campinas, Brazil