Tradución automática

Na Galipedia, a Wikipedia en galego.

A tradución automática (TA), tamén chamada MT (do inglés Machine Translation), é unha área da lingüística computacional que investiga o uso do software para traducir un texto dunha lingua natural a outra. Nun nivel básico, a tradución automática realiza unha simple substitución de palabras dunha lingua atómica natural polas doutra. Por medio do uso dun corpus lingüístico pódese tentar traducións máis complexas, o que permite unha xestión máis axeitada das diferencias na tipoloxía lingüística, o recoñecemento de frases, a tradución de expresións idiomáticas e o illamento de anomalías.

Visión xeral[editar | editar a fonte]

Os sistemas de tradución actuais permiten establecer parámetros (por exemplo, limitando o rango de substitucións permitidas), de acordo co dominio ou a profesión na que se fai a tradución, o que realmente mellora o resultado. Esta técnica é particularmente útil en áreas nas que se emprega unha linguaxe formal ou baseada en formularios, como os informes de tempo e os documentos legais e administrativos, pero o seu uso non é viable na tradución de diálogos ou de outros textos menos estandarizados.

Nas últimas décadas houbo un aumento no uso de técnicas estatísticas para o desenvolvemento de sistemas de tradución automática. Para a aplicación destas técnicas a un par de linguas dadas, requírese a dispoñibilidade dun corpus paralelo para o devandito par. Mediante este corpus, estímanse parámetros de modelos estatísticos correspondentes que establecen a probabilidade de que certas palabras sexan traducidas por outras, así como as posicións máis probables que tenden a ocupar as palabras da lingua destino en función das palabras correspondentes da frase orixe. O atractivo desas técnicas radica en que o desenvolvemento dun sistema para un par de linguas dado pode facerse de maneira moi automática, cunha moi reducida necesidade de traballo experto por partes de especialistas en lingüística.

A intervención humana pode mellorar a calidade da saída, por exemplo, algúns sistemas poden traducir con máis exactitude, se o usuario identificou previamente as palabras que corresponden aos nomes propios. Coa axuda destas técnicas, a tradución automática demostrou ser un auxiliar útil ao tradutor humano. Con todo, e aínda cando nalgúns casos, pode producir resultados utilizables "tal cal", os sistemas actuais son incapaces de produciren resultados tan bos como un tradutor humano, sobre todo cando o texto a ser traducido usa unha linguaxe coloquial ou familiar.

Nese sentido, recentemente están gañando especial interese as técnicas estatísticas de tradución asistida baseada nunha aproximación interactiva-preditiva, na que o ordenador e o tradutor humano traballan en estreita colaboración. Tomando como base o texto-fonte a traducir, o sistema ofrece suxestións sobre as posibles traducións para a lingua destino. Se algunha destas suxestións é aceptable, o usuario selecciónaa, e en caso contrario, corrixe o necesario ata obter un fragmento correcto. A partir dese fragmento, o sistema produce mellores predicións. O proceso continúa desta maneira ata obter unha tradución totalmente aceptable polo usuario. Segundo as avaliacións feitas con usuarios reais no proxecto TransType-2[1], este proceso reduce considerablemente o tempo e o esforzo necesario para obter traducións de calidade.

A tradución como problema[editar | editar a fonte]

A tradución é hoxe en día o principal escollo na sociedade da información e a súa mecanización supón unha mellora importante fronte ao problema da avalancha informativa e a necesidade da comunicación translinguística.

O primeiros desenvolvementos informáticos realizáronse no famoso ordenador ENIAC en 1946. Entre os investigadores pioneiros hai que citar a Warren Weaver, da Fundación Rockefeller. El foi quen anunciou publicamente a disciplina anticipando posibles métodos científicos para abordala: o uso de técnicas criptográficas, a aplicación dos teoremas de Shannon e a utilidade da estatística, así como a posibilidade de aproveitar a lóxica subxacente á linguaxe humana e as aparentes propiedades universais.

Notas[editar | editar a fonte]

  1. Web do Proxecto TransType-2.