http://funredes.org/mistica

MISTICA: Re: Traducción

From: Daniel Pimienta ([email protected])
Date: Sat Aug 23 2003 - 08:40:00 AST


Iván,

Creo que el tema es de mucho intéres para varias personas de esta lista,
y me agrade mucho ver que aceptas el reto de esta discusión. Este
asunto es uno de lo mas estratégico de la temática "Impacto social de las
TIC" y te invito a seguir este dialogo en Mistica (y ser tolerante con
nuestras posibles ambiguedades en la expresión).

Como sabes, no soy por nada un profesional del campo de la traducción
y por lo tanto te pido paciencia con mi manera de expresar.
No tengo el vocabulario pero me parece que tengo los conceptos
relativamente claros. Hay un "motor de traducción" (que debe
ajustarse a la sintaxis de las nuevas lenguas que el programa sea
capaz de traducir) y bases terminologicas paralelas entre las
lenguas. El motor fabrica la estructura de la frase traducida y
las bases permiten rellenar la estructura con las palabras apropiadas
en la forma sintactica apropiada al contexto dentro de la frase.

El enorme mérito de tu sistema es que evita tener que pasar por el inglés
para traducir, por ejemplo, del español al francés y ofrece varias
traducciones de una vez en el mismo tiempo que tomaria una sola.

Ese es el resultado de una aproximación "matricial" lo que no tiene
precedente pues todos los otros motores trabajan en base a la gramatica
de Chomsky la cual es "recursiva". El hecho que tu método sea matricial
en vez de recursivo explica sus capacidades excepcionales y representa
la "ciencia" fuera de norma que lo caracteriza (ademas de haber seleccionado
una forma antigua del Aymara como lengua pivote, por su pureza sintactica).
Muchos programas han preferido crear una lengua artificial pivote.

Lamento el malentendido pero cuando digo "no hay ciencia" me refiero
precisamente a la construcción de las bases terminológicas en oposición
al motor. Así lo que quise decir es justamente que el "motor" tiene muchisima
ciencia y te reitero que soy un admirador de el genio que demostraste en
haber concebido y realizado, con ciencia criolla, esta maravillosa
herramienta. Lo que queria implicar es justamente que es una pena de haber
llegado a resolver la parte la mas dificil y estar trancado (desde 1986,
son mas de 15 años!) en la parte que es la mas linear y previsible, la
de rellenar los diccionarios. Esta parte requiere recursos y tiempo pero
ningun avance tecnológico... ¿Me entiendes mejor? ¿Estamos de acuerdo?

Para dar una analogia Misticiana, es la misma situación con el "metasitio"
de Mistica: hemos concebido la estructura del metasitio pero hasta que
se rellena con los contenidos de las discusiones queda siendo ... una
frustración.

Entiendo muy bien tu respuesta con lo de las lenguas indigenas, tomo nota
y la valoro mucho. Dices que si alguien se motiva para rellenar la parte
terminológica correspondiente aceptaras de hacer este experimento.
Espero que "alguien" reacciona en esta lista (Diego Saravia?)!!!

Ultimo, lo mas importante, el asunto de FLOSS. Me temo que el malentendido
inicial haya podido complicar el dialogo sobre este asunto fundamental.

Por supuesto, yo no creo que la solución es tan sencilla como abrir el codigo.
He visto la experiencia interesante con la Unión Latina donde para
añadir exitosamente el rumano en 3 meses se te mando un linguista
para compartir un tiempo contigo y poder complementar el programa
con lo propio de la sintaxis rumana de manera a que pueda luego, mediante
la creación de las bases terminologicas rumanas, añadir este eje
de traducción.

Tres meses es un tiempo increiblemente corto para añadir una nueva lengua
a un sistema de traducción (y con la ventaja que una vez añadida se abren
los pasos a todos las combinaciones de lenguas tratadas)!
Eso es otro argumento objetivo en favor de tu ciencia.

Sin embargo, si hablamos sólo de 100 lenguas (existen 6000 lenguas aun vivas),
100x3=300 meses, es decir 25 años, es demasiado tiempo para un sólo hombre...

Entonces se requiere una forma de organización que permita descentralizar
el proceso. FLOSS es un elemento de la respuesta, creo una condición necesaria,
pero claramente no es suficiente. El asunto realmente no es de divulgar tu
motor gacias al FLOSS, eso no va a resolver nada. El asunto es organizativo.

La otra parte de la respuesta seria entonces, en mi opinión, un modelo
económico basado en la contribución de los organismos internacionales y
de los estados donde cada país aporta la inversión necesaria para
incorporar sus lenguas al sistema y responsabilizarse con la producción
de sus bases terminologicas (ahi hay un espacio para los actores del FLOSS
para sostener y acelerar esos procesos).

Los organismos internacionales interesados se responsabilizan de motivar los
estados, de organizar la generalización del programa a varias lenguas y la
recepción de las bases terminológicas respectivas.

No es un sueño totalmente absurdo pues ya hubo un precedente
en Naciones Unidas...

¿Como se podria hacer? Creando una estructura idonea bajo un sombrero
internacional que permita darte la responsabilidad para conducir este proceso
de descentralización, y de paso darte oficialmente los creditos y la
remuneración que te corresponde.

No digo que seria facil lograr eso (habra quienes se opondran y habra las
usuales resistencia); digo que si te dejas motivar por este escenario, podria
haber una movilización de personas y instituciones para convencer que es una
oportunidad única para hacer de las lenguas una parte intangible del
patrimonio
universal.

Cuenta con todo mi energia para ello y sigues contando con toda mi admiración y
respeto cualquier sea tu decisión.

Daniel

PD: Una pregunta que me hago en cuanto a las bases terminologicas es del umbral
cuantitiva para que tenga sentido.
Me parece que con 300 palabras se puede hacer una demo.
Con 3,000 palabras se puede tener un prototipo serio.
Con 30,000 palabras se tiene un traductor no especializado.
Con 300,000 palabras seria un traductor con varias terminologias especialiadas.
Tienen sentido esas cifras?



Este archivo fue generado por hypermail 2.1.3 : Mon Mar 08 2004 - 12:01:27 AST