3/7/10

Descifrado por ordenador de lenguas muertas


El interesante trabajo que puede leerse
aquí explica cómo pueden ser utilizados los ordenadores para descifrar lenguas muertas.

Utilizando la estadística y las reglas lógicas que han guiado los trabajos de investigadores anteriores, los investigadores que firman el análisis - Benjamin Snyder, Regina Barzilay y Kevin Knight- lograron descifrar textos del ugarítico (una lengua semítica) con un notable acierto, descifrando correctamente 29 de las 30 del alfabeto y deduciendo un 60% de las palabras.

El algoritmo necesita que se introduzca el texto desconocido a descifrar y un corpus no paralelo de otra lengua relacionada. Entonces, mediante técnicas estadísticas pueden extraerse patterns (rasgos o modelos) que pueden extrapolarse al otro lenguaje. Así, la frecuencia de aparación de ciertas letras, el reconocimiento de terminaciones o sufijos, determinación de conjunciones, etc.

El documento explica otras técnicas avanzadas que, aplicadas en su conjunto, logran una eficacia interesante en la decodificación.






0 comentarios :