Páginas

13 feb 2013

Sistema automático para crear protolenguas

En lingüística, uno de los retos más antiguos ha sido y es reconstruir las palabras de los protolenguajes, es decir, las lenguas originarias de un mismo grupo, a partir de las cuales evolucionaron los idiomas modernos. Científicos de centros canadienses y estadounidenses han desarrollado un sistema estadístico automático para reconstruir esos protolenguajes. Se trata de un modelo que analiza los cambios de sonido en las unidades básicas fonológicas: los fonemas. La investigación se publica esta semana en la revista PNAS.




"Identificar las formas de esos idiomas originales permite evaluar la naturaleza de los cambios en el lenguaje y comprender sus inferencias sobre la historia humana", explican los expertos. La información sobre los sonidos y las palabras de los idiomas actuales permite a los lingüistas reconstruir lenguas ancestrales.

Los autores del trabajo han reproducido un conjunto de estas lenguas a partir de  una base de datos con más de 142.000 formas de palabras, procedentes de 637 lenguas austronesias -del sudeste de Asia, el Pacífico y parte de Asia continental-.

Para ello han diseñado un sistema que trabaja directamente con los cambios de sonido en los fonemas gracias a un transductor probabilístico, un aparato que captura los cambios regulares de sonidos y que es sensible respecto al contexto en el que estos se producen.

Los sonidos más importantes permanecen

Con este modelo han analizado una antigua hipótesis propuesta por el lingüista Charles Hockett y denominada "carga funcional" (functional load), vigente desde 1955. Esta teoría sostiene que los sonidos más importantes para distinguir las palabras tienen una menor probabilidad de sufrir cambios con el paso del tiempo. "Hemos visto claramente que la mayoría de puntos en los que hay gran probabilidad de fusión entre fonemas, tienen una baja carga funcional, es decir, no son sonidos imprescindibles para el desarrollo de la lengua, lo que prueba la certeza de la hipótesis de la carga funcional", recoge el estudio.

A favor de este nuevo modelo de análisis, los investigadores aseguran que el 85% de las reconstrucciones obtenidas son idénticas a las que los lingüistas venían realizando de forma manual en el pasado. "Es poco probable que el sistema automatizado reemplace a las reconstrucciones lingüísticas manuales, sin embargo, sí podría ser de utilidad para grandes reconstrucciones. Asimismo, el nuevo sistema  representa un paso adelante en la aplicación de métodos computacionales para la lingüística", concluyen.


Fuente:

No hay comentarios:

Publicar un comentario