martes, 19 de febrero de 2008

SOFTWARE QUE APRENDE LAS REGLAS DEL LENGUAJE Y COMPONE FRASES

Esta llamativa innovación es fruto de la colaboración entre investigadores de las universidades de Cornell y Tel Aviv. Lo que también es interesante del método es que opera con datos tales como partituras de música o secuencias de proteínas.
El desarrollo tiene implicaciones para el reconocimiento del habla así como para otras aplicaciones donde el procesamiento de idiomas se vea involucrado. Ofrece además nuevas aportaciones para los psicolingüistas y para el estudio de cómo se aprende mejor una lengua."El algoritmo que hemos desarrollado puede tomar una parte de un texto y generar del mismo una serie de patrones recurrentes o reglas, para luego producir material nuevo", explica Shimon Edelman, un científico involucrado en temas informáticos que es profesor de psicología en Cornell. Destaca que ésta es la primera vez que un algoritmo, sin que sea ayudado externamente, se muestra capaz de aprender sintaxis complejas, pudiendo generar nuevas frases y demostrando ser útil en otros campos que requieren del descubrimiento de estructuras en datos primarios, como por ejemplo en bioinformática.A diferencia de intentos previos para desarrollar algoritmos que capaciten a un sistema informático a aprender por sí solo un idioma, el nuevo método, denominado ADIOS (del inglés, "Automatic Distillation of Structure"), identifica eficazmente pautas complejas dentro de textos en bruto.ADIOS se fundamenta en un método estadístico de extracción de patrones y de generalizaciones estructurales, dos procesos implicados en el aprendizaje humano del idioma. Los experimentos conducidos por los investigadores del proyecto ADIOS muestran que el programa puede adquirir estructuras intrincadas a partir de material diverso, incluyendo transcripciones del habla de padres a sus hijos de dos o tres años de edad. Esto podría ser de ayuda para averiguar cómo los niños pequeños, que aprenden el lenguaje de un modo similar a como lo hace el programa, es decir, palabra por palabra, y con muy poca supervisión, acaban dominando por completo todas las complejidades de su lengua natal.
El algoritmo ha sido probado en el texto completo de la Biblia en varios idiomas, en lenguajes artificiales con miles de normas, y en notación musical. También se ha aplicado a datos biológicos. En el análisis de proteínas, por ejemplo, el algoritmo logró extraer de secuencias de aminoácidos patrones que se encontraban altamente correlacionados con las propiedades funcionales de las proteínas estudiadas.El nuevo método fue desarrollado de manera conjunta por Edelman, David Horn y Eytan Ruppin, profesores de física y de ciencias de la computación, respectivamente, en la Universidad de Tel Aviv, y también contó con la colaboración de Zach Solan.

No hay comentarios:

compunoticias

INFORM@CION