admin

Categorías

Coobis

lenguaje natural

Bebé robot aprende las primeras palabras de un maestro humano

Al principio es sólo ruido: una corriente de sonidos incoherentes, susurros a distancia. Pero, después de unos minutos, una palabra totalmente formada emerge repentinamente: rojo. Luego, otra: caja. De este modo, un robot balbuceando ha aprendido a hablar sus primeras palabras reales, sólo por el chat con un ser humano.

Ver este salto evolutivo en una máquina puede llevar a los robots a que hablen de una manera más natural, similar a la  forma humana, y ayudar a descubrir cómo los niños primero empiezan a tener sentido del lenguaje. Entre las edades de 6 y 14 meses los niños pasan de balbuceo de cadenas de sílabas a pronunciar palabras reales. Se trata de un paso necesario en el camino a la adquisición del lenguaje por completo. Una vez que unas pocas palabras «ancla»  se han establecido, proporcionan pistas en cuanto a que palabras pueden empezar y terminar así y de esta forma es más fácil que un niño aprenda a hablar.

Inspirado por este proceso, un equipo dirigido por el científico informático Lyon Caroline en la Universidad de Hertfordshire (Reino Unido), ha programado un robot humanoide llamado iCub – DeeChee  con casi todas las sílabas que existen en Inglés, alrededor de 40000 en total. Esto le permitió balbucear algo así como un bebé, en forma arbitraria encadena sílabas.

Los investigadores también reclutaron a 34 personas para actuar como maestros, a quienes se les pidió un trato a DeeChee como si fuera un niño. DeeChee participó en un diálogo de ocho minutos con cada maestro, pero, entre cada sesión, su memoria se salvó, y  a continuación se reinició, de modo que con cada maestro el experimento comenzó de nuevo. Al inicio del diálogo, cada una de las sílabas en el léxico de DeeChee tuvo una puntuación idéntica.

Puntuación del léxico

Todo eso empezó a cambiar una vez que comenzó la lección. Programado para turnarse para escuchar y luego hablar, DeeChee convirtió el discurso del profesor en sílabas. A continuación, empleó esta información para actualizar los resultados en su propio léxico, dando puntos extra a las sílabas que el maestro había utilizado.

La próxima vez que hablaba, sería más probable que repitiera las sílabas que el maestro había pronunciado debido a que estos ya tenían las puntuaciones más altas.

Lyon dice que esto es una reminiscencia de los bebés humanos. «Cuando oyen los sonidos frecuentes, se vuelven sensibles a ellos», dice Lyon. «Prefieren lo que es familiar».

Este aprendizaje por imitación se reforzó, entonces los profesores hicieron comentarios alentadores cuando DeeChee habló una palabra reconocible. DeeChee fue programado para la detección de estos comentarios y dar puntos extra a las sílabas que precedieron a la aprobación del profesor. Inevitablemente, algunas sílabas sin sentido pueden obtener puntos extra también. Pero a medida que este proceso se repitió, sólo las sílabas que componen las palabras que siguen apareciendo en las cadenas obtuvieron su aprobación.

Aunque el robot todavía estaba pronunciando sílabas sin sentido de los corrientes, hacia el final de los ocho minutos, las palabras reales seguían apareciendo con más frecuencia que si DeeChee selecciona las sílabas al azar.

Que las palabras puedan surgir de un balbuceo mediante un proceso de aprendizaje estadístico no es específico a la lengua demuestra que esta etapa de la adquisición del lenguaje no requiere facultades de «cableados» de gramática, dice Lyon.

Pablo Vogt, un científico cognitivo de la Universidad de Tilburg en los Países Bajos está impresionado: «Es un primer paso muy interesante para tener robots que pueden ayudar a estudiar la adquisición del lenguaje.»

En este momento, el discurso de DeeChee está muy lejos de toda regla idiomática, pero a partir del balbuceo puede ser la mejor manera de crear robots que hablen de forma natural. «Si usted quiere  el robot para trabajar con el lenguaje natural, entonces puede que tenga que enseñarlo desde el principio», dice Lyon.

Fuente: PLoS One, DOI: 10.1371/journal.pone.0038236

Todos quieren construir un buscador de lenguaje natural… incluso Google

Durante la última década, uno de los proyectos más ambiciosos que estamos esperando es un buscador de información que nos permita localizar datos escribiendo preguntas tal y como las formulamos normalmente. En estos momentos, debemos escribir «año nacimiento picasso» en Google, pero ¿por qué no escribir «¿cuándo nació Picasso?». La razón es que todos los buscadores devuelven la información de páginas web cuyos contenidos coinciden exactamente con las palabras escritas por los usuarios, y éstos se están acostumbrando a escribir las consultas de esta manera (e incluso también los generadores de contenidos).

Por ello, han ido naciendo durante los últimos años diversos proyectos en este sentido, los llamados buscadores «de lenguaje natural», que pretenden «comprender» de manera inteligente las cuestiones escritas por los usuarios y devolverle la información más certera. Así, los diferentes servicios que han ido naciendo han ido consiguiendo hacer bastante ruido durante algunos meses, incluso consiguiendo varios millones de dólares de inversión, pero ninguno de ellos ha podido ofrecer la tecnología prometida. Incluso el propio IBM disponde de una tecnología que aún está bastante verde.

Hace unas semanas, Danny Sullivan escribía este post hace unos meses sobre los proyectos más sonados de la historia, y recientemente hemos podido conocer algunos otros que pretenden volver a ser noticia, como por ejemplo Hakia y Chacha. Y esta última semana, el prestigioso diario ‘New York Times’ publicaba un artículo en el que se hacía eco de estos dos proyectos y de otro más: Powerset, un buscador que aún no ofrece de manera pública ningún servicio, pero que ha conseguido más de 12 millones de dólares de manos de firmas de capital-riesgo.

Según afirma el artículo del ‘New York Times’, este tipo de proyectos han recibido, desde 2004, unos 350 millones de dólares de inversión por parte de ‘ángeles inversores’ que pretenden obtener importantes beneficios con un servicio que pueda hacer sombra a Google, mediante los multimillonarios ingresos de la publicidad en los buscadores. Además de los 12 millones de Powerset, Chacha.com recibió 6 y Hakia.com 16.

Lo que tampoco hay que olvidar es que Google también quiere construir una herramienta que procese toda la información (tanto de la WWW como la contenida en vídeos, libros, etc.) en cualquier idioma, la interprete y la «comprenda», y sea capaz de devolver información precisa a los usuarios que le planteen preguntas. Por ello, desde hace muchos años dispone en su plantilla a muchos de los mejores expertos en Inteligencia Artificial y Procesamiento del Lenguaje Natural (Peter Norvig, Vibhu Mittal), y hace unos meses os hablábamos de una de las implementaciones de las tecnologías desarrolladas, dentro del traductor de textos de Google.

Fuente: http://google.dirson.com

Related Posts with Thumbnails

Calendario

noviembre 2024
L M X J V S D
« Nov    
 123
45678910
11121314151617
18192021222324
252627282930  

Spam

Otros enlaces

  • Enlaces

    Este blog no tiene ninguna relación con ellos, ni los recomienda.


  • Paperblog

    autobus las palmas aeropuerto cetona de frambuesa