admin

Categorías

Coobis

Todos quieren construir un buscador de lenguaje natural… incluso Google

Durante la última década, uno de los proyectos más ambiciosos que estamos esperando es un buscador de información que nos permita localizar datos escribiendo preguntas tal y como las formulamos normalmente. En estos momentos, debemos escribir «año nacimiento picasso» en Google, pero ¿por qué no escribir «¿cuándo nació Picasso?». La razón es que todos los buscadores devuelven la información de páginas web cuyos contenidos coinciden exactamente con las palabras escritas por los usuarios, y éstos se están acostumbrando a escribir las consultas de esta manera (e incluso también los generadores de contenidos).

Por ello, han ido naciendo durante los últimos años diversos proyectos en este sentido, los llamados buscadores «de lenguaje natural», que pretenden «comprender» de manera inteligente las cuestiones escritas por los usuarios y devolverle la información más certera. Así, los diferentes servicios que han ido naciendo han ido consiguiendo hacer bastante ruido durante algunos meses, incluso consiguiendo varios millones de dólares de inversión, pero ninguno de ellos ha podido ofrecer la tecnología prometida. Incluso el propio IBM disponde de una tecnología que aún está bastante verde.

Hace unas semanas, Danny Sullivan escribía este post hace unos meses sobre los proyectos más sonados de la historia, y recientemente hemos podido conocer algunos otros que pretenden volver a ser noticia, como por ejemplo Hakia y Chacha. Y esta última semana, el prestigioso diario ‘New York Times’ publicaba un artículo en el que se hacía eco de estos dos proyectos y de otro más: Powerset, un buscador que aún no ofrece de manera pública ningún servicio, pero que ha conseguido más de 12 millones de dólares de manos de firmas de capital-riesgo.

Según afirma el artículo del ‘New York Times’, este tipo de proyectos han recibido, desde 2004, unos 350 millones de dólares de inversión por parte de ‘ángeles inversores’ que pretenden obtener importantes beneficios con un servicio que pueda hacer sombra a Google, mediante los multimillonarios ingresos de la publicidad en los buscadores. Además de los 12 millones de Powerset, Chacha.com recibió 6 y Hakia.com 16.

Lo que tampoco hay que olvidar es que Google también quiere construir una herramienta que procese toda la información (tanto de la WWW como la contenida en vídeos, libros, etc.) en cualquier idioma, la interprete y la «comprenda», y sea capaz de devolver información precisa a los usuarios que le planteen preguntas. Por ello, desde hace muchos años dispone en su plantilla a muchos de los mejores expertos en Inteligencia Artificial y Procesamiento del Lenguaje Natural (Peter Norvig, Vibhu Mittal), y hace unos meses os hablábamos de una de las implementaciones de las tecnologías desarrolladas, dentro del traductor de textos de Google.

Fuente: http://google.dirson.com

Related Posts with Thumbnails

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

*

This blog is kept spam free by WP-SpamFree.

Calendario

noviembre 2024
L M X J V S D
« Nov    
 123
45678910
11121314151617
18192021222324
252627282930  

Spam

Otros enlaces

  • Enlaces

    Este blog no tiene ninguna relación con ellos, ni los recomienda.


  • Paperblog

    autobus las palmas aeropuerto cetona de frambuesa