Al cabo del año, oímos hablar de decenas de servicios que serán capaces de revolucionar Internet (este año, por ejemplo, ya llevamos Google Wave y Opera Unite). La mayoría de estas promesas se quedan simplemente en buenas intenciones, y sólo unas pocas, la verdaderamente interesantes, consiguen cambiar nuestra manera de navegar por la Red.
Aunque todavía es demasiado pronto para poder emitir un juicio, Wolfram|Alpha tiene muchas papeletas para unirse al selecto club de servicios que consiguen marcar un antes y un después. Su objetivo es dar una nueva perspectiva a la forma en la que trabajan los buscadores, al adquirir la capacidad de responder directamente a nuestras preguntas, en lugar de limitarse a darnos enlaces relacionados a los términos que introducimos. ¿Alguien dijo Skynet?
Así pues, el objetivo de este buscador de respuestas es ofrecernos acceso instantáneo al conocimiento, desde cálculos matemáticos hasta datos históricos. Dicen los expertos que usarlo “es como enchufarnos a un gigantesco cerebro electrónico”, y cierta razón no les falta. Valga como ejemplo la imagen que os muestro a continuación, donde podéis ver la diferencia entre buscar (por ahora, en inglés) “la localidad más grande de España” en Wolfram|Alpha y en Google:
Impresionante, ¿verdad? No sólo nos ha dicho que Madrid es la ciudad con mayor número de habitantes del país, sino que nos ha dado números exactos para las cinco primeras, y de regalo nos ha mostrado también los datos para el área metropolitana. Seguro que ya os estaréis haciendo idea del potencial de esta herramienta.
Pero la pregunta es: ¿Cómo funciona algo así? Pues para empezar, se basa en unos 5 millones de líneas de código de Mathematica (otra de las creaciones de Stephen Wolfram, el matemático que concibió esta herramienta), que trabaja sobre una base de datos de unos cuantos terabytes de peso.
Su gran avance es que, en lugar de indexar millones de respuestas que se asignan a unas determinadas preguntas, como hacen actualmente los buscadores semánticos, Wolfram|Alpha calcula la respuesta más apropiada. Este descomunal trabajo se realiza desde más de 10.000 procesadores actuando en paralelo, aunque este número habrá crecido desde que se anunció.
Aunque en este artículo he utilizado la comparación con Google para que os hicierais a la idea de su prodigioso funcionamiento, queda claro que no estamos hablando de un nuevo competidor para el mercado de los buscadores entre páginas web. Su objetivo no es llevarnos hasta un lugar determinado, sino responder cualquier duda que tengamos al instante.
Como ya dije antes, por ahora está únicamente disponible en inglés, por lo que tendréis que manejaros en la lengua de Shakespeare si queréis disfrutar de sus bondades. Su gigantesca base de datos no deja de crecer, así como su optimización para ser capaz de solventar preguntas cada vez más complejas.
¿Será el fin de las enciclopedias, tal y como hoy las conocemos? ¿Hasta dónde podrá llegar una inteligencia artificial de este calibre? Por ahora no lo sabemos, pero sólo lleva disponible desde hace unas pocas semanas y tiene sorprendido a todo el mundo. Si queréis saber aún más, os invito a visitar la galería de ejemplos que hay a nuestra disposición, con 100% de garantía de aprendizaje.
Fuente: anexom
________________
Enlaces relacionados:
– Nace el primer buscador español hecho por los usuarios
– Cierra Wikia Search
Resumen
Cada ciertos años uno ve una nueva aplicación que no se parece en nada a lo que habías visto antes, aunque solo sea en aparencia, y sabes que habrá un antes y un después. Ocurrió con Internet, con los navegadores, con Google… Pues bien, como decían los Monty Python, And now for something completely different: Wolfram Alpha. Como todavía no está en línea, es imprescindible ver esta presentación:
¿Lo has visto? ¿Te has quedado tan boquiabierto como yo? En los últimos meses se habían publicado algunas noticias sobre este buscador: en general los medios lo situaban como un competidor de Google. Sin embargo, si has visto la demostración, está claro que Wolfram Alpha no es Google, ni lo pretende ser.
A continuación comento algunas cosas que me parecen destacables.
Alpha es Mathematica
Para entender el origen de esta herramienta quizás es bueno recordar que es un proyecto de Stephen Wolfram, creador de Mathematica y autor del controvertido libro A New Kind of Science. Mathematica es una herramienta de análisis computacional, bastante popular entre ingenieros y científicos. Entre otras muchas cosas, este programa ofrece una serie de datos para utilizar: astronómicos, químicos, geopolíticos, financieros, matemáticos, de idiomas, biomédicos, climatológicos… Son, justamente, los tipos de datos que aparecen en la presentación. Por ejemplo, si echamos un vistazo a la página de Mathematica sobre esos datos geopolíticos vemos que podemos obtener una gráfica del PIB de Francia entre 1970 y 2005. Para ello hay que llamar a varias funciones, con una serie de parámetros:
En la presentación de Wolfram Alpha obtienen datos parecidos:
Como vemos Alpha muestra los mismos datos sobre Francia. La diferencia con Mathematica es que es un sitio web, no un software de escritorio. Y la forma de obtener los datos mezcla las búsquedas por palabras clave y el lenguaje natural -o algo que se le acerca: gdp france, what is the gdp of france. A primera vista impresiona el procesamiento de lenguaje natural, pero gdp france es mucho más corto que what is the gdp of france. ¿La lección? El uso de consultas con cierta estructura evita ambigüedades y ahorra tiempo.
((Alpha vs Google) vs Wikipedia)
¿Todavía hay alguien que piensa que el buscador de Google tiene algo que ver con Wolfram Alpha? Si es así, aquí van algunos argumentos. Hay ciertas similitudes entre Alpha y Google.
Pero a partir de ahí, las diferencias son grandes.
Sí es cierto que Google anda trabajando en cuestiones paralelas a Alpha. Google es capaz de realizar sencillas operaciones matemáticas en sus consultas. En 2007 adquirió Gapminder, un visualizador de estadísticas sobre los países. Más recientemente han estado trabajando en la publicación de datos públicos.
Algunos comparan Alpha con la Wikipedia. Tampoco creo que sea acertada esa comparación. La Wikipedia no realiza cálculos, y no almacena series de datos. Sí es un sitio donde se compila el conocimiento, pero en general no es información computable. Sí que han habido esfuerzos para extraer contenido semántico de la Wikipedia y utilizar el lenguaje natural para realizar las consultas. Es el caso de Powerset, adquirida por Microsoft.
Las claves de Alpha
Según Stephen Wolfram, los pilares de Alpha son cuatro:
Según Wolfram, en el desarrollo de Alpha han participado 100 personas. El día del lanzamiento, han querido ser capaces de responder a 175 millones de consultas diarias, y para ello han puesto en marcha dos supercomputadores, con 10 mil núcleos y cientos de terabytes.
Sobre el procesamiento de lenguaje natural. En la presentación han seleccionado ejemplos resultones, así que habrá que ver cuáles son las limitaciones cuando Alpha esté abierto al público. Por ejemplo, en las demostraciones ha sido incapaz de responder a preguntas de los periodistas, tales como «teenage pregnancy USA», «what type of sunglasses was Justin Timberlake wearing at the Oscars» y otras relacionadas con los deportes.
Si nos guiamos por el tipo de consultas realizadas en la presentación, no parece que Wolfram Alpha se dirija a un público general. La herramienta está pensada para analizar datos. A pesar de ello, y gracias a su interfaz simple y al procesamiento de lenguaje natural, conseguirán atraer a personas con un perfil mucho menos avanzado que el de Mathematica.
Alpha y la web semántica
Stephen Wolfram ha afirmado que la plataforma se abrirá a contribuciones de terceros. A mi me parece que esta herramienta, de tan fácil uso, es un gran argumento para que los gobiernos y los organismos internacionales liberen de una vez sus datos. Por no repetir el análisis, que bien lo hace Pablo Moreno, está claro que Wolfram Alpha y la web semántica pueden beneficiarse muntuamente:
«Uno de los problemas de Wolfram Alpha, es que sus bases de datos son limitadas (ahora mismo tan solo 10TB). Puede ser bueno en lo que hace, pero mantener y aumentar una base de datos así, siendo una empresa relativamente pequeña, puede ser muy complicado. Sin embargo, es posible que Wolfram se acabe beneficiando de la Linked Data (más explicaciones aquí). Si Tim Berners-Lee tiene éxito promoviendo la apertura de bases de datos, posiblemente no sería muy complicado para Wolfram acceder directamente a las mismas, y convertirse en un magnífico front-end de la linked data, con todo el poder de procesado abstracto y gráfico que tiene Mathematica».
Puedo pecar de optimista, pero Wolfram Alpha puede ser el regalo más grande que le hayan podido hacer a Tim Berners Lee y su web semántica: hay ya un buen referente para la experiencia de usuario.
Alpha, Beta, Gamma…
Algunas personas que han probado la beta se han desilusionado con la falta de respuestas y acusan al producto de estar por y para personas técnicas. Independientemente de lo que ocurra tras la apertura de Wolfram Alpha, creo que la propuesta que han realizado es tan atractiva que, a pesar de que no se cumplan las promesas, otros continuarán el camino. Más pronto que tarde aparecerán servicios web inspirados en las características de Alpha: contenidos estructurados, buscadores se, etc. .
Y por si los amigos de Google no lo habían dejado claro, el futuro es de los nerds 😉
Referencias
Fuente:Linotipo
El servicio de búsquedas distribuido, Wikia Search, impulsado por Wikia, la empresa de Jimmy Wales, no va más. Wales anunció el cierre del proyecto el pasado 31 de marzo. Wales justifica el cierre en la situación económica actual, e insiste que en algún momento volverá a apostar por los buscadores. Asegura, además, que el software libre es capaz de estar ahí. Si la noticia anterior fue que Encarta cerraba ante el empuje de otra forma de buscar y consumir información (esto es, ante la Wikipedia), ahora nos encontramos con un buscador de código abierto que pretendía poner a la persona «por encima de los algoritmos» y «acabar con el «oscurantismo» de los buscadores actuales debe cerrar su desarrollo. Una lástima.
Fuente: Barrapunto
De acuerdo al primer informe mundial de qSearch 2.0 los latinoamericanos fueron los que más búsquedas realizaron en los motores de búsqueda (Google, Yahoo, etc) en agosto del 2007. Para llegar a esta afirmación se tienen en cuenta la cantidad de búsquedas que realizó cada usuario, que en esta parte del continente se situó en 95 búsquedas por usuario. Sin embargo, el informe contiene muchos datos más valiosos. A saber:
– En agosto 2007 se realizaron 61 mil millones de búsquedas en el mundo.
– La región del pacífico de Asia (China, Japón, India) lideró este rubro con 258 millones de buscadores (personas que utilizaron esa herramienta) que realizaron más de 20 mil millones de búsquedas. Europa estuvo segundo con 210 millones de buscadores y 18 mil millones de búsquedas; Estados Unidos 206 millones/16mil millones y Ãfrica 30 millones/2 mil millones.
-Discriminando por sitio, Google tuvo 37 mil millones de búsquedas (31 mil en Google y 5 mil en Youtube), le siguió Yahoo con 8.5 mil millones, el sitio chino Baidu con 3.2 mil millones. Los sitios de Microsoft se ubicaron cuartos, mientras que la corporación coreana que posee Naver.com quedó³ quinto con 2 mil millones de búsquedas.
-El informe señala que los números muestran que sigue siendo una gran oportunidad para el marketing y la publicidad aprovechar los incesantes crecimientos en el número de usuarios de Internet y de la actividad que cada uno de ellos tiene en la red.
Fuente: MZBlog
Esto es el resultado de un informe de comScore, en el que de esta manera afirma que Google es el ganador absoluto a lo que se refiere a búsquedas en Internet.
Según comScore el buscador de Google ha tenido 61 mil millones de usuarios solo en el mes de Agosto frente a los 3.1 mil millones que ha tenido Microsoft… el estudio determina que de 750 millones de usuarios de 15 años o más, o sea el 95% de la audiencia de Internet en todo el planeta utiliza a Google como motor de búsqueda con un promedio de 80 búsquedas por usuario a lo largo del día.
¿Dónde está Yahoo en todo esto?… pues en un segundo lugar con 8.5 mil millones de usuarios, pese a que otro estudio en paralelo diga que los mejores resultados los tenga este motor de búsqueda… otro de los datos curioso es que Microsoft todavía no está en el tercer lugar, sino que se encuentra en motor de búsqueda chino Baidu, esto demuestra que China SI tiene presencia en el mercado de Internet, pese a que muchas empresas del planeta piensen lo contrario.
En resumen, en el mes de Agosto Google tuvo el 61% de las búsquedas mundiales, Yahoo el 14%, Baidu el 5.4% y Microsoft solo el 3.6%…
Fuente: NoticiasTech
Quaero iba a ser lanzado en enero de 2006 como un proyecto desarrollado en Europa «para contrarrestar la supremacía tecnológica y la influencia estadounidense, y defender así la multiculturalidad», contando con el apoyo financiero de varias empresas francesas y alemanas, y con el visto bueno de varias Administraciones públicas europeas.
Sin embargo a finales de 2006, el proyectó fracasó debido a los diferentes enfoques que tanto franceses como alemanes tenían de Quaero. Los primeros perseguían centrarse más en la gestión de recursos multimedia, y los segundos más en impulsar tecnologías innovadoras relacionadas con las búsquedas, creando su propio proyecto llamado ‘Theseus‘ (en honor a un personaje de la mitología griega).
Así, y aunque se prevén 1.200 millones de euros de inversión en Theseus, hace unos días (informa la ‘Deutsche Welle’) la Unión Europa ha aprobado una partida de 120 millones de euros para desarrollar sus tecnologías. Además, en el sitio web del proyecto se informa que recibirán fondos extra del Ministerio Alemán de Ciencia y Tecnología y de empresas del sector.
Algunas de las firmas y organismos que forman parte de Theseus son: Siemens, SAP, Lycos Europe, Bertelsmann, la Biblioteca Nacional Alemana o la Ludwig-Maximilian-Universität. Según sus propios objetivos, para el año 2008 ya estarán disponibles (aunque no de manera pública) los primeros demostradores de su tecnología, la cual será el germen de lo que se demomina la «Web 3.0» (Web 3.0 = Web 2.0 + semántica). «Conectando la Web 2.0 de hoy (con su filosofía de red social abierta e interactiva) con métodos semánticos convertiremos la WWW en la Internet de la próxima generación», se asegura. «El enfoque de Theseus es en las tecnologías semánticas, las cuales no designan los contenidos (palabras, imágenes y sonidos) con métodos convencionales (combinaciones de letras), sino que reconocen y sitúan el significado de estos contenidos en su contexto adecuado».
Fuente: Dirson
Más significativa es aún la segunda noticia: según la consultora Hitwise, en Estados Unidos Google acapara casi dos tercios de todas las búsquedas que se realizan. Y eso que el mercado norteamericano de los buscadores, a diferencia del europeo, en el que Google siempre ha mantenido una cómoda ventaja sobre sus competidores, tradicionalmente ha sido más equilibrado, con Google en cabeza pero sin tanta ventaja sobre Yahoo, MSN y Ask,com como en el caso de Europa. En esta coyuntura, parece claro que conseguir una posición destacada en Google debe ser un objetivo prioritario para cualquier empresa con presencia en la Red.
Seomoz.org, una empresa de Seattle especializada en el posicionamiento en buscadores, ha presentado un estudio en el que 37 expertos analizan los principales elementos (aunque hay más de 200) que hay que tener en cuenta si queremos que nuestra empresa aparezca entre los primeros enlaces de una búsqueda, única forma de conseguir tráfico, ya que los usuarios no pasan de los primeros resultados. Obviamente, se trata de consejos relacionados con la programación y el diseño de una web, dejando al margen la opción de la compra de palabras clave.
Este es un resumen de los principales factores a tener en cuenta para llamar la atención del algoritmo de Google, y la importancia (media sobre un máximo de 5) de cada factor.
Elementos relacionados con las palabras clave
Atributos de la página
Atributos de la web / dominio
Elementos negativos
Durante la última década, uno de los proyectos más ambiciosos que estamos esperando es un buscador de información que nos permita localizar datos escribiendo preguntas tal y como las formulamos normalmente. En estos momentos, debemos escribir «año nacimiento picasso» en Google, pero ¿por qué no escribir «¿cuándo nació Picasso?». La razón es que todos los buscadores devuelven la información de páginas web cuyos contenidos coinciden exactamente con las palabras escritas por los usuarios, y éstos se están acostumbrando a escribir las consultas de esta manera (e incluso también los generadores de contenidos).
Por ello, han ido naciendo durante los últimos años diversos proyectos en este sentido, los llamados buscadores «de lenguaje natural», que pretenden «comprender» de manera inteligente las cuestiones escritas por los usuarios y devolverle la información más certera. Así, los diferentes servicios que han ido naciendo han ido consiguiendo hacer bastante ruido durante algunos meses, incluso consiguiendo varios millones de dólares de inversión, pero ninguno de ellos ha podido ofrecer la tecnología prometida. Incluso el propio IBM disponde de una tecnología que aún está bastante verde.
Hace unas semanas, Danny Sullivan escribía este post hace unos meses sobre los proyectos más sonados de la historia, y recientemente hemos podido conocer algunos otros que pretenden volver a ser noticia, como por ejemplo Hakia y Chacha. Y esta última semana, el prestigioso diario ‘New York Times’ publicaba un artículo en el que se hacía eco de estos dos proyectos y de otro más: Powerset, un buscador que aún no ofrece de manera pública ningún servicio, pero que ha conseguido más de 12 millones de dólares de manos de firmas de capital-riesgo.
Según afirma el artículo del ‘New York Times’, este tipo de proyectos han recibido, desde 2004, unos 350 millones de dólares de inversión por parte de ‘ángeles inversores’ que pretenden obtener importantes beneficios con un servicio que pueda hacer sombra a Google, mediante los multimillonarios ingresos de la publicidad en los buscadores. Además de los 12 millones de Powerset, Chacha.com recibió 6 y Hakia.com 16.
Lo que tampoco hay que olvidar es que Google también quiere construir una herramienta que procese toda la información (tanto de la WWW como la contenida en vídeos, libros, etc.) en cualquier idioma, la interprete y la «comprenda», y sea capaz de devolver información precisa a los usuarios que le planteen preguntas. Por ello, desde hace muchos años dispone en su plantilla a muchos de los mejores expertos en Inteligencia Artificial y Procesamiento del Lenguaje Natural (Peter Norvig, Vibhu Mittal), y hace unos meses os hablábamos de una de las implementaciones de las tecnologías desarrolladas, dentro del traductor de textos de Google.
Fuente: http://google.dirson.com
Este post lo saqué directamente del blog de mi estimado profesor Enrique Dans, gran profesor del IE con una gran sentido del humor y buena afición por el rock and roll.
Lo plagio entero. Es muy interesante. Habla de cómo la gente por ejemplo de MSN, utiliza a Google como su buscador principal, lo mismo Yahoo. Y como dice él, en casa del herrero azadón de palo. Es increible, la gente de Microsoft y Yahoo coincide en pensar que Google es un mejor buscador. Gran encuesta. Saludos a Dans.
Cito:
«Qué motor de búsqueda se usa en los sitios donde se desarrollan motores de búsqueda? Esa misma pregunta se la hicieron en una empresa de análisis de tráfico, y decidieron estudiar las métricas en los servidores (vía Slashdot, The Enquirer). Los resultados no dejan de ser curiosos: en Google, prácticamente todo el mundo parece utilizar Google para sus búsquedas en la red. Sin embargo, en Yahoo!, la cantidad de trabajadores que utilizan Yahoo! para sus búsquedas se reduce al 64%. Y en Microsoft, es aún peor: únicamente una minoría de empleados, el 19.6%, utilizan MSN para sus búsquedas. El reto utilizan Google (en un 66.3% de los casos) o Yahoo! (en un 10.2%). Como testimonio del predicamente y la confianza que una empresa tiene en su propio producto, la verdad es que no está nada mal. Si logras convencer al mundo para que use un programa que ni tus propios trabajadores quieren utilizar, o eres un auténtico genio del marketing, o tienes alguna palanca que hace que, de una manera práctica, se les obligue a hacerlo. Si no, dificil »
Fuente: El Blog de Enrique Dans