Si hay programas que combaten los virus informáticos o el correo basura, ¿por qué no hacer un filtro que bloquee los comentarios estúpidos, irrelevantes e impertinentes que se hacen en blog, foros y noticias? Esa es la pregunta que se hicieron los dos jóvenes de Albuquerque (EEUU) que han creado crear Stupid Filter.
Gabriel Ortiz y Paul Starr se han propuesto diseñar un sistema que filtre los mensajes que llegan a las páginas web y que, antes que facilitar la comunicación, sólo crean ruido. Para ello, se han fijado en la forma de trabajar de los programas anti spam que usan los proveedores de acceso o se instalan en los servidores de correo electrónico.
Para detectar el correo basura, recurren a elementos de la teoría de probabilidad (como el teorema de Bayes ). Su objetivo es detectar palabras o signos que se repiten en los diferentes correos y establecer un patrón para diferenciar un mensaje pertinente del que no lo es.
Cuidado de las formas
La versión en pruebas de Stupid Filter analiza la forma, no el contenido del comentario, y la compara con una base de datos antes de calificarlo de estúpido. Ortiz y Starr, con la ayuda de centenares de voluntarios que se han apuntado al proyecto, han recopilado mensajes de foros, blogs y sitios populares como Youtube, donde los usuarios dejan comentarios. Han creado así un archivo de la estupidez en la Red.
Ellos mismos explican en la web del proyecto como funciona: «Igual que se programa cómo reconocer el spam, nosotros miramos lo que caracteriza a la estupidez y asignamos un valor diferente basado en las veces que se repite en los ejemplos de comentarios idiotas que seleccionamos».
El derroche de faltas de ortografía, el abuso de las mayúsculas, la abundancia de signos de exclamación o las recurrentes onomatopeyas del tipo de ‘JAJAJAJA’ (el acrónimo LOL, en inglés) hacen que el comentario tenga todas las papeletas para ser catalogado como estúpido, y bloqueado.
Versión en español
Ortiz explica porqué es necesario Stupid Filter. «La avalancha de contenido y usuarios ha hecho que la relación entre señal y ruido en Internet haya bajado, y la moderación humana es imposible, dada la escala del problema». Insiste en recordar que lo suyo es el rigor formal del mensaje, no en su contenido. «Para eso necesitaríamos sistemas de inteligencia artificial», que no existen.
En una entrevista anterior concedida a un medio estadounidense, Starr (el otro creador del programa) explica que la forma «está íntimamente ligada al contenido; el cómo te expresas afecta a las conclusiones de lo que expresas».
¿Habrá versión en español? A Ortiz le gustaría. «Pero dependerá de la demanda, si hay suficientes interesados, lo haremos».
Fuente: Público.es
Bajo licencia Creative Commons