EL PAÍS que hacemos

Así es el árbol del conocimiento de EL PAÍS

Por: | 24 de enero de 2017

Si pudieras verlo desde el cielo, se parecería a un árbol. O a un inmenso río. Pero en lugar de circular agua por su cauce lo que lo alimentan son las palabras. Donald Trump, Ryan Gosling, Brexit, Caso Gürtel... Así hasta alcanzar una lista entrelazada de 130.000 conceptos que te permiten a ti, lector, rastrear las noticias relacionadas a estas palabras. Es el colabulario, el sistema de etiquetado de los 15 medios del Grupo PRISA que tratan de servir de contexto a la actualidad y de memoria colectiva de los términos que nos importan.

"En Cien años de soledad, cuando Gabriel García Márquez cuenta la historia de la peste del insomnio, en Macondo se van olvidando de las cosas y para qué sirven. Así que uno de los personajes toma la decisión de apuntar en unas notas las palabras que definen a un término concreto. Así consiguen no olvidar qué son los objetos. Nuestro trabajo es parecido. Tratamos de darle una palabra a una realidad concreta para que entre dentro de la conversación". Así define Felipe Díez Núñez (Ávila, 1976), responsable del colabulario, el trabajo que él y el equipo de documentalistas de EL PAÍS hacen con esta herramienta.

Las etiquetas de EL PAÍS no son las mismas que podemos ver en un blog o las redes sociales. Estas segundas pertenecen a un lenguaje de taxonomía, de ordenación de los conceptos, conocido como folcsonomía. Este lenguaje permite que cada usuario de Internet cree sus propias etiquetas. "Imagina qué pasaría si ese fuera nuestro sistema de ordenación. Con cientos de periodistas de 15 medios distintos tendríamos un grave problema. Homonimias, polisemia, etcétera. En EL PAÍS, cada término del colabulario es elegido por nuestro equipo bajo criterios documentalistas, no de SEO [las estrategias de posicionamiento que sirven para aparecer en lo alto de una búsqueda en Google o similares]. Es decir, elegimos las palabras más atemporales para servir de memoria", explica Díez, coordinador del equipo que tutela y alimenta esta herramienta y que además vigila la calidad del etiquetado de las noticias. El colabulario establece también una jerarquización de sus términos, lo que permite englobar grandes temas con una palabra que se puede luego ramificar en los detalles.

En el futuro, el colabulario será una de las herramientas clave en la riqueza informativa del Grupo PRISA, que vive la transformación digital de su principal cabecera, EL PAÍS. "Estamos dirigiendo el colabulario hacia la ontología. Esta herramienta necesita de una semántica interna para que las máquinas [los robots de los buscadores que detectan el contenido] las reconozcan y sepan interpretarlas. El futuro será la web semántica, algo que, en España, no tiene ningún medio de comunicación", apunta Díez. Esto permitirá que los robots buscadores puedan reconocer no solo una etiqueta en concreto, sino todos los términos relacionados con ella en ese gigantesco árbol, o río, del que hablábamos en un principio. "Esta investigación no piensa ya en cómo usamos Internet hoy. Se anticipa a cómo la usaremos en el futuro".

Díez, para rematar de definir qué es el colabulario y por qué es pieza esencial de tu periódico, vuelve a Macondo: "Hay un momento en el que a los personajes, de tanto escribir las etiquetas, se les olvida qué quieren decir. Entonces, vuelven a dar una vuelta de tuerca y a esas etiquetas les añaden una información que dice para qué sirve esa palabra. ¿Mesa? Sirve para comer encima de ello. Esto es lo que estamos haciendo con la ontología. El colabulario es la mesa. Y la ontología, su descripción. En fin, hablando en mayúsculas, es una lucha contra la desmemoria".

Hay 8 Comentarios

Muy buen artículo. Gracias. Un saludo.

muy bueno les sugiero ampliar sobre el tema del arbol

Os recomiendo la lectura del árbol de la vida os dará otra visión de nuestro paso por este mundo.

Lo primero, lo concreto y análisis concreto; lo segundo, síntesis de lo concreto. Análisis concreto de la situación concreta. En cambio, el razonador de este "árbol del conocimiento de EL PAÍS" ha comenzado por la idea genérica. Busca en Lógica el "Arbol de Porfirio", sigue con la Crítica de los Prolegómenos de Kant, estudia Algebra Boleana, Lógica Formal y Simbólica, Diagrama de Flujos, etc.

Muy muy confuso el colabulario, tal como lo contáis.

Por otro lado es de que no he criterios Seo... para el tag no pero esos artículos de "5 trucos que no sabias..." o "10 cosas que puedes hacer con WhatsApp. .." dejan muy claro quien manda

#1 como q buen trabajo? Si no se ve nada de lo que dice, ni foto, ni ejemplo. Os ponéis comentarios falsos?

¡¡Un buen trabajo!!, me parece un buen clasificador para encontrar noticias, gracias.

Publicar un comentario

Si tienes una cuenta en TypePad o TypeKey, por favor Inicia sesión.

Sobre EL PAÍS

EL PAÍS es el líder de los medios en español y una referencia del periodismo en el ámbito hispanoamericano. Fundado en 1976, el periódico ha evolucionado con los tiempos y hoy ofrece a sus lectores información en todos los formatos posibles: de la web a las aplicaciones, pasando por las redes sociales o los contenidos audiovisuales. Con redacciones en Madrid, Barcelona, Washington, México y Sao Paulo y una extensa red de corresponsales, es un medio global en constante transformación.

El País

EDICIONES EL PAIS, S.L. - Miguel Yuste 40 – 28037 – Madrid [España] | Aviso Legal