Una guía de recursos sobre
estadística y visualización
para redactores, editores y diseñadores
Michael Jordan y
el periodismo de datos
Hace unos años, cuando daba clases de Periodismo infográfico en la Universidad de Carolina del Norte en Chapel Hill, un colega me hizo ver lo fácil que es caer en el disparate si uno no cuenta con unas mínimas nociones de estadística. No fue Philip Meyer, teórico del periodismo de precisión —tuvimos poco contacto: él estaba a un paso de la jubilación— sino uno de esos jóvenes profesores, comunes en las facultades estadounidenses, que llegan a la enseñanza con una carrera triunfal a las espaldas.
La revelación fue fruto de un chiste muy popular en la facultad de Geografía: sus profesores afirmaban que sus estudiantes estaban entre los que conseguían mejores salarios (en promedio) cuando se licenciaban. Parecía imposible, pero era cierto. Por lo menos, en parte.
Como los amantes del baloncesto saben, la UNC-Chapel Hill fue donde Michael Jordan comenzó su carrera. Lo que no tantos recuerdan es que Jordan estudió gracias a una beca deportiva y se licenció en Geografía. Para entender el papel del jugador en la historia, imagine que los salarios anuales en dólares de los recién graduados del año en que Jordan acabó sus estudios (1986) fueron:
18.000 • 20.000 • 21.000 • 22.000 • 24.000 • 25.000 • 25.000 • 25.000 • 25.000 • 30.000 • 30.000 • 45.000
• 45.000 • 50.000 • 5.000.000 (este último es el de Michael Jordan; los números son ficticios)
Si uno suma esas cantidades y divide el resultado por el número de valores, obtendrá que el salario medio de un licenciado en Geografía de la UNC era de más de 360.000 dólares. Obviamente, en el caso de que mi universidad revelase esa cifra a los medios de comunicación, cualquier periodista con un poco de ojo analizaría los datos originales y percibiría que lo que debe ser usado como promedio no es la media, sino la mediana, el valor que divide la secuencia de números en dos partes iguales. Dado que tenemos una lista de 15 sueldos, la mediana será el que ocupa el puesto número 8: 25.000$.
¿Cuántas veces los periodistas realizamos ese ejercicio tan simple cuando nos disponemos a escribir sobre un artículo científico o una encuesta de opinión? ¿Cuántas veces prestamos atención a detalles importantes, como las medidas de tendencia central (media, mediana, moda), las de dispersión (rango, varianza, desviación típica), el universo y los métodos usados para elegir muestras, el margen de error, etc.?
En mi experiencia, pocas. En demasiados casos, publicamos noticias basadas en resúmenes de prensa y no en la lectura atenta de los estudios en que se basan, lo que es una fuente constante de barbaridades, divertidas en ocasiones, pero a menudo irritantes. Muchos de estos errores son producto de las prisas, sí, pero también de cierta ignorancia: haga una miniencuesta en su lugar de trabajo sobre la diferencia entre media y mediana. Los resultados le sorprenderán.
Si entendemos el Periodismo como la actividad que consiste en domar la complejidad, en organizarla, sintetizarla, interpretarla y poner su producto a disposición de los ciudadanos para que estos tomen mejores decisiones, la falta de conocimientos de estadística y matemáticas, común entre los profesionales, es peligrosa. ¿Cómo solucionar este problema?
Primer paso: superar el miedo a los números
Uno de los mitos más arraigados en las redacciones es que para ejercer el periodismo de datos o de precisión es necesario convertirse en experto en programación y software de visualización. Olvide esa idea: es posible extraer historias de conjuntos datos utilizando solo lápiz, papel, una hoja de cálculo, algunas nociones sobre cómo trabajar con números y un poco de sentido común.
Un ejemplo: hace unos días, el Ministerio de Educación de Brasil publicó el más reciente estudio anual de calidad de las escuelas de enseñanza secundaria. El documento se basa en los resultados del ENEM, un examen que evalúa el nivel educativo de los estudiantes.
El principal desafío de la educación brasileña —además del alto grado de analfabetismo, que no cede— es que existe una desigualdad enorme entre las instituciones públicas y las privadas. Esta desigualdad es, a la vez, causa y consecuencia de las grandes diferencias económicas que el país sufre.
Contamos con una hipótesis: el abismo entre las escuelas. ¿Cómo demostrarla? El diario Estado de São Paulo lo hizo a través de un gráfico de dispersión en el que cada círculo representa un colegio. Los rojos son privados; los grises, públicos. La posición en el eje vertical de cada punto corresponde a la nota media en redacción; la posición en el eje horizontal es proporcional a la puntuación general en el ENEM. Las concentraciones de puntos grises y rojos son claras (véalo online):
Este gráfico es un ejemplo de lo que suelo llamar visualización de baja tecnología, algo que está al alcance de cualquiera por basarse en números públicos y en el uso de programas muy conocidos (Excel) o gratuitos (Many Eyes, Google Charts, Tableau Public). Así pues, los periodistas no estamos limitados por la escasez de datos o la inexistencia de herramientas sencillas. El obstáculo inicial para adentrarse en el periodismo de precisión es la carencia de una base teórica sólida. Estas son mis recomendaciones para obtenerla:
Libros
Si obviamos el famoso Precision Journalism, el mejor libro de introducción a la estadística que conozco es Statistics Explained, de Perry R. Hinton, profesor de Psicología. Ya en el primer capítulo, un excelente resumen de estadística descriptiva, se adquieren conocimientos suficientes para evitar los errores más comunes en coberturas basadas en números. Capítulos posteriores se ocupan de la otra mitad de la disciplina, la inferencial, más compleja, pero también más relevante.
Statistics Explained incluye abundantes ejemplos y evita en lo posible la jerga especializada (cuando la utiliza, el autor explica cada término con detalle), lo que lo convierte en un buen manual para alérgicos a las matemáticas, tan comunes en los medios. Parte del libro está disponible en Google Books.
Puede parecer una paradoja pero, en ocasiones, los libros en los que más se aprende sobre la relación entre números y periodismo no son los que tratan de estadística exclusivamente. Es el caso de Thematic Cartography and Geographic Visualization, de Terry A. Slocum (Universidad de Kansas). Además de ser una introducción profunda y exhaustiva al uso mapas temáticos y cuantitativos, el libro explica varias técnicas de gran utilidad para extraer significado de conjuntos de datos.
En cuanto a cómo representar números por medio de gráficos, lo mejor es acudir a los clásicos. En primer lugar, The Visual Display of Quantitative Information, de Edward Tufte, un viejo conocido de estas páginas. En segundo, los libros de Stephen Few, entrevistado hace pocas semanas, porque sirven como puente entre las abstracciones de Tufte y la realidad en las redacciones.
Un grupo de libros que conviene tener en cuenta es el de aquellos que no cubren principios básicos de la estadística, sino que exponen los deslices al aplicarla. Entre ellos están el célebre How to Lie With Statistics —que se ha quedado un poco viejo— y otros más recientes, como Damned Lies and Statistics, More Damned Lies and Statistics y Stat-Spotting, de Joel Best. Se trata de tres pequeños volúmenes divididos en capítulos cortos, cada uno sobre un problema estadístico común en la prensa.
También es muy recomendable Numbers Rule Your World, de Kaiser Fund, autor del blog Junk Charts. Por último, no se pierdan tanto Fooled by Randomness como The Black Swan, de Nassim Nicholas Taleb. No son libros sobre estadística, pero ayudan a entender que el cerebro humano no está preparado para calcular probabilidades y hacer predicciones basadas en datos.
Ver otros libros sobre gráficos, mapas y diagramas
Recursos en la Red
La cantidad de recursos gratuitos disponibles a un clic de distancia se ha multiplicado en los últimos años. El MIT (Massachusetts Institute of Technology) ofrece los materiales de gran parte de sus cursos en esta página Web. En el buscador, escriba "introduction to statistics" y encontrará muchos documentos interesantes. La Universidad de Stanford también da libre acceso a las lecturas recomendadas de su curso Visualización de Datos.
Entre los blogs, estos son algunos de los que frecuento cada semana. Primero, los que hablan de estadística y tratamiento de datos:
• Los ya citados Numbers Rule Your World (el blog del libro de Kaiser Fund) y Malaprensa, el mejor de entre los españoles.
• Bad Science, de Ben Goldacre, autor de un libro con el mismo título.
• Stats With Cats; comience por el artículo sobre la importancia de la estadística.
• Correlation is (newsworthy, so why) not causation(?)
• The Stats Blog
• The Numbers Guy, el blog de Carl Bialik en The Wall Street Journal.
Segundo, los que mezclan artículos sobre números con otros sobre visualización:
• Excel Charts
• Fell in Love With Data
• Data Journalism Blog
• Visualising Data
Les deseo una buena lectura.
Alberto Cairo (Twitter: @albertocairo) es director de infografía de la revista Época (Editora Globo, Brasil) y autor de los libros El arte funcional: infografía y visualización de información e Infografía 2.0: visualización interactiva de información en prensa.
Hay 11 Comentarios
Muchas personas piensan que por el hecho de estudiar o ejercer en la carrera de Comunicación, solo nos basamos en periódicos, televisión, radio, etc. realizando notas o reportajes. Como comunicóloga en formación he practicado la materia de estadística y cómo podemos aplicarla en nuestro ámbito profesional. La estadística es sumamente importante ya que la podemos utilizar al momento de realizar una investigación, ver números importantes resultado de algún dato importante, cuando llevamos a cabo encuestas, cuestionarios, elegir la muestra de la población que estudiaremos, vaciar datos, etc., aunado a ello se encuentran las herramientas que podemos utilizar para poder realizar dichas acciones, lo cual hoy en día es muy fácil y rápido de llevarlo a cabo gracias a la tecnología y software que existen. Me pareció muy una muy buena aportación tu artículo y los tips de libros y software que podemos tomar de apoyo para aprender y guiarnos en la realización de una tarea de estadística.
Publicado por: Daniela Gutierrez Solis | 26/02/2013 7:25:12
Muy interesante el artículo, es cierto que el periodismo no está exento de la estadística, y es que se utiliza en nuestra vida diaria, creo que hay que empezar a perderle el miedo a los números, pues ellos están todos los días con nosotros, y mas como periodistas se hace uso de ellos en notas o reportajes en los que es importante saber cómo utilizarlos, por ultimo creo que los métodos que se mencionan aquí para tener la base, que son los libros, internet son muy útiles, ya que hoy en día todo mundo tiene acceso a programas en los que se utiliza la estadística como lo son excel etc.
Publicado por: jorge carlos ibarra | 26/02/2013 6:45:58
Para nosotros los futuros comunicologos, las herramientas y funciones estadisticas son de verdadera importancia y ayuda ya que, frecuentemente los métodos de recolección de datos o muestreos estadísticos, han sido un desafío difícil de superar para quienes operan en el campo de la comunicación; conocer el comportamiento del público, tendencias y datos demográficos, asi como tambien otorgar informacion veraz y confiable. Con el advenimiento de las nuevas tecnologías, esto ha cambiado. Hoy es posible medir cada acción que se realiza fácilmente y obtener información fidedigna con diversas herramientas de uso público en la web, como lo son los libros y autores ya mencionados que seran de gran utilidad para facilitar el trabajo pudiendo tenerlos a nuestra facil disposicion y alcance.
Publicado por: Adriana Gabriela Carter García | 26/02/2013 6:38:25
ostras, pues es muy interesante, gracias! :)
Publicado por: carolina | 02/11/2012 19:40:37
Ops: "con los números y las palabras", me ha pasado la "y" , jejeje...
Publicado por: Account Deleted | 20/09/2011 17:08:36
Hola Alberto, muy bueno ese tu artículo sobre estadística! Como la mayoría de la gente, yo también tuve un día fobia a ese tema y solo después pude entender mejor su real importancia, no apenas para el campo científico, como todos las demás, hehehe... Otra confusión que suele pasar, al menos en el medio científico, es sobre los cálculos del ERROR y el DESVIO Standard. Dependiendo del número de muestras (n) que se tenga, la diferencia es casi siempre muy grande entre los dos resultados, principalmente cuando se pone en las gráficas. Interesante que en el programa Excel no existe la fórmula del ERROR Standard, lo que probablemente lleva mucha gente a cometer ese pequeño error. E por hablar en errores, otra cosa que también he experimentado y creo que sea fundamental, es poder contar siempre con una persona amiga para revisar todos los dados, igual como para los revisores de textos. Llega un momento en que la fatiga cerebral (con los números e las palabras) supera cualquier entusiasmo! Sí, por supuesto, estoy aguardando que empiece tu próximo curso en el Centro Knight!! Un saludo desde Brasil!
Publicado por: Account Deleted | 20/09/2011 17:04:17
Genial. Muchas gracias por toda esa información!!
Publicado por: Daniel | 20/09/2011 6:58:58
Gracias, JOse y Famelius. Gracias, Mario, por la pista sobre el libro: no sabía que había sido publicado en español. Efectivamente, sigue vigente, aunque haya alternativas más modernas y digeribles, como los escritos por Best
Publicado por: Alberto Cairo | 20/09/2011 1:32:19
Enhorabuena Alberto. Gracias por la guía.
Hay un ejemplo similar al que pones en la "Guía de los números" de The Economist en el que explica muy claro como a la hora de negociar un sueldo la diferencia entre unas medidas y otras es muy importante :-)
El libro de "Como mentir con estadísticas" acaba de publicarse en español y sigue siendo necesario en las redacciones.
Publicado por: Mario Tascón | 20/09/2011 1:04:54
Sumamente interesante. Nos quejamos con razón de las faltas de ortografía y sintaxis que cometemos los periodistas pero nos olvidamos siempre de los números....
Publicado por: Famelius | 19/09/2011 14:44:08
Me parece una entrada muy interesante y de obligada lectura para los que tienen que organizar y sintetizar los contenidos de estudios y análisis para que puedan ser más accesibles y mejor comprendidos por los lectores. ¡Felicidades!
Publicado por: JOse | 19/09/2011 12:51:30