PEDRO LARRAÑAGA / CONCHA BIELZA
La mayoría de las notas, artículos, comentarios y actividades académicas ofrecidas durante este año 2012, centenario de su nacimiento, tratan de mostrar el trabajo pionero desarrollado por Alan M. Turing, circunscribiéndose a la máquina de Turing, y a su relación con el problema de decisión propuesto por David Hilbert (“Enstcheidungsproblem”). Esta nota, sin embargo, expone una faceta menos conocida de su trabajo, como es su aportación a la estadística Bayesiana.
La estadística Bayesiana, al contrario que la
estadística frecuentista que se fundamenta en la idea de cuantificar la
probabilidad de un suceso a partir de la frecuencia relativa de aparición,
parte de la noción de que la probabilidad representa el grado de creencia que
otorgamos al suceso en cuestión. La aproximación Bayesiana, cuyo nombre
proviene del teorema de Bayes, explica la manera en que cada persona revisa su
creencia en el suceso una vez que recibe nueva información. Es decir, a medida
que recabamos nueva evidencia, decidimos si dicha nueva información apoya la
hipótesis de partida, o si por el contrario, la nueva evidencia favorece una
nueva hipótesis alternativa. Según este esquema de actualización secuencial de
las hipótesis, no sólo cuentan las evidencias recibidas a favor de una
hipótesis, sino también la perspectiva personal que otorgue el observador a la
experiencia previa. En la época de Turing esto se consideraba demasiado
subjetivo y poco científico, si bien la verdadera razón era que los gobiernos
británico y americano lo utilizaban para resolver problemas de alto secreto. Afortunadamente los excelentes resultados que ha proporcionando esta
aproximación Bayesiana en innumerables problemas del mundo real (S. B. McGrayne,
2011)
han servido para constatar su supremacía sobre la aproximación
frecuentista. Un ejemplo reciente se ha producido en las elecciones
presidenciales norteamericanas (L. Garicano, 2012), donde Nate Silver ha sido
capaz de predecir correctamente el partido ganador en cada uno de los 50
estados, lo cual ha motivado que en algunos foros de Internet se haya
considerado al reverendo Bayes, en lugar de a Obama, como el verdadero ganador
de dichas elecciones.
Las aportaciones de Turing a la estadística Bayesiana se desarrollaron en relación con el algoritmo “bamburismus” que sirvió para desencriptar los mensajes enviados por la armada naval germana, durante la Segunda Guerra Mundial, usando la máquina Enigma. Dichos mensajes eran de capital importancia para la población británica cuyo abastecimiento dependía de manera crítica de la supervivencia de los convoyes marítimos aliados.
El famoso estadístico Bayesiano, Irwing J. Good, quien a principios de los años 40 del siglo pasado trabajaba como ayudante de Turing en Bletchley Park, explica en un artículo publicado en Biometrika (I. J. Good, 1979) las aportaciones metodológicas de Turing a la teoría Bayesiana, tanto al denominado peso de la evidencia como a la introducción de un test de hipótesis basado en la razón de verosimilitudes con el que confrontar hipótesis nulas y alternativas. Gracias a recientes desclasificaciones de documentos relacionados con el “bamburismus” por parte del gobierno americano, conocemos que dicho algoritmo se fundamenta en el test de hipótesis diseñado por Turing.
L
a máquina Enigma constaba de un teclado, un
panel donde las letras se iluminaban y varios rotores. Para cifrar un mensaje
se comenzaba colocando los rotores en una determinada posición (lo que se
denominaba configuración inicial) y se escribía el mensaje, obteniendo el
mensaje cifrado en el panel. Para desencriptar un mensaje cifrado, el proceso
era simétrico. Simplemente había que colocar los rotores en la configuración
inicial y teclear el mensaje cifrado, que iba apareciendo decodificado en el
panel. Las configuraciones iniciales se distribuían a los usuarios de las
máquinas, mensualmente al principio y con mayor frecuencia según avanzaba la
guerra.
El mecanismo de cifrado de la máquina Enigma se basaba en los rotores, los cuales permitían cambiar la letra del alfabeto en la que comenzaba la asignación de la letra A. Así por ejemplo, si la letra A se transformaba en una F, entonces la letra B se transformaba en una G, y así sucesivamente. Cualquier letra del alfabeto podía tomarse como inicio en cualquiera de las ruedas, lo que da una idea de la explosión combinatoria a que da origen el cómputo de todas las combinaciones posibles de encriptación.
A medida que se recibían mensajes codificados, la creencia sobre la configuración hipotética de la máquina iba actualizándose de acuerdo con el esquema de razonamiento Bayesiano. Cuando el peso de la evidencia a favor de una configuración determinada de la máquina Enigma era lo suficientemente alto, es decir estadísticamente significativo atendiendo al test de la razón de verosimilitudes, dicha configuración se consideraba como probable. Se probaban de forma exhaustiva todas las configuraciones probables con los mensajes recibidos. Como resultado de estas pruebas, se consiguió “romper” el código y descifrarlo.
La ocurrencia de expresiones habituales en los mensajes como “Heil Hitler”, o incluso los partes meteorológicos diarios, era información que se incorporaba al proceso. El éxito más importante de esta metodología se produjo en 1944, al interceptar un mensaje enviado por Hitler a Rommel cuya descodificación acabó permitiendo el desembarco de Normandia. Se calcula que este logro científico acortó la segunda guerra mundial en dos años.
En resumen, Alan Turing además de por sus logros académicos en teoría de la computación, puede ser también considerado como artífice del renacimiento Bayesiano moderno.
Referencias
Luis Garicano (2012). Son las Matemáticas, estúpido. El País, 13 Noviembre 2012.
Irwing J. Good (1979). Studies in the history of Probability and Statistics. XXXVII A. M. Turing’s statistical work in the World War II. Biometrika, 66, 2, 393-396.
Sharon B. McGrayne (2011) The theory that would not die. How Bayes'rule cracked the enigma code, hunted down russian submarines, and emerged triumphant from two centuries of controversy. Yale University Press.
----------
Pedro Larrañaga es catedrático de la Universidad Politécnica de Madrid.
Concha Bielza es catedrática de la Universidad Politécnica de Madrid.
Hay 3 Comentarios
Como siempre, muy interesante.
Publicado por: Sergio | 06/01/2013 22:22:50
No conocía este blog pero me ha parecido muy interesante. Enhorabuena!!
Les invito a conocer mis planes para la nueva clase política, en clave de humor, si mañana se acabase el mundo http://diariodeunacleptomana.blogspot.com.es/2012/12/fin-del-mundo-los-que-sobreviviremos.html
Publicado por: Diario de una cleptomana | 20/12/2012 8:38:51
Otra muy buena lectura sería Thinking, Fast and Slow, de Daniel Cahneman. Probabilidad condicional desde la vertiente psicológica del proceso de decisión.
Publicado por: cuchillero | 20/12/2012 8:30:20