Un análisis del sencillo juego de lanzar una moneda permite reflexionar sobre aleatoriedad y diferentes enfoques de la probabilidad: el frecuentista y el bayesiano
Imagina que tomas una moneda y te dispones a lanzarla al aire. ¿Cuál dirías que es la probabilidad de que caiga cara? ¿Importa el lado por el que la lances? La mayoría de las personas diría que la probabilidad de que salga cara es de un 50%, independientemente de la posición inicial de la moneda, pero la cosa no es tan sencilla.
Las dos preguntas anteriores se corresponden con dos eventos diferentes. La primera, trata de la probabilidad de que salga cara –o cruz, sería lo mismo–. Sin embargo, la segunda hace referencia a la probabilidad de que salga cara, si la moneda tenía la cara hacia arriba antes de lanzarla. Esta segunda probabilidad, que se llama condicionada, puede ser distinta de la primera.
Sobre esta cuestión, en 2007, los matemáticos Peris Diaconis, Susan Holmes y Richard Montgomery plantearon un modelo físico que mostraba un ligero sesgo a favor de que la moneda aterrizase tal y como se lanzó. Como conclusión indicaban que, al tirar una moneda al aire, esta caerá del mismo lado del que se lanzó en un 51% de las ocasiones.
Sin embargo, si no se sabe cómo está colocada la moneda, la probabilidad de que salga cara –o cruz– es del 50 %. Pero, ¿cómo es posible afirmar que la probabilidad es esa, con total seguridad? Se trata de un problema de estimación, es decir, de partida desconocemos la probabilidad de obtener cara y se quiere estimar correctamente su valor a partir de la evidencia.
El enfoque más conocido para hacerlo parte de la interpretación de la probabilidad como frecuencia, dando lugar a lo que se conoce como estadística frecuentista. Más concretamente, bajo este enfoque, la probabilidad que queremos estimar se interpreta como la proporción de caras que se observarán al lanzar la moneda infinitas veces bajo las mismas condiciones. Así pues, para aproximarla, bastará con lanzar la moneda un número alto de veces, bajo las mismas condiciones, y aproximar la verdadera probabilidad por la proporción de caras observadas.
El enfoque frecuentista fue el utilizado por grandes personalidades de la historia de la probabilidad y la estadística como el conde de Buffon o Karl Pearson. El primero, lanzó 4040 veces una moneda obteniendo 2048 caras, lo que supone una estimación de la probabilidad en 4040/2048 = 0,5069, es decir un 50,69%; el segundo realizó 24000 lanzamientos de los cuales 12012 cayeron mostrando su cara un 50,005% de las ocasiones.
Sin embargo, el planteamiento de partida de este enfoque crea una cierta paradoja: al tirar una moneda exactamente con las mismas condiciones, ¿no sería esperable obtener el mismo resultado? La física de Newton afirmaría que sí y, de hecho, son las pequeñas variaciones iniciales las que inducen la aleatoriedad en los resultados, por lo que resulta paradójico pensar en esa premisa de la repetición. Este punto de partida es aún más escurridizo al estudiar la probabilidad de tener una enfermedad… en ese caso ¿qué se debería repetir? ¿La vida de la persona? Además, ¿cuántos lanzamientos serán necesarios para estar suficientemente cerca del verdadero valor? Así pues, pese a que el enfoque frecuentista es un enfoque válido y muy bien estudiado, en ocasiones, conduce a ciertos razonamientos difíciles de interpretar que incluso lo han llevado a ser cuestionado en algunas revistas científicas.
Para superar estas limitaciones, es posible emplear otro enfoque estadístico: el conocido como bayesiano. Bajo este paradigma, la probabilidad es el grado de incertidumbre que tenemos sobre un proceso y las observaciones realizadas contribuyen a mejorar esa incertidumbre. Se trata de una representación matemática del proceso de aprendizaje.
Volviendo al ejemplo de la moneda, se busca estimar el valor de la probabilidad de que salga cara. Para ello, el primer paso es determinar posibles valores a priori para esta probabilidad. En el caso de no tener ningún conocimiento previo, se puede establecer que la probabilidad podría valer cualquier cosa entre el 0 y el 100%. Después, se realizan muchos lanzamientos de moneda que irán reduciendo la incertidumbre, acotando que posibles valores son creíbles para la probabilidad de cara.
Este es el enfoque empleado en un reciente estudio llevado a cabo por más de 50 investigadoras e investigadores de los Países Bajos. El estudio se aleja de la idea de repetir y de su complicación en la interpretación: realizaron 350 757 lanzamientos de diferentes tipos de monedas para obtener un rango de valores a posteriori para la probabilidad de cara que está entre un 49,9% y un 50,3%. Así, este resultado viene a reforzar la ya conocida y testeada idea del 50-50 y por tanto, nos permite confiar en la moneda para desempatar.
En el mismo estudio también pudieron respaldar el modelo de Diaconis, Holmes y Montgomery: establecieron un rango para la probabilidad de que la moneda caiga en su posición original de entre un 50,3% y 50,9%, es decir, si bien no es un 51% exactamente, sí apunta a la existencia de un cierto sesgo.
Más allá de este ejemplo, la estadística bayesiana ha desempeñado un papel fundamental en eventos históricos como el descifrado de la máquina Enigma a manos de Alan Turing. Actualmente se emplea allá donde se estudien procesos complejos como la distribución de especies, los modelos climatológicos, o la relación espacial subyacente a la salud o a otros fenómenos. Además, es una de las técnicas presentes dentro de lo que se conoce como machine learning o aprendizaje automático.
Anabel Forte es profesora titular de la Universidad de Valencia
Fuente: elpais.com