El día de hoy veremos cómo han sido los números del Kino durante los últimos 15 años. ¿Qué números han salidos más o menos de lo esperado? ¿Si analizamos los resultados del Kino, estos parecen ser aleatorios?
Desviación de ocurrencias esperadas
Primero, vemos que tanto se desvía cada número de la cantidad de veces esperadas que debiese haber salido. Tomamos los resultados desde el 2006 hasta marzo de este año. En teoría cada número debiese haber salido 909,44 veces en esos 15 años. Esto es imposible, pero si debiesen estar cerca de este número.
Vemos que hay varios números que se alejan bastante, particularmente el 10 que ha salido casi en 50 ocasiones más de las que se esperaría. También el 4 y el 5 han aparecido bastante más de lo esperado. En el otro extremo se encuentran los números 16-19. Estos han aparecido alrededor de 20 ocasiones menos de lo que se esperaría.
Desviación de ocurrencias porcentual
Es importante notar que en términos porcentuales esto resulta ser bastante poco. Para calcular el porcentaje de desviación hay que dividir por 909,44 y multiplicar por 100. Esto es similar a dividir todos los valores por 10. De ahí concluimos que el 10 es el único que se aleja un poco más de un 5%. De hecho, todos los números excepto el 4, 5 10, 17, 18 y 19 se alejan menos de un 2% del valor esperado. Solo el 10 se aleja mas de un 5% y solo el 5 se aleja poco más que un 3%.
Número total de ocurrencias
Viendo el número total de ocurrencias , se aprecia que todos los números se encuentran muy cerca del valor esperado. Forman casi una línea plana, parecida a la distribución estadística uniforme que los números debiesen tener teóricamente. Como se mencionó, es imposible que un número salga exactamente la cantidad de veces esperada. Eso si, no debiese alejarse demasiado. Esto es exactamente lo que se aprecia aquí.
Análisis de la suma de los números
Otro análisis interesante que se puede hacer es sumar los 14 números que han salido en cada ocasión y ver como distribuyen estas sumas. Debido a algo llamado el teorema central del límite (Teorema del límite central – Wikipedia, la enciclopedia libre) a medida que aumenta el tamaño de la muestra , la distribución de estas sumas debiese ser cada vez más parecida a una curva normal, también conocida como campana de Gauss. Viendo el histograma de los valores reales vs un histograma de valores generados teóricos de una normal, vemos que efectivamente calzan muy bien. Esto era de esperarse si es que los números son verdaderamente aleatorios.
Eso si, a pesar de que el histograma se ve parecido a una normal, hay ciertos puntos donde se aleja por lo que podría generar dudas. Es por esto que para inspeccionar con más detalles si es que se comporta como una distribución normal, se puede generar lo que se llama un QQ-plot. Este es un diagrama donde se gráfica los cuantiles teóricos de una distribución contra lo cuantiles reales de una muestra. Mientras más se asemejan los cuantiles reales y teóricos, más se debiese ver el diagrama como una línea en 45°
Inspeccionando el gráfico, se aprecia de que a pesar de que un par de puntos se sale un poco de la recta, la mayoria, calza sobre ella de forma casi perfecta. Basado en esto, el histograma y las ocurrencias de cada número, es fácil ver que los números del Kino son verdaderamente aleatorios .