Páginas

lunes, 28 de diciembre de 2015

Cifras iniciales en los Factoriales

Supongamos que usted calcula factoriales de un muchos números y apunta el primer dígito de cada resultado. Se podría argumentar que no hay ninguna razón evidente para que cualquier dígito sea más común que cualquier otro, así que es de esperar de cada uno de los dígitos del $1$ al $9$ aparecerían cada $\frac19$ de las veces. Suena plausible y hasta lógico, pero es erróneo.
Los dígitos iniciales de los factoriales siguen la ley de BenfordDe hecho, los factoriales siguen esta ley incluso mejor que las mismas constantes físicas. 
Aquí está un gráfico de los dígitos iniciales de los factoriales de $1$ a $500$.
En lo sucesivo se va a explicar por qué la ley de Benford debe aplicarse a los factoriales, haciendo un lado las estadísticas y señalando una característica interesante del código Python se utilizó para generar la tabla de arriba.


¿Por qué se aplica la ley de Benford?


Una forma de justificar la ley de Benford es decir que las constantes físicas se distribuyen de manera uniforme, pero en una escala logarítmica. Lo mismo es cierto para los factoriales, y es fácil ver por qué.
Las principales cifras de los logaritmos dependen en sus logaritmos en base 10. La función gamma se extiende la función factorial y es $\log$-convexa. El logaritmo de la función gamma es bastante plana (ver diagrama) 
-
(Se han mezclado los registros de base $10$ y troncos naturales aquí, pero eso no importa. Todos los logaritmos son los mismos hasta una constante multiplicativa. Así que si una parcela es casi lineal en una escala $\log 10$, es casi lineal en un logaritmo natural escala.)

¿Uniforme en qué escala?


Este ejemplo nos lleva a un principio importante en las estadísticas. Algunos dicen que si usted no tiene una razón para asumir cualquier otra cosa, utilice una distribución uniforme. Por ejemplo, algunos dicen que una prioridad uniforme es la ideal prioridad no  informativa para la estadística bayesiana. Pero usted tiene que preguntarse "¿uniforme sobre qué escala?" Resulta que los dígitos de las constantes físicas y factoriales son de hecho uniformemente distribuidas, pero en una escala logarítmica.