Dice Bill Gates que el 5% de los ordenadores se cuelgan dos o más veces al día. Esta cifra podría tener significado, haciendo ciertas suposiciones (algunas más razonables que otras). Estas suposiciones son necesarias porque sólo tenemos ese dato, así que tómense los siguientes resultados como poco mejores que una conjetura.
Bien; en primer lugar, supongamos que ese 5% de ordenadores no son “ordenadores que siempre se cuelgan dos o más veces al día”, sino que se puede interpretar como “la probabilidad de que un ordenador cualquiera se cuelgue dos o más veces al día”. También deberemos suponer (aunque ahora nos vaya a morder la paradoja de Simpson) que sólo hay una “población” de ordenadores; es decir, que no existen grupos de ordenadores especialmente propensos a colgarse, ni grupos de ordenadores que no se cuelgan ni a patadas. Finalmente, supondré que la distribución de “cuelgues por día” se ajusta bien a una distribución de Poisson.
Para los no iniciados: la distribución de Poisson nos da la probabilidad de que algo ocurra en un periodo de tiempo (o en una unidad de superficie, o…). Por ejemplo, podría hacerse una distribución que nos diera la probabilidad de que un ordenador se cuelgue una vez en un día, ajustando el valor de λ. Utilizando un calculador de la distribución de Poisson hecho en Javascript ajusté el valor de λ de forma que la fórmula me indicara que la probabilidad de que un ordenador se cuelgue dos o más veces en un día sea de 5%; este valor es λ = 0.3553.
Bien, y una vez hecho esto, vamos a conjeturar (recuerden que se han hecho ciertas suposiciones que, seguro, no son verdad, pero son todo lo que tenemos). ¿Cuál es la probabilidad de que un ordenador no se cuelgue en un día determinado? Pues P(X=0) = 0.7010; o sea, un 70%. La probabilidad de que se cuelgue exactamente una vez es P(X=1) = 0.2491; o sea, casi un 25%. También tiene una probabilidad del 4.4% de que se cuelgue dos veces, etc. Para calcular más probabilidades puede utilizar el calculador cuyo enlace puse antes, estableciendo u=0.3553 y k al “número de veces”. “Exactly k” es la probabilidad de que se cuelgue exactamente k veces; “cdf” es la probabilidad de que se cuelgue k o menos veces. “Q=1-P” es la probabilidad de que se cuelgue más de k veces.
¿Cuántas veces se cuelga un ordenador en un día, de media? Pues precisamente el valor de λ: 0,3553 veces; o sea, un ordenador se cuelga poco más de una vez cada tres días, de media.
Y ya; no sigo, que luego nos creemos todos estos números y terminamos mal :-)