Entre percentiles, cuartiles y cuantiles

Comencemos con una cuestión simple: ¿qué es un percentil? La respuesta es sencilla: una medida no central usada en estadística que indica el valor de la variable por debajo del cual se encuentra un porcentaje dado de observaciones (definición estándar de la wiki).

Pongámonos un poco más exigentes: El percentil muestral de orden $p$ por ciento es aquel valor de dato que tiene la propiedad de que al menos el $p$ por ciento de los valores de datos son menores o iguales que él y que al menos el $(100-p)$ por ciento de los valores de datos son mayores o iguales que él.

origin-of-the-word-quartileEl primero en utilizar el término de percentil fue Francis Galton en 1885 (en [1] o [2]), que supervisó el trabajo de Donald McAlister, en el que aparece por primera vez el término de quartil[3]; o más bien, quartil superior y quartil inferior, en correspondencia con el percentil 75 y el percentil 25, respectivamente.

McAlister trataba de dividir la muestra de datos ordenados en cuatro partes porcentuales iguales (de ahí Quartiles) con la mediana justo en el medio. En un trabajo posterior Galton los mencionaría todos: Percentiles, Deciles y Quartiles.

 Weisstein, Eric W. "Quartile." From MathWorld--A Wolfram Web Resource. http://mathworld.wolfram.com/Quartile.html
Weisstein, Eric W. «Quartile.» From MathWorld–A Wolfram Web Resource. http://mathworld.wolfram.com/Quartile.html

El problema consiste en calcularlos. Sí, el problema. Si, por ejemplo, nos fijamos en la tabla de Weisstein, en MathWorld, vemos diferentes métodos para calcular los cuartiles de $n$ datos. Y, en todo caso, hablamos de observaciones discretas.

En el transcurso de poco más de 50 años los conceptos intuitivos de Percentiles, Deciles y Quartiles, fueron avanzando, como el mismo desarrollo de la teoría de la probabilidad. En particular,  cuando trabajando bajo la concepción esencialmente determinista del mundo en donde la ejecución repetida de un experimento, bajo condiciones presumiblemente coincidentes, siempre producía el mismo resultado, se observó que no era cierto: había variabilidad. Esta variabilidad de los resultados es la que trata de describir la teoría de la probabilidad y las variables aleatorias.

No nos entretengamos para llegar a 1940, cuando Kendall escribe Note on the Distribution of Quantiles for Large Samples [4]. Ahora los cuantiles pasaban a ser puntos tomados a intervalos regulares de la función de distribución de una variable aleatoria. Los cuantiles podemos usarlos por grupos que dividan la distribución en partes iguales; obteniendo sus hijos, los Percentiles, Deciles y Quartiles.

Pero, si un cuantil de orden $p$ de una distribución depende de esta, el cálculo de los cuantiles (digasé  Percentiles, Deciles y Quartiles) dependerá … Sin agobios, siempre tenemos el recurso de lo normal. Todo lo solucionamos con una distribución normal. Así, cómodamente, podremos explicar a nuestros alumnos cómo calcular los percentiles sin tenerles que angustiar con las distribuciones. Vamos que… las gallinas que entran por las que salen.

A fin de cuentas, como nos decía el Nobel Gabriel Lippman, la distribución normal es la ley en la cual todo el mundo cree firmemente, los matemáticos porque creen que es un hecho comprobado experimentalmente y los experimentales, porque creen que se trata de un teorema matemático[5].

Esta entrada participa en la Edición 6.1 del Carnaval de Matemáticas cuyo anfitrión es Tito Eliatron Dixit.

Referencias