PARADOJA DE SIMPSON

E. H. Simpson (1922-2019)
E. H. Simpson (1922-2019)

La Paradoja de Simpson fue descubierta y nombrada por primera vez entre finales del siglo XIX y comienzos del XX por K. Pearson (1857-1936) y su discípulo, el estadístico G.U. Yule (1871-1951), aunque toma su nombre de E. H. Simpson (1922-2019), que la describió en detalle en 1951 en relación con ciertas pruebas médicas.

Dos variables X e Y, que tengan una correlación nula en dos estudios distintos, pueden tener una correlación alta cuando los datos de las variables X e Y, utilizados en ambos estudios, se consideran de forma conjunta.

Es decir, la paradoja de Simpson es un problema que depende de cómo se estructuren los datos y presentarlos de una forma u otra puede hacernos cometer errores, porque dejamos de tener en cuenta algunos factores decisivos (se ocultan variables), y, por ello, se distorsiona la realidad.

Tradicionalmente el café ha sido considerado perjudicial para la salud. Entre los más cafeteros, se observaba una mayor mortalidad y padecían más enfermedades que entre los que no consumían.  Según estudios recientes de 2017 el café podría ser beneficioso para la salud y prolongar la vida.

Esta contradicción aparente nos proporciona un buen ejemplo para explicar la correlación que nos señalan las encuestas tradicionales: los bebedores de café tienden a vivir menos que los no cafeteros. En estas encuestas se están ocultando muchos hábitos que influyen en la salud como el consumo de tabaco y de alcohol, la dieta, la práctica de ejercicio físico, etc.  y sabemos que muchos cafés van acompañados de un postre azucarado, de una copa, de un cigarro y que muchos grandes cafeteros a la vida sedentaria y, en general, parece que los bebedores de café, sobre todo los que más café consumen tienen mayor tendencia a hábitos poco saludables, que son los que acortan la vida y perjudican la salud con independencia del consumo de café.

Si agrupamos a las personas encuestadas en grupos según estos otros hábitos, de forma que sus integrantes tengan unos hábitos parecidos salvo en el consumo de café, se observaría entre los consumidores de café de cada grupo una menor mortalidad e incidencia de enfermedades. Lo cual sugiere un efecto beneficioso de su consumo. Y pone de manifiesto la paradoja.

El caso de más difusión de la paradoja de Simpson se produjo en 1973 en la Universidad de Berkeley. Una joven estudiante no pudo superar lo que aquí en España sería el equivalente a un examen de ingreso. Los datos aportados por los abogados que la animaron a presentar un recurso a la negativa de acceso parecían demostrar que el porcentaje de hombres admitidos es significativamente mayor el de las mujeres, es decir, el porcentaje de hombres admitidos es mayor que el que correspondería al simple azar.

Problema:

1.- En una Prueba de Acceso la Universidad se presentan 2000 personas (1000 hombres y 1000 mujeres) y consiguen el Acceso 800 hombres y 300 mujeres. Evidentemente, ingresan el 80% de los hombres y el 30 % de las mujeres, lo cual, a primera vista, es una clara discriminación, por razones de sexo, ya que lo esperable sería que superaran la prueba en torno a 500 hombres y 500 mujeres.

2.- Pero si analizamos la letra pequeña y tenemos en cuenta una característica de la Prueba de Acceso que no hemos considerado, podemos leer: el  Acceso se podrá realizar a la Facultad A o B. Y sabemos que a la Facultad A  pueden acceder  300 estudiantes (el 30% de los presentados) y a  la B   800 estudiantes (el 80% de los presentados).

Resulta que al considerar una variable no existe paradoja no discriminación ya que, en cada Facultad se ha respetado la relación de aprobados con independencia del sexo. El resultado paradójico se produce la diferencia del porcentaje de aprobados e cada Facultad y la elección que han realizado los estudiantes.

Add a Comment

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *