The words you are searching are inside this book. To get more targeted content, please make full-text search by clicking here.

Vivimos rodeados de estadísticas. A donde voltees a mirar ahí se encuentran (ver en Cienciorama “Estimaciones útiles: la estadística”). Nos acompañan a todos lados estadísticas que pueden ser confiables o tramposas, importantes o irrelevantes. Sin duda su importancia en la vida cotidiana es enorme pero contrasta con la importancia mínima que se les otorga en la educación básica. Histogramas, gráficos de barras, la media, desviación estándar y otras son herramientas estadísticas que tienen poco espacio en la cultura científica. Incluso en la enseñanza matemática obligatoria en la educación básica ocupan un espacio ínfimo en el aprendizaje.

Discover the best professional documents and content resources in AnyFlip Document Base.
Search
Published by Cienciorama, 2019-09-18 16:17:59

La paradoja de Simpson

Vivimos rodeados de estadísticas. A donde voltees a mirar ahí se encuentran (ver en Cienciorama “Estimaciones útiles: la estadística”). Nos acompañan a todos lados estadísticas que pueden ser confiables o tramposas, importantes o irrelevantes. Sin duda su importancia en la vida cotidiana es enorme pero contrasta con la importancia mínima que se les otorga en la educación básica. Histogramas, gráficos de barras, la media, desviación estándar y otras son herramientas estadísticas que tienen poco espacio en la cultura científica. Incluso en la enseñanza matemática obligatoria en la educación básica ocupan un espacio ínfimo en el aprendizaje.

La paradoja de Simpson

Iván de Jesús Arellano Palma

¿Para qué sirven las estadísticas? Para generar hambres
y vender tapaderas, para dictar la norma e imponer su razón.

José del Río Sánchez, Examen de estadística

Palabras clave: paradoja de Simpson, estadística, probabilidad,
matemáticas, discriminación, racismo, Trump

Resumen
Vivimos rodeados de estadísticas. A donde voltees a mirar ahí se
encuentran (ver en Cienciorama “Estimaciones útiles: la estadística”). Nos
acompañan a todos lados estadísticas que pueden ser confiables o
tramposas, importantes o irrelevantes. Sin duda su importancia en la vida
cotidiana es enorme pero contrasta con la importancia mínima que se les
otorga en la educación básica. Histogramas, gráficos de barras, la media,
desviación estándar y otras son herramientas estadísticas que tienen poco
espacio en la cultura científica. Incluso en la enseñanza matemática
obligatoria en la educación básica ocupan un espacio ínfimo en el
aprendizaje.

La paradoja de Simpson / CIENCIORAMA 1

Por ello las herramientas estadísticas pueden manipularse para “guiar el
ojo de manera conveniente”, mentirnos con la verdad, persuadirnos
gráficamente y empantanarnos en paradojas (figura 1) como la siguiente
plasmada en un famoso aforismo: “El 20% de las personas muere a causa
del tabaco. Por lo tanto, 80% de las personas muere por no fumar. Así
queda demostrado que no fumar es peor que fumar”. El propósito del
presente artículo es dar a conocer el fenómeno llamado paradoja de
Simpson, que consiste en que dos muestras estadísticas muestran una
tendencia que desaparece o se invierte cuando se combinan en una sola.
Veremos las posibles e infames- consecuencias de esta paradoja en las
palabras de Trump y acciones de Crusius, (El Paso, Texas). Como dijo
alguna vez Herbert G. Wells “Será necesario un día pensar de manera
estadística para una ciudadanía eficiente, tanto como saber leer y
escribir”. En relación con la afirmación anterior de Wells, soy firme
partidario de la afirmación del matemático y divulgador español Eduardo
Sáenz de Cabezón, que afirma que comprender lo básico de las
matemáticas nos hace individuos menos manipulables y por lo tanto más
libres; así somos ciudadanos más críticos.

Figura 1. La estadística es una herramienta matemática imprescindible, pero es sujeta a
múltiples manipulaciones para engañar al lector. Imagen tomada de:
https://www.encuentrosconlaciencia.es/?p=677
La paradoja de Simpson / CIENCIORAMA 2

El nacimiento de la paradoja
El libro clásico Cómo mentir con estadísticas de Daniel Huff nos muestra
las diferentes formas de utilizar las herramientas de la estadística para
obtener algún beneficio por parte de un colectivo, por ejemplo su manejo
en algún medio de comunicación con ciertos fines políticos. Si bien no
definiría la paradoja de Simpson como una mentira en la mayoría de los
casos, sí puede dar como resultado que se justifiquen la discriminación y
el racismo, que se den argumentos paradójicos en las ciencias médicas y
otras consecuencias sociales y políticas.

Aunque esta paradoja lleva el nombre de Edward H. Simpson quien la dio
a conocer en un artículo en 1951 (véase la bibliografía), como bien lo
resume Clifford Wagner en su libro Simpson’s paradox in real life, la
describieron en 1899 el matemático Karl Pearson y el estadístico escocés
George Udny Yule. Por ello también se le conoce como el efecto Yule-
Simpson. Como ya se mencionó, esta paradoja es un fenómeno contra-
intuitivo que aparece cuando dos o más muestras estadísticas manifiestan
una tendencia que desaparece o se invierte cuando los grupos se
combinan para formar una sola muestra. Esta paradoja es común en
ciencias sociales, médicas, etcétera. Podría pasar por una simple
curiosidad estadística, pero la confusión y los problemas que conlleva,
radica en que los datos pueden interpretarse causalmente sin que haya
una relación causal real entre los factores que se asocian. En los múltiples
ejemplos citados por Clifford Wagner y otros encontrados en la red,
podemos ver varias paradojas como deducir efectos positivos de fumar –
24% por ciento de las fumadoras murió durante un estudio que duró 20
años; mientras que 31% de las no fumadoras falleció en el mismo lapso–
o haber hallado una discriminación de género en el ingreso al posgrado en
el año de 1973 o bajos rendimientos en etnias de Texas y Wisconsin o
tratamientos exitosos para los cálculos de riñón y otros tratamientos
médicos.

Todas estas paradojas pueden resolverse cuando se observa una variable
oculta, normalmente un factor causal que da al traste con los resultados.
Muestro aquí un ejemplo muy sencillo para captar la paradoja.

La paradoja de Simpson / CIENCIORAMA 3

Supongamos que estamos probando un fármaco X que demostró ser
eficaz en tres de tres pacientes del continente americano y que sólo fue
eficaz en tres de seis pacientes en el continente europeo. Ahora bien,
cuando la población americana no fue tratada sobrevivieron seis de siete
personas; mientras que ninguna de cada dos personas europeas no
tratadas sucumbió. Si hacemos el análisis por separado (ver la tabla)
parece ser que tratarse es mejor que no hacerlo en un 100% contra 85.71,
33.33 y 0% en personas americanas y europeas, respectivamente. Pero
cuando juntamos los dos grupos y vemos la estadística notamos que el
55.55% (5 de 9) de los tratados se recuperó, mientras que 66.66% de los
no tratados también. Conclusión: no tomarse el medicamento o no
tratarse es mejor que el tratamiento. Estamos frente a la paradoja de
Simpson que podemos replantear como dos conclusiones opuestas a partir
de los mismos datos dependiendo de cómo se agrupen.

Tabla 1. Cuando analizamos los datos por separado el tratamiento parece ser mejor que
no tratarse. Pero cuando los datos se tratan como uno solo se invierte la conclusión
anterior. En este último caso parece que es mejor no tratarse. Esa es la paradoja de
Simpson.

Con tratamiento Personas Personas Las dos
Sin tratamiento americanas europeas poblaciones

3 de 3 =100% 2 de 6=33.33% 5 de 9=55.55%

6 de 7= 85.71% 0 de 2= 0% 6 de 9=66.66%

Para que el lector comprenda a cabalidad la paradoja, observemos a
detalle un ejemplo que nos concierne a los mexicanos y latinoamericanos,
la inmigración a los EUA; y como en este caso la paradoja de Simpson
puede apoyar las ideas racistas y discriminatorias de Donald Trump. Al
descubrir la variable oculta veremos que las ideas de Trump no se
sostienen matemáticamente junto con los planteamientos genéticos,
económicos, culturales y antropológicos.

La inmigración mexicana percibida por Trump

Según The New York Times Patrick Crusius es autor del siguiente texto:
“Este ataque es en respuesta a la invasión hispánica de Texas. Ellos son
los instigadores, no yo. Yo estoy simplemente defendiendo mi país de

La paradoja de Simpson / CIENCIORAMA 4

reemplazos étnicos y culturales… Los hispanos tomarán el control del
gobierno local y estatal de mi amado Texas. La abundante población
hispana de Texas nos convertirá en un bastión de demócratas.” El 6 de
agosto del presente año, Crusius residente de los suburbios de Dallas
manejó nueve horas en dirección a la frontera México-USA para cometer
su matanza. Sin duda, Crusius está fuertemente influido por las palabras
del presidente Donald Trump quien afirmó: “Cuando México envía a su
gente, no envía lo mejor. Traen droga y crimen. Ellos son violadores. Y
algunos, supongo, son buenas personas”. El saldo fue la muerte de 22
personas, entre ellas 8 mexicanos.

Figura 2. Las palabras del presidente de EUA, Donald Trump sobre los mexicanos.
Palabras que ya han hecho mella en vidas perdidas de connacionales.

Desde la campaña presidencial de Donald Trump, el ahora presidente de
los EUA ha hecho un sinfín de declaraciones llenas de odio e ignorancia en
contra de la inmigración mexicana y latina (ver en Cienciorama “La ONU
busca contrarrestar el discurso de odio”). ¿Trump tiene razón? Desde el
punto de vista de la antropología, la genética y la cultura, sus disparates

La paradoja de Simpson / CIENCIORAMA 5

no se sostienen (ver en ¿Cómo ves? “Migrantes por naturaleza”). Veamos
si sucede lo mismo con la matemática.

Según los datos, Albine, EUA, cuenta con una población de 120 mil
habitantes con un aproximado de 20 mil estadounidenses de origen
mexicano y 100 mil de origen europeo. En 2004 según los informes de la
policía se cometieron en Albine 280 delitos. Según las mismas estadísticas
100 de ellos fueron perpetrados por estadounidenses de origen mexicano.
Entonces, cada 5 delitos fueron realizados por estadounidenses de origen
mexicano –pues dividimos los 20,000 habitantes de origen mexicano entre
mil que nos da 20 que multiplicamos por 5 que nos da el número de
crímenes totales que son 100, el mismo razonamiento para los habitantes
de origen europeo-- y cada 1.8 por estadounidenses de origen europeo.
Trump sonríe ¿pero tiene razón?

Cuando vamos más a fondo y analizamos con detalle encontramos la
paradoja. Aquí el dato escondido reside en estudiar los diferentes
condados de Albine. Esta ciudad, como cualquier otra, tiene condados con
mayor calidad de vida que otros. Callahan es el condado más acomodado
y Taylor el menos y cuenta con más mexicanos y estadounidenses de
origen mexicano. Ahora bien, si dividimos la población en los condados

citados los datos quedan así (véase las tablas).

Tablas 2 y 3. Observamos las estadísticas del Condado de Taylor (arriba) y del Condado
de Callahan (abajo). Al segregar los datos desaparece la supuesta correlación entre
mayor criminalidad en personas de origen mexicano.

Condado de Taylor

Población Delitos por año Por cada 1,000
90 habitantes
Personas de 10,000 90
10,000 9
origen mexicano
9
Personas de

origen europeo

La paradoja de Simpson / CIENCIORAMA 6

Condado de Callahan

Población Delitos por año Por cada 1,000
10 habitantes
Personas de 10,000 90
90,000 1
origen mexicano
1
Personas de

origen europeo

Vemos que la supuesta correlación de mayores delitos de mexicanos ya
no existe. La suma sigue siendo 280 delitos en ese año, pero se observa
que en Callahan hay 10 delitos por habitante de origen mexicano y 90 por
habitante de origen europeo; mientras en el condado de Taylor son 90
delitos por persona de origen mexicano y europeo. Esto quiere decir que
la proporción de delitos entre los diferentes grupos de extranjeros
habitantes en Albine, es la misma. El análisis superficial nos hace llegar a
una conclusión errada, puesto que al no percatarnos de la variable oculta,
la distribución geográfica relacionada con la economía de los diferentes
condados, mezclamos el agua con el aceite.

Pero quizá se pregunte el lector ¿cómo sé que me encuentro ante la
paradoja de Simpson? No es una pregunta sencilla de responder pues
entra en juego un análisis detallado de los datos, experiencia en el manejo
de éstos y conocimientos sobre las diferencias socioeconómicas.

La paradoja no está realmente en las estadísticas, pues su análisis
detallado nos muestra que los datos que arrojan pueden manejarse a
conveniencia y además ellas mismas nos dan una pista de dónde podría
haber un sesgo. Puedo concluir que en los ejemplos expuestos
anteriormente la paradoja de Simpson está más en los sesgos que se
hagan con respecto al origen, al género, a cómo funcionan los
medicamentos o a la criminalidad de la población mexicana, aunque éstos
resulten desmentidos si se analizan bien los datos.

La paradoja de Simpson / CIENCIORAMA 7

El hombre anúmerico

Soy una persona corriente, no una persona de números.
John Paulos, El hombre anúmerico

A diario me encuentro con el anumerismo que en palabras del matemático
y divulgador de la ciencia norteamericano John Allen Paulos “es la
incapacidad de manejar cómodamente los conceptos fundamentales de
número y azar”. Esta incapacidad, continúa Allen, tiene conexión con la
pseudociencia, una marcada tendencia a deformar la imagen de las cosas
con la propia experiencia o lo que dictan los medios de comunicación.
Todos los días alguien nos intenta manipular, usando nuestros fallos
lógicos. Pienso que para ejercer una libertad ciudadana crítica
necesitamos las matemáticas para analizar con rigor e interpretar mejor
los datos. En mi opinión las matemáticas están detrás de una mejor
democracia, detrás de muchos aspectos de nuestra vida cotidiana y
ciudadana (recomiendo la conferencia del matemático y divulgador
argentino Adrián Paenza “Matemáticas para la vida real”).

Aunque el pretexto de este artículo fue poner mi granito de arena en
contra de las palabras de Donald Trump que ya cobran vidas humanas,
también es una pequeña defensa de la matemática en relación con
aspectos de la vida cotidiana. Termino con las palabras de Eduardo Sáenz
de Cabezón: “Hay pocas cosas que sean más humanas que las
matemáticas, probablemente el hecho de que somos seres orales –que
nos interesan las historias- y que somos seres matemáticos –que medimos
el mundo, lo contamos, tratamos de comprenderlo y sistematizarlo–. Para
eso sirven las matemáticas (para eso sirven las matrices, las
operaciones).”

La paradoja de Simpson / CIENCIORAMA 8

Bibliografía

Allen Paulos, John, El hombre anúmerico, Tusquets Editores, España, 1988
Blasco, Fernando, Matemagia, Ariel, Barcelona, 2016
Herrera Corral, Gerardo, El azaroso arte del engaño, Taurus, México, 2017
Huff, Daniel, Cómo mentir con estadísticas, Crítica, Barcelona, 2015
Paenza, Adrián, ¿Y esto también es matemática?, Debate, México, 2012
Especializada
Bickel, P., Hammel, E., O’Conell J., “Sex Bias in Graduate Admissions: Data from Berkeley,
Science, 07 Feb 1975: Vol. 187, Issue 4175, pp. 398-404 DOI:
10.1126/science.187.4175.398
Simpson, E. H., “The interpretation of interaction in contingency tables”, Journal of the
royal Statical society, 40, 328-340
Wagner Clifford, “Simpson’s paradox in real life”, Journal The American
Statistician ,Volume 36, 1982 - Issue 1
Youtube
Eduardo Saenz de Cabezón, Las matemáticas nos hacen más libres y menos
manipulables, 2018 https://www.youtube.com/watch?v=BbA5dpS4CcI
Paenza, Adrián, Matemáticas para la vida real, 2019 https://www.youtube.com/watch?
v=V33U1OsFVnQ
Minuto de física, La paradoja de Simpson, 2019 https://www.youtube.com/watch?
v=hpbXkrm68rI
Imagen de portada: Las paradojas de la estadística. Tomada de:
http://www.dosisdiarias.com/2008/09/libro-de-notas.html

La paradoja de Simpson / CIENCIORAMA 9


Click to View FlipBook Version