Cómo entender las cifras en las noticias: Tres trucos estadísticos
- Written by Liberty Vittert, Visiting Assistant Professor in Statistics, Washington University in St Louis
Buena noticia: datos recientes del Bureau of Labor Statistics[1] de Estados Unidos (Oficina de Estadísticas Laborales) indican que el desempleo nacional bajó del 3,9% en agosto 2018 al 3,7% en octubre.
Para recabar estos datos, lógicamente, la oficina no va preguntando a cada persona si tiene o no trabajo. Pregunta a una pequeña muestra de población y luego generaliza la tasa de desempleo del grupo para el conjunto de estadounidenses.
Esto significa que la tasa oficial de desempleo en un momento dado es una estimación. Lo que realmente dicen los datos es que parece que el número de personas desempleadas en todo el país descendió en 270.000[2], pero con un margen de error, según define el intervalo de confianza, de 263.000 más o menos. Es más fácil difundir una única cifra como 270.000.
Este “error positivo o negativo” está definido por algo que los estadísticos denominan “intervalo de confianza[3]”.
1. ¿Cuál es el margen de error?
Los intervalos de confianza[4] son un tema estadístico sobre el que ninguna persona no especializada debería tener que leer para entender una noticia.
Read more: Numbers in the news? Make sure you don't fall for these 3 statistical tricks[5]
Pero, por desgracia para los que odian los números, me toca avisar si no quieren dejarse engañar por una investigación sesgada, sobrevalorada o inútil, hay que hablar sobre algunos principios estadísticos, mi area de especialización[6].
El muestreo siempre implica un margen de error, y es más preciso considerar ese cálculo único como un rango.
En el caso de la tasa de desempleo, los estadísticos creen que el número real de personas desempleadas bajó entre 7.000 en el límite inferior y 533.000 en el límite superior.
Otro ejemplo de cómo los intervalos de confianza nos complican la vida son las elecciones, como las legislativas que acaban de pasar en EEUU[7].
Los encuestadores toman una muestra de población, le preguntan a quién van a votar y después deducen lo que va a hacer toda la población en la jornada electoral.
Cuando las elecciones están reñidas, el error positivo o negativo asociado al sondeo de la muestra invalida cualquier información real sobre quién va a ganar, lo que da lugar a la expresión “too close to call”, es decir, que las elecciones están demasiado reñidas como para anticipar el ganador.
Por tanto, la próxima vez que vean una cifra sobre toda una población y sea imposible que se le haya preguntado a todas y cada una de las personas o que se haya analizado cada uno de los temas, deberían reflexionar sobre el error positivo o negativo.
2. ¿Cuál es el riesgo real?
De los titulares más penosos que leí, uno fue: “Un estudio realizado a lo largo de ocho años descubre que las personas que comen patatas fritas tienen el ‘doble’ de posibilidades de morir[8]”.
“Puf”, me dije en voz alta, mientras bebía una copa de vino tinto y frente a una enorme ración de patatas fritas. ¿De verdad?
Leo/Flickr, CC BY-NC-ND[9][10]Pues sí, según un estudio contrastado publicado[11] en el American Journal of Clinical Nutrition, es cierto. ¿Pero cuántas patatas fritas? Y, además, ¿cuál era el riesgo inicial de fallecimiento?
El estudio afirma que, si comes patatas fritas tres o más veces a la semana, el riesgo de fallecimiento se duplica. Por tanto, tomemos a una persona promedio para este estudio: un hombre norteamericano de 60 años.
¿Cuál es su riesgo de fallecimiento, independientemente de cuántas patatas fritas coma? Un 1%. Esto significa que, si juntamos a cien hombres de 60 años, al menos uno de ellos morirá el próximo año simplemente porque tiene 60 años.
Ahora bien, si esos cien hombres comen patatas fritas al menos tres veces a la semana durante toda su vida, sí, el riesgo de fallecimiento se duplica. ¿Pero el doble del 1% es el 2%. Por tanto, en lugar de morir uno de esos cien hombres a lo largo del año, morirán dos.
Y pueden comer patatas fritas tres o más veces a la semana durante toda su vida. Este es un riesgo que estoy dispuesta a asumir.
Se trata de un concepto estadístico denominado “riesgo relativo[12]”. Si la probabilidad de contraer una enfermedad es de una entre mil millones, aunque se cuadriplique el riesgo de contraerla, la probabilidad sigue siendo únicamente de cuatro entre mil millones. Es decir, no va a pasar.
La próxima vez que lean sobre el aumento o disminución del riesgo, la primera pregunta que deben hacerse es: ¿un aumento o disminución del riesgo con respecto a qué riesgo original?
3. ¿Qué otra cosa cambió?
Las cajas para bebés se han puesto de moda como regalo del Estado[13] para los padres primerizos, con la intención de proporcionar a los recién nacidos un lugar seguro donde dormir.
La iniciativa surgió del esfuerzo de Finlandia, a partir de la década de 1930, por reducir las muertes de bebés relacionadas con el sueño. La caja de cartón incluye lo imprescindible: pañales, toallitas para bebés, un mono, discos de lactancia, etc.
Visa Kopu/Flickr, CC BY-NC-ND[14][15]La tasa de mortalidad infantil de Finlandia se redujo a un ritmo acelerado con la introducción de estas cajas, y hoy en día el país tiene una de las tasas de mortalidad infantil más bajas del mundo[16].
Por tanto, se supone que estas cajas provocaron el descenso de la tasa de mortalidad infantil.
¿Pero saben qué otra cosa cambió? La atención prenatal[17]. En 1944, el 31% de las madres finlandesas recibían educación prenatal. En 1945, pasó al 86%.
Es que un requisito para obtener la caja para el bebé es que las mujeres debían visitar las clínicas sanitarias durante los cuatro primeros meses de embarazo.
La caja para bebés no fue la responsable del cambio en las tasas de mortalidad infantil, sino que fue la educación y los controles sanitarios tempranos.
Este es un ejemplo clásico de que la interrelación no es lo mismo que la causalidad[18]. La introducción de las cajas para bebés tiene que ver con el descenso de la tasa de mortalidad infantil, pero no es la causa.
Este dato no ha impedido que las empresas de cajas para bebés aparezcan por todas partes vendiendo cosas como la “Caja para bebés. La original de Finlandia” por nada menos que US$449,99 en Estados Unidos[19].
¿Conocer estos tres aspectos de las estadísticas engañosas significa que nunca los van a engañar? No.
Pero seguro que serán de ayuda.
References
- ^ datos recientes del Bureau of Labor Statistics (www.bls.gov)
- ^ descendió en 270.000 (www.bls.gov)
- ^ intervalo de confianza (www.khanacademy.org)
- ^ intervalos de confianza (doi.org)
- ^ Numbers in the news? Make sure you don't fall for these 3 statistical tricks (theconversation.com)
- ^ area de especialización (scholar.google.com)
- ^ acaban de pasar en EEUU (theconversation.com)
- ^ Un estudio realizado a lo largo de ocho años descubre que las personas que comen patatas fritas tienen el ‘doble’ de posibilidades de morir (www.news.com.au)
- ^ Leo/Flickr (www.flickr.com)
- ^ CC BY-NC-ND (creativecommons.org)
- ^ estudio contrastado publicado (doi.org)
- ^ riesgo relativo (understandinguncertainty.org)
- ^ de moda como regalo del Estado (www.ajc.com)
- ^ Visa Kopu/Flickr (www.flickr.com)
- ^ CC BY-NC-ND (creativecommons.org)
- ^ tasas de mortalidad infantil más bajas del mundo (datos.bancomundial.org)
- ^ atención prenatal (www.bbc.com)
- ^ la interrelación no es lo mismo que la causalidad (senseaboutscienceusa.org)
- ^ Estados Unidos (ssir.org)
Authors: Liberty Vittert, Visiting Assistant Professor in Statistics, Washington University in St Louis
Read more http://theconversation.com/como-entender-las-cifras-en-las-noticias-tres-trucos-estadisticos-106206