Jun 302014
 

Clase impartida el 28 de junio de 2014

II Universidad de verano | Campus de Cebada | Materiales del Campus

Vamos a hablar de la importancia de perderle el miedo a los datos numéricos, especialmente a las estadísticas que nos dan desde los medios de comunicación y organismos oficiales. Esto se podría extender a todos los campos de la ciencia, pero nos vamos a centrar en éste. No voy a hablar de cómo se pueden manipular los estudios de intención de votos tomando muestras no representativas ni de cómo se pueden plantear las preguntas de una encuesta para favorecer la elección de un determinado resultado, esto último pertenece más al campo de la psicología.

Razones para aproximarse a los datos numéricos

Si hojeamos un periódico vemos que hay gráficas, diagramas de sectores, histogramas, porcentajes y muchas más cosas que nos sirven para entender mejor los datos que nos dan. Voy a poner tres ejemplos de cómo, sin errores de naturaleza numérica, no nos dan toda la verdad.

Ejemplo 1. El salario medio

Supongamos dos poblaciones de dos personas cada una. En la primera población tanto la persona 1 como la persona 2 tienen un salario de 1.000€ y, por tanto, el salario medio es de 1.000€. En la segunda población, la persona 1 cobra 1.700€ en salario, mientras que la persona 2 sólo cobra 300. En esta situación el salario medio es, nuevamente, de 1.000€.

Como vemos, ambas situaciones son muy distintas, pero los salarios medios son los mismos. ¿Significa que está mal dar el dato de la media de los salarios de una población? No, significa que como único dato es insuficiente. Un aumento o disminución de la media salarial puede deberse a muchos factores: que la desigualdad sea menor, que los que ganan más ganen aún más, que todos ganen más pero que se mantenga la desigualdad…

Este ejemplo es muy simple, pero cuando nos den el salario medio de otros países diciendo que su situación laboral es muy buena, siempre tenemos que pedir más datos, para poder ver la media en contexto. Algunos datos que pueden complementar a la media son la varianza y la desviación típica, que miden cómo de separados están los datos respecto a la media.

Ejemplo 2. Las películas más vistas en la historia del cine

Este segundo ejemplo vamos a ver cómo se han extraído unas conclusiones a partir de unos números sin tener en cuenta el contexto de procedencia. Ésta es la lista de películas más taquilleras del cine, o eso se supone:

  1. Avatar (2009)
  2. Titanic (1997)
  3. Los Vengadores (2012)
  4. El caballero oscuro (2008)
  5. Star Wars I: La amenaza fantasma (1999)
  6. La guerra de las galaxias (1977)
  7. El caballero oscuro: La leyenda renace (2012)
  8. Shrek 2 (2004)
  9. E.T. (1982)
  10. Piratas del Caribe: El cofre del hombre muerto (2006)

Las películas más taquilleras son la que obtuvieron mayor recaudación en taquilla. La recaudación en taquilla depende de dos factores: el número de espectadores y el precio de la entrada. Si el precio de las entradas no hubiera subido como la espuma, Avatar no habría desbancado a Titanic, porque tuvo menos espectadores, con lo que el hecho de que una película sea de las más taquillera no significa que sea una de las más vistas, como se pretende relacionar. Para saber exactamente cuáles son las películas más vistas habría que investigar cuántas entradas se vendieron desde que existe el cine, cosa que no creo que sea posible. En un blog en internet calcularon por medio de la inflación estadounidense y lo recaudado cuál sería aproximadamente el número de espectadores en Estados Unidos de películas clásicas para poder compararlas mejor. Haría falta un factor de corrección para tener en cuenta que las películas de aquella época han tenido muchos más años para ser vistas que las nuevas o cerciorarse de a qué período se refiere el dato de recaudación en taquilla, pero más o menos la lista quedaría así:

  1. Lo que el viento se llevó (1939)
  2. La guerra de las galaxias (1977)
  3. Sonrisas y lágrimas (1965)
  4. E.T. (1982)
  5. Titanic (1997)
  6. Los diez mandamientos (1956)
  7. Tiburón (1975)
  8. Doctor Zhivago (1965)
  9. El exorcista (1973)
  10. Blancanieves y los siete enanitos (1937)

Como vemos, la más nueva es Titanic y no hay ninguna película de este siglo. Por cuestión de marketing no interesa utilizar esta segunda lista, pues no nos podrían anunciar los grandes éxitos de taquilla, y por ello utilizan la primera.

Lo que nos muestra este ejemplo es que puede ser que una medida no sea equivalente para todos los datos, como lo es aquí la cantidad de dólares.

Ejemplo 3. El paro

En el último ejemplo vamos a ver cómo se puede dar una conclusión con una falta de rigor, en mi opinión, aplastante. Vamos a analizar el dato del paro registrado de diciembre de 2013.

El paro registrado se refiere al número de personas inscritas en las oficinas del SEPE en el último día del mes al que se refiere, excluyendo a los colectivos de una Orden Ministerial del 11 de marzo de 1985, que incluye, entre otras, a las personas que solicitan un empleo de características muy específicas, que no tienen disponibilidad inmediata, o que son beneficiarios de una prestación económica por desempleo. Los datos, en número de personas, referentes a diciembre de 2012, diciembre de 2013 y noviembre de 2013 están dispuestos en la siguiente tabla, de forma que podemos ver la variación anual y la mensual con facilidad.

DIC 2012 DIC 2013 NOV 2013
4.848.000 4.701.300 4.809.000

Como vemos, hay un descenso en los datos absolutos tanto de un año para otro como de un mes al siguiente, que es lo que nos dijeron en la prensa generalista y desde el gobierno, pero vamos a ver que esto no significa que haya más gente trabajando.

¿Por qué hablamos de paro registrado? Porque también hay otro dato del paro, el de la Encuesta de Población Activa, la EPA. Este último es el que utiliza la Organización Internacional del Trabajo (OIT) y la Unión Europea (UE), se calcula trimestralmente y se refiere a las personas entre los 16 y los 74 años que cumplen simultáneamente los siguientes requisitos:

  • no tener empleo por cuenta ajena o propia en la semana anterior a la de la encuesta
  • buscar empleo en las cuatro semanas anteriores a la de la encuesta
  • estar disponible para trabajar en las dos semanas siguientes a la de la encuesta

Como vemos, estos dos criterios chocan un poco, por lo que estos datos suelen no coincidir. Cuando el dato de la EPA era inferior se utilizaba para como dato oficial, ahora que el paro registrado es inferior, se utiliza éste. Aquí vemos las EPA correspondiente al cuarto trimestre de 2012 y 2013:

Periodo Pob. Activa Pob. Ocupada Pob. Parada Tasa Actividad Tasa Paro
4T 2012 23.360,4 17.339,4 6.021 60,23% 25,77%
4T 2013 23.070,9 17.135,2 5.935,6 59,86% 25,73%

Como vemos, el total (calculado a partir de la tasa de actividad) de la población sobre el que se hace la encuesta ha bajado, así como las personas activas, las ocupadas y las paradas, es decir, han bajado todos los grupos. Habiendo menos población activa no es sorprendente que el paro baje, pero observamos que ha descendido menos que la población ocupada. Si miramos el paro de la EPA vemos que el descenso no ha sido tan pronunciado y si miramos las tasas de paro respecto a la población activa, realmente varía bastante poco.

Miremos ahora las afiliaciones a la Seguridad Social y los tipos de contratos.

Contrato y jornada DIC 2012 DIC 2013 NOV 2013
Indefinido Completa 6.367.616 6.115.158 6.122.979
Indefinido Parcial 1.284.308 1.313.193 1.309.548
Indefinido fijo discontinuo 245.171 255.197 269.618
Temporal Completa 1.786.695 1.788.862 1.802.971
Temporal Parcial 1.323.149 1.396.625 1.365.427
Formación 117.600 152.769 146.893
Otros 995.900 1.007.825 1.007.048
Afiliados Seguridad Social 16.442.681 16.357.640 16.293.543

En la tabla leemos que el número de afiliados sube de noviembre a diciembre de 2013, pero que hay un descenso de diciembre de 2012 al mismo mes de 2013. Así mismo podemos ver cómo descienden los contratos indefinidos a jornada completa y como aumentan los temporales a tiempo parcial en ambos casos.

Me gustaría poder comentar los ingresos de la Seguridad Social mediante las cotizaciones. He encontrado sin mucho problema los datos de 2013, totalmente actualizados y accesibles, pero el de diciembre de 2012 que he encontrado no estaba actualizado.

Con todo esto podemos decir que si bien el paro registrado ha bajado en número, es decir, hay menos personas inscritas en el SEPE en diciembre de 2013, esto no significa creación de empleo. El siguiente paso en este estudio podría ser ver con qué dinero se pagan las pensiones y subsidios, ver cómo varían tanto los gastos como los ingresos y analizar si con el descenso de paro que se está produciendo y promocionando como solución, estamos garantizando el sistema de pensiones, o si seguirán teniendo excusas para recortar de todas formas.

PIB y prima de riesgo

A parte de estos tres ejemplos me gustaría dar un par de apuntes sobre dos indicadores económicos: el PIB y la prima de riesgo.

El Producto Interior Bruto (PIB) se suele utilizar para medir la riqueza de un país, pero sólo cuenta las actividades monetarias y los flujos de dinero, es decir, que no cuenta por ejemplo el trabajo doméstico tan importante e invisibilizado. Para calcular el PIB se hace una estimación de la economía sumergida y del impacto social y ecológico, pero realmente mide las actividades en las que hay movimiento de dinero.

Simon Kuznets (1901-1985), uno de los creadores del sistema de contabilidad nacional estadounidense que dio lugar al uso del PIB como indicador económico, ya advertía en 1934 que “es muy difícil deducir el bienestar de una nación a partir de su renta nacional (per cápita)”.

Supongo que Estados Unidos tiene interés en utilizar el PIB como riqueza, pues si miramos los datos del Banco Mundial disponibles en Wikipedia, podemos ver que no bajó del segundo puesto en la clasificación mundial en base al PIB per cápita entre 1960 y 1973.

Aparte del PIB, existen otros indicadores como el PIB verde que tiene en cuenta los recursos naturales deteriorados, el Índice de Desarrollo Humano (IDH), la huella ecológica o la felicidad interna bruta (FIB). Hay que tener en cuenta que el PIB no es malo de por sí, el PIB, como cualquier indicador mide lo que mide y todos los indicadores tienen limitaciones. Por ello no hay que dejar de utilizar el PIB, sino dejar de extrapolarlo y complementarlo con otros indicadores.

Ahora voy a explicar a grandes rasgos en qué consiste la prima de riesgo o diferencial de deuda. Sabemos que los países para financiarse cogen créditos de otras entidades, como bancos, y que, como en todo crédito, tiene que devolver el dinero prestado junto con unos intereses. El porcentaje de intereses a pagar por un país depende de la probabilidad de que ese país concreto pueda hacer frente al pago. Primero necesitamos un país respecto al cual calcular la prima de riesgo, en la UE el país elegido es Alemania, por tener los menores intereses y por ser, supuestamente, más estable. Para calcular la prima de riesgo de otro país, como por ejemplo España, lo que hacemos es restar los porcentajes de interés, por ejemplo, si España paga un 7% de interés y Alemania un 3%, restamos 7-3=4 y multiplicamos por 100 obteniendo 400 puntos básicos.

¿Qué consecuencias tiene esto? Primero, que con este indicador siempre habrá un país beneficiado con prima de riesgo nula, el país de referencia. Por otro lado, que la prima de riesgo de otro país que no sea el de referencia, depende de sus condiciones y de las del de referencia.

Aspectos sociales y políticos

Por otra parte, tenemos que la forma en la que nos presentan los datos nos hace pensar que éstos sean muy difíciles de procesar, calcular y analizar y que sólo los expertos, en masculino, pueden hacerlo. Es cierto que la noción de prima de riesgo no es inmediata, pero si nos dan los datos necesarios para calcularla y la definición la podríamos calcular. Además, con sólo tener la definición podemos sacar conclusiones de cómo puede variar el dato final según varíen los datos iniciales, por ejemplo.

Poder analizar las conclusiones nos da la posibilidad de no depender de los organismos oficiales y medios y de ver a quién beneficia que se utilicen esos datos y se expongan de determinada manera.

Tomar la estadística

Una vez que nos hemos decidido a querer entender cómo nos dicen que funciona el mundo, nos hacen falta los datos y, digamos, los conocimientos. Cuando buscamos datos a veces los podemos encontrar fácilmente, accesibles sin tener que pedirlos y, sobre todo, “en bruto”, es decir, en números, no solo tantos por ciento, y explicando a qué se refieren y cómo se contabilizan. Es decir, nos tienen que dar el paro registrado diciéndonos a qué personas se refiere, en un formato libre, en una web, en publicaciones que se puedan consultar. También estaría bien que las diferentes oficinas del SEPE publicasen cuál ha sido el paro registrado en su oficina y que podamos comprobar que sumando todos nos da el total. Si queréis saber más sobre accesibilidad de datos y formatos podéis buscar open data. Esto también es transparencia y nos damos cuenta de cuán necesaria es cuando la necesitamos.

Los conocimientos necesarios pueden obtenerse de diferentes maneras y dependerán de nuestro nivel inicial en un campo, hoy hablamos de estadística, pero puede ser otro. Lo primero sería un conocimiento básico, del nivel que se aprende en secundaria, que nos dará herramientas para poder entender artículos o libros de divulgación que nos expliquen las cosas de forma clara y sin metáforas que nos hagan pensar que el FMI es malo o bueno, lo que queremos es poder juzgar su actuación por nuestra cuenta. La buena divulgación te empuja a seguir profundizando en el tema de forma que poco a poco te puedes ir metiendo en literatura no divulgativa.

Nuestra propia aplicación

En esta última parte de la charla voy a exponer un par de ejemplos sencillos de cómo se pueden usar conocimientos básicos de matemáticas para el activismo.

Manifestación 15-O

La manifestación del 15 de octubre de 2011 fue la convocatoria que, convocando a la ciudadanía de la Comunidad de Madrid, contó con más asistencia. No voy a tomar las marchas del 22-M porque la convocatoria era a nivel estatal y la mayoría de la población no tenía facilidad para acudir.

Según fuentes de la policía, que son las únicas que he encontrado, fueron entre 500.000 y 600.000 personas. Eso es mucha gente, sobre todo cuando estábamos allí y veíamos gente y más gente, pero si tenemos en cuenta el homólogo religioso más exitoso en Madrid, la procesión de Jesús de Medinaceli que cada año cuenta con unos 800.000 asistentes, vemos el número en otro contexto. Me hubiera gustado también comparar con el número de aficionados que salió a celebrar por las calles de Madrid la victoria de la Selección Española de Fútbol en el Mundial de 2010, u otras celebraciones deportivas, pero son datos que no he encontrado más exactas que“cientos de miles” o “casi un millón”.

Aborto

El segundo ejemplo es sobre la interrupción voluntaria del embarazo. En AP Austrias-Letras hicimos un pequeño estudio para hacer unos panfletos informativos sobre el aborto voluntario en nuestro país que repartimos en el mes de abril. En este caso, todos los datos son del Instituto Nacional de Estadística (INE). Hay multitud de datos, pero nos interesaba saber cuánta gente y en qué porcentaje se acogía a cada supuesto o razón de embarazo cuando cambiaron la ley, es decir, qué supuso el cambio de ley de supuestos a plazos. Estos datos están directamente en el INE y sólo había que juntarlos. Aquí hemos tomado 2009 (ley de supuestos de 1985) y 2011 (ley de plazos de 2010) porque en julio de 2010 entró en vigor la nueva ley y eso hace que los datos no sean claros.

2009 2011
Salud materna 96,74% A petición de la mujer 89,58%
Salud de la embarazada 7,3%
Riesgo fetal 2,98% Riesgo de anomalías 2,73%
Anomalías fetales 0,3%
Violación 0,02%
Varios motivos 0,27% Varios motivos 0,09%
No consta 0% No consta 0%
Abortos totales 111.482 Abortos totales 118.360

Utilizando la distribución por edades que da el INE, quisimos saber qué porcentaje de gente de cada grupo de edad que se ve en la situación de un embarazo aborta voluntariamente. Esta información no es tan fácil de obtener. Primero tuvimos que calcular el número de abortos en cada tramo de edad, a partir de la tasa por mil y la población de mujeres de cada edad. El número total de embarazos se obtiene sumando los abortos voluntarios, los abortos naturales, los casos de muerte fetal o temprana (dependiendo de cómo sean las estadísticas) y los nacimientos. El número de abortos naturales no lo hemos encontrado y en los casos de muerte fetal y temprana no sabíamos si estaban contabilizados en los nacimientos. Así que tomamos los embarazos como la suma de nacimientos y abortos voluntarios, con lo que al obtener los porcentajes tenemos estimaciones superiores, es decir, que el número real será igual o menor al calculado, nunca mayor. Así, obtuvimos los resultados referentes a 2011 que podemos ver en esta tabla:

% por edad 2008 2009 2010 2011
19 y menos años 50 52 55 59
20 a 24 años 35 36 37 40
25 a 29 años 20 20 21 23
30 a 34 aos 10 11 11 12
35 a 39 años 12 12 12 13
40 y más años 22 22 22 22

Con esta segunda tabla nos podemos hacer una idea de cuánto se ejerce el derecho al aborto y el derecho a decidir. Con la primera observamos que en 2009 se estaba reconociendo ese derecho en el ámbito médico y que la sociedad iba por delante de la ley. Es muy posible que volvamos a esta estadística cuando aprueben la reforma de la ley, y si se deja de luchar, será la estadística la que mostrará la hipocresía de la población cuando antes mostraba la del gobierno.

Final

Resumiendo, los expertos en algún momento no supieron nada y también tienen intereses, así que no hay razón por la que tengamos que delegar ciegamente en ellos. Espero que les haya gustado, que se animen a hacer sus propios análisis y gracias por su atención.

Fuentes

Listado de películas
www.generacionyoung.com/cine/peliculas/cine-peliculas-vistas-historia/

Encuesta de Población Activa
www.ine.es/inebaseDYN/epa30308/epa_inicio.htm

Datos del paro registrado
www.sepe.es/contenido/estadisticas

Orden del 11 de marzo de 1985 por la que se establecen criterios estadísticos para la medición del paro registrado, publicado en BOE num. 63, de 14 de marzo de 1985, páginas 6612 a 6612
www.boe.es

Afiliados y tipos de contratos
seg-social.es

Prima de riesgo y PIB
es.wikipedia.org

Clasificación por países según el PIB per cápita
en.wikipedia.org/wiki/List_of_countries_by_past_and_future_GDP_(nominal)_per_capita

Asistentes a la procesión de Jesús de Medinaceli
noticias.lainformacion.com

Asistentes a la manifestación del 15-O
www.publico.es/internacional/401690/indignados-de-todo-el-mundo-se-manifiestan-en-el-15-o

Datos del aborto
www.ine.es/jaxi/menu.do?type=pcaxis&path=%2Ft15%2Fa044&file=inebase&L=0

 Leave a Reply

You may use these HTML tags and attributes: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <s> <strike> <strong>