miércoles, 20 de mayo de 2020

Desescalada asimétrica del Coronavirus: Por supuesto.

Ya sabéis que me gusta ser breve.  A veces trato tres o cuatro temas de golpe, con un párrafo y pico para cada uno.  Así que voy a fracasar el mínimo hablando de un dibujo que les encanta a los estadistas. y al parecer a todo el mundo, puesto que han declarado que la desescalada era asimétrica. Con un vistazo te dice todo. Revela La media, qué es más común, cuál es el máximo y mínimo, y más. Exacto, es  el histograma.

Si quieres, salta al final a la conclusión. Pero es olvidar el proceso. Como cuando oyes "es culpable", pero no sabes de qué. O cuando conoces al campeón mundial de algo que inventó él.

¿Te suena la palabra histograma? Has visto muchos en la vida, te dieras cuenta o no. Es una forma de mostrar los datos numéricos en un gráfico. Muestra cuánta gente cumple cada característica distinta. Por ejemplo, seguro que has visto cuando te hablan de la edad de la gente en España:
https://www.astrocava.com/images/articulos/astrofoto/Histograma-edad-poblacion-espa%C3%B1ola-total.jpg
Cuando te hablan de la distribución de riquezas dentro del país:
https://www.elperiodico.com/es/ext_resources/infographics/2016/enero/W-ECO-desigualdad-Espana-4.png


A menudo, divididos por género, localización, renta, o por lo que quieran, vemos varios datos a la vez:
A menudo no miden los sucesos, sino simplemente cuántas veces han pasado esos sucesos. Como por qué hubo apagones.  Miden los apagones por cada causa, pero no explican las consecuencias de estos:
https://la.mathworks.com/help/matlab/creating_plots/categoricalhistogramdisplayexample_01_es.png
Algun lo usa para controlar cuánto duerme:
Es fácil hacer un histograma, puedes hacerlos con Excel. Si buscas en Google "hacer histograma" te salen muchas opciones de webs para que salgan bonitos.

¿En qué consiste? Supón que el jefe te manda un trabajo. Tienes que medir la altura de 100 personas, y explicar el resultado. Cuánto mide cada uno. Así que vas anotando los resultados, uno tras otro.
Luego le pasas tus apuntes al jefe, y te dice que eso no dice nada. Quiere que le des información específica. Cómo de alta suele ser la gente. Cuánta gente hay alta. Si la gente suele ser más alta o más baja que lo normal. Y lo que se te ocurra. Así que decides dibujar un histograma.

Lo primero que haces es dividir a la población por grupos. No puedes tratar cada persona por separado. Así que vas dividiendo de 10 en 10 centímetros. Y luego cuentas los que cuajan dentro de cada categoría.  Y ya tienes tu histograma. Te queda una cosa así:

Voy a explicar cómo se halla el resto de lo que te pide tu jefe, pese a que haya programas gratis que lo hacen solos. La ventaja que tiene esto es que una vez averiguas cómo hacerlo, se te queda. Aunque examines otros datos de otra gente, los pasos a realizar son exactamente iguales y el resultado dice lo mismo.

Si ves una estadística sobre otro dato, sabes lo que significa. Si te dicen que p valor  de algo es 0,009, queda clara tu conclusión. Si te dicen que la asimetría es menor que 2, te haces una idea. Y estos estadísticos son válidos para muchas cosas, midas el calentamiento global o si un amigo llega tarde cuando quedáis, o si comparas la desigualdad de renta en dos países. En cada caso la conclusión significará algo distinto, pero el resultado dice lo mismo, de forma objetiva.
Volvamos con lo de tu jefe. Como crees que es un clásico, vas a por las famosas media, moda y mediana.  Cada una es más simple que la anterior.

La media consiste en sumar todos, y dividir por el total.  Cuando te hablan del Pib per cápita, y cosas así, es lo que usan para cacular lo que gana una persona media. En este caso, nos sale 158,3.

La moda consiste en cuál es el resultado más común. El que ocurre más veces. En este caso, como los hemos separado en bloques, nos sale que es medir entre 1,60 y 1,70 centímetros. Pero, miramos nuestro bloc de notas, y sin agruparlos, lo más común era medir 1,53, con 17 personas.
Y la mediana consiste en el valor de enmedio. Ordenas los resultados de mayor a menor, y ves cuál es el valor que está a mitad. En este caso está entre 1,50 y 1,60.  Pero sacamos nuestra libreta y nos sale 1,57.

Ahora entramos a una parte más wombo combo de la estadística. El error.  La simetría.  La curtosis también, ya que estamos (viene en la ecuación, y dice casi lo mismo).
Cuando alguien está haciendo estadística, hay una regla de oro. Mide el error respecto a la media. O respecto a lo que estés mdiendo. Eso nos lo dice todo. Sabremos si estamos explicando algo o no. Y cuánto nos estamos desviando. Si comparas el errror con lo que has averigüado, hallas al instante si has hecho algo útil o no mucho.

Una medida famosa es la desviación típica. Consiste en cuánto suele alejarse cada punto de la media. Esto nos dice si la media sirve de algo o no mucho, porque no representa a la población. Por ejemplo, hay 8 que se separan 38,3. Hay 14 que se separan 23,3, etc. Se suele hacer al cuadrado, llamarlo varianza, y luego hallar la raíz cuadrada. El resultado es el mismo, pero te lias menos porque no tienes que escribir las diferencias todo en valor absoluto, sumando unos y restandon otros.
 
Y ahora ya, llegamos la asimetría y más allá.

La asimetría consiste en que si miras desde la media, los dos lados nos son iguales. Y te sale un número que te dice cómo de distintos son. Si sale casi 0, son idénticos. Para hallarlo haces la desviación típica, tres veces a la vez. Pero en este caso, no mides el alejamiento solamente, sino también si son negativos o positivos. Así, si está más alejado del centro por la derecha, te saldrá positivo, y si es al revés negativo.

 Luego hay que dividirlo por la desviación típica al cubo para que quede algo comparable. Si no, por ejemplo, si medimos algo como la altura (en centímetros, entre 100 y 200)  y otra cosa como lo que gana la gente (entre 1€ y millones de euros), nos saldrá que uno de los dos es de locos. Así se divide, y sale un número comparable con otras cosas:


Y la curtosis nos dice si hay un achatamiento o una elevación, Hay una función muy famosa. Se llama función normal, con la cual compararemos. O la campana de Gauss, si prefieres llamarlo así. Y consiste en una función donde no pasa nada muy raro. Básicamente, esta cuenta nos dice si esta función está más achatada o más escarpada que la función normal. Hacemos lo mismo que con la asimetría, pero elevamos a cuatro. La función normal, con la cual comparamos, debería ser así.

https://www.matematicasonline.es/BachilleratoCCSS/segundo/archivos/distribucion_normal/campana_gauss1.gif
Y la curtosis que hallaremos será de esta fórmula. 










Lo normal es que salga 3. Claro, lo normal de todos los días. El otro día me hice una curtosis del bocadillo y me salió tres. Hubo un tipo del que me salió 4 y me cae mal. Es broma. por supuesto. Simplemente quería decir que el punto entre muy achatado y muy elevado se pone en 3. Pese a que en cada caso sea distinto, es lo estandarizado. Como cuando mides en kilos en vez de en onzas o quintales.

  Por si alguno os interesa el tema. estaban los señores Bera y Jarque un día, y se les ocurrió una fórmula  de estas famosas. Metías las dos últimas cosas hechas, y comparabas el resultado con una función hecha a medida (es la función normal, pero de 2 variables a la vez). Y tiene la ventaja que hemos comentado antes. Si has usado el contraste de Jarque-Bera 20 veces, ya sabes lo que significa. Así que vino muy bien, y te sale en una esquina en los programas de estadística.


Y aquí llegamos ya a la conclusión.

Claro que salen mal los contrastes. No cumplen las condiciones de normalidad. Esa es la gracia. Si nuestro resultado siempre fuera "no ha pasado nada especial", o "se comporta igual a las últimas 23 cosas que medido", sería muy aburrido todo, no serviría mucho esta ciencia.

Y por otro lado, volviendo al tema inicial, Claro que la desescalada es asimétrica. Nada es simétrico. Todo es simétrico solamente en el país de las hadas clonadas. Si la desescalada fuese simétrica, todos los días habría un número de enfermos similar en cada hospital. Habría el mismo número de nuevos contagios cada día en todo lugar. La gente se curaría igual de probablemente independientemente de todo lo demás. Todas las CCAA tendrían ciudades de tamaño similar. Y cuestiones similares que no se cumplen. Por eso dicen que en cada lugar aplicarán medidas distintas. 

Espero que haya servido de algo para analizar lo que sea. Salud,  Paz y amor a todos.

Biblografía:
https://www.matematicasonline.es/BachilleratoCCSS/segundo/archivos/distribucion_normal/campana_gauss1.gif
https://wikimedia.org/api/rest_v1/media/math/render/svg/e3947808047b62df2b6ec250418139b4e9e3e523
https://wikimedia.org/api/rest_v1/media/math/render/svg/e3947808047b62df2b6ec250418139b4e9e3e523
https://www.google.com/url?sa=i&url=https%3A%2F%2Fwww.youtube.com%2Fwatch%3Fv%3DLvtB9s1-y_Q&psig=AOvVaw1xPswOvBmC1PLoP104eTEJ&ust=1589903016329000&source=images&cd=vfe&ved=0CAIQjRxqFwoTCIiJ2rjgvekCFQAAAAAdAAAAABAf
https://www.astrocava.com/images/articulos/astrofoto/Histograma-edad-poblacion-espa%C3%B1ola-total.jpg
https://doc-archives.microstrategy.com/producthelp/10.11/Workstation/WebUser/WebHelp/Lang_3082/Content/Resources/Images/histogram_viz.png
https://www.elperiodico.com/es/ext_resources/infographics/2016/enero/W-ECO-desigualdad-Espana-4.png
http://www.hrc.es/bioest/Ejemplos_histo5.gif
https://osoramirez.github.io/R_Para_Biologos/R_Book_Para_Biologos_files/figure-html/unnamed-chunk-171-1.png
https://la.mathworks.com/help/matlab/creating_plots/categoricalhistogramdisplayexample_01_es.png

No hay comentarios:

Publicar un comentario