Extracción de datos de los números Covid

Hoy quiero profundizar un poco en los datos de Covid, porque veo que definitivamente hay una confusión.
La principal razón por la que comencé este proyecto fue para decir que las medidas de bloqueo estaban ligadas al "valor R" y los científicos de los medios públicos dijeron que el valor R sólo podía ser estimado, algo increíble para mí. Así que veamos qué podemos averiguar.
¿Qué datos tenemos a nuestra disposición en absoluto?
Voy a tomarLos datos de la Universidad John's Hopkins ya que parecen tener datos más precisos y rápidos hasta ahora. Los dos valores más importantes que tenemos son el número total de infectados y las personas actualmente infectadas. A partir de estas dos métricas generaremos todo.

No parece mucho - todavía - pero vamos a encontrar algunas cosas sencillas para salir de allí:
Preparación de los datos

En primer lugar, necesitamos algo con lo que podamos trabajar fácilmente. Para esto usaré Excel, porque es rápido y fácil. Programar algo con Python también podría funcionar, pero para un proyecto corto podría ser demasiado trabajo.
Los datos que tenemos se insertan en dos columnas como se muestra arriba. Cada fila representa un día de la pandemia. La pandemia comenzó en Suiza el 25 de febrero.
Nuevas infecciones diarias
Un valor que probablemente sea útil son las nuevas infecciones. No recogeré estos datos en la Universidad Johns Hopkins, sino que los extraeré de las infecciones totales. Esto ahorrará tiempo de copiado en el futuro.
Sólo tenemos que restar el total de las infecciones del día anterior de las del día actual.

Lo que podemos ver es un pequeño aumento de las infecciones en los últimos días, pero más adelante.
Curación total y duración media de la infección
La curación completa se puede tomar calculando el total de infecciones menos los infectados actualmente. A modo de ilustración, contrasto el gráfico con el total de infectados.

Bueno, eso puede no mostrar mucho todavía, excepto que nuestros hospitales están lejos de estar llenos. Además, podemos leer el tiempo de infección a partir de esto. Desplazando el total curado hacia la izquierda, deberíamos obtener el tiempo de infección si se superponen. Para Suiza son 16 días, para Alemania 15 días. Esto parece estar dentro del rango de medición.

El tiempo de infección será útil más tarde para el valor R
Curado por día

A partir del total curado, podemos generar el curado diario. Al igual que las nuevas infecciones diarias, restamos la curación total de ayer de la curación total de hoy.
Aquí es donde tengo algunos interrogantes sobre el método de recolección de estos datos por la Universidad John Hopkins. Aparentemente, desde el 16 de mayo, los casos curados se han reportado en lotes de 100, lo que me parece muy extraño:
Desafortunadamente, tenemos que asumir que los valores son correctos, pero tendré que usar la media menos precisa en lugar de la mediana. Encuentro que la mediana es más fiable ya que elimina eficazmente los valores atípicos. Pero como nuestros datos aquí son atípicos, tenemos que usar la media.

Además, ahora podemos superponer a los pacientes curados e infectados diariamente.

Lo que podemos ver claramente aquí es que los pacientes recuperados fueron consistentemente más que los nuevos infectados a partir del 1 de abril. Esto significa básicamente que los hospitales tuvieron cada vez menos trabajo a partir de ese día.
El místico Valor-R y el futuro
Para obtener el valor R, uno debe conocer primero la definición del valor R. La definición es la siguiente:
"Elnúmero esperado de casos generados directamente por un caso en una población en la que todos los individuos sonvulnerable para la infección del vino".
¿Cómo llegamos allí?
ya tenemos la información más importante.
- ¿Cuánto tiempo dura una infección en promedio? 16 días
- ¿Cuántas personas infectadas hay actualmente?
- ¿Cuántas nuevas infecciones hay por día?
El valor R diario puede entonces ser calculado de la siguiente manera:
(nuevas infecciones * duración de una infección) / número actual de personas infectadas
Este es el resultado para Suiza:

Además, he creado mi propia métrica para destacar si las cosas están empeorando o mejorando. Más verde que leer significa que las cosas están mejorando. Más rojo que verde significa que las cosas están empeorando.
Cuanto más altos o bajos sean los valores, más intenso será el efecto.

Uh oh - la segunda ola estará sobre nosotros!
pero lentamente por ahora. Accedamos primero a estas dos métricas de Alemania también, con el Valor-R Adivinado de Robert Koch en el fondo:


Alemania tiene una curva similar. El aumento del valor R sólo tuvo un pequeño bache. Además, el evento de la infección salta como una locura al final.
¿Por qué? Veamos los datos alrededor del 15 de junio, justo antes del pico:
Tenemos un total de 292 casos activos y ~15 nuevos casos por día en Suiza. De hecho, el número es tan pequeño que un solo punto caliente ya anulará drásticamente los valores. Por lo tanto, un solo pico corto no es suficiente para predecir que vendrá la segunda ola.
Como algunos podrían sospechar, un virus no viene y luego desaparece para siempre. Por ejemplo, recientemente se han vuelto a detectar casos de gripe porcina.
Dudo que podamos erradicar completamente el virus (lo que estamos intentando hacer actualmente). Más bien, se convertirá en algo con lo que los humanos tendremos que vivir. Habrá puntos calientes en un futuro próximo.
Sin embargo, no espero ver una nueva segunda ola similar a la primera en un futuro próximo. Lo que ocurra el próximo año en enero/febrero, sólo el tiempo lo dirá.