Extraction de données des numéros Covid

Aujourd'hui, je voudrais m'attarder un peu sur les données de Covid, car je constate qu'il y a certainement une certaine confusion.
La principale raison pour laquelle j'ai lancé ce projet était de dire que les mesures de confinement étaient liées à la "valeur R" et les scientifiques des médias publics ont déclaré que la valeur R ne pouvait être qu'estimée - ce qui m'a paru incroyable. Voyons donc ce que nous pouvons découvrir.
Quelles sont les données dont nous disposons ?
Je vais prendreDonnées de l'Université John's Hopkins car ils semblent disposer de données plus précises et plus rapides jusqu'à présent. Les deux valeurs les plus importantes que nous avons sont le nombre total de personnes infectées et les personnes actuellement infectées. C'est à partir de ces deux mesures que nous allons tout générer.

Cela ne semble pas beaucoup - pour l'instant - mais trouvons des choses simples à sortir de là :
Préparation des données

Tout d'abord, nous avons besoin de quelque chose avec lequel nous pouvons facilement travailler. Pour cela, j'utiliserai Excel, car il est rapide et facile. Programmer quelque chose avec Python pourrait aussi fonctionner, mais pour un projet court, cela pourrait être trop de travail.
Les données dont nous disposons sont insérées dans deux colonnes comme indiqué ci-dessus. Chaque ligne représente une journée de la pandémie. La pandémie a débuté en Suisse le 25 février.
Nouvelles infections quotidiennes
Les nouvelles infections constituent une valeur susceptible d'être utile. Je ne recueillerai pas ces données à l'université Johns Hopkins, mais je les extrairai des infections totales. Cela permettra d'économiser du temps de copie à l'avenir.
Il suffit de soustraire le total des infections de la veille de celui de la journée en cours.

On constate une légère augmentation des infections au cours des derniers jours, mais on en reparlera plus tard.
Total des guérisons et durée moyenne de l'infection
Les personnes complètement guéries peuvent être prises en calculant le total des infections moins les personnes actuellement infectées. À des fins d'illustration, je compare le graphique avec le total des personnes infectées.

Eh bien, cela ne montre peut-être pas encore grand-chose, sauf que nos hôpitaux sont loin d'être pleins. De plus, nous pouvons en déduire le temps d'infection. En déplaçant le total des guérisons vers la gauche, nous devrions obtenir le temps d'infection s'ils se chevauchent. Pour la Suisse, c'est 16 jours, pour l'Allemagne 15 jours. Cela semble être dans la fourchette de mesure.

Le temps d'infection se révélera plus tard utile pour la valeur R
Guérison par jour

A partir du total des guérisons, nous pouvons générer les guérisons quotidiennes. Comme pour les nouvelles infections quotidiennes, nous soustrayons la guérison totale d'hier de la guérison totale d'aujourd'hui.
C'est là que j'ai obtenu quelques points d'interrogation sur la méthode de collecte de ces données par l'université John Hopkins. Apparemment, depuis le 16 mai, les cas guéris ont été signalés par lots de 100, ce qui me semble très étrange :
Malheureusement, nous devons supposer que les valeurs sont correctes, mais je devrai utiliser la moyenne la moins précise au lieu de la médiane. Je trouve la médiane plus fiable car elle élimine efficacement les valeurs aberrantes. Mais comme nos données sont ici constituées de valeurs aberrantes, nous devons utiliser la moyenne.

En outre, nous pouvons désormais superposer les patients guéris et les patients infectés quotidiennement.

Ce que nous pouvons clairement voir ici, c'est que les patients guéris étaient systématiquement plus nombreux que les nouveaux infectés au 1er avril. Cela signifie essentiellement que les hôpitaux ont eu de moins en moins de travail à partir de ce jour-là.
La mystique R-Value et l'avenir
Pour obtenir la valeur R, il faut d'abord connaître la définition de la valeur R. La définition est la suivante :
"Lanombre prévu de cas générés directement par un cas dans une population où tous les individus sontvulnérables pour l'infection du vin".
comment y arriver ?
nous disposons déjà des informations les plus importantes.
- Combien de temps dure en moyenne une infection ? 16 jours
- Combien de personnes infectées y a-t-il actuellement ?
- Combien y a-t-il de nouvelles infections par jour ?
La valeur R quotidienne peut alors être calculée comme suit :
(nouvelles infections * durée d'une infection) / nombre actuel de personnes infectées
C'est le résultat pour la Suisse :

De plus, j'ai créé mon propre système de mesure pour savoir si les choses s'améliorent ou se détériorent. Plus vert que lu signifie que les choses s'améliorent. Plus de rouge que de vert signifie que les choses empirent.
Plus les valeurs sont élevées ou plus faibles, plus l'effet est intense.

Euh oh - la deuxième vague sera sur nous !
mais lentement pour l'instant. Accédons d'abord à ces deux mesures de l'Allemagne également, avec en arrière-plan la valeur R estimée de Robert Koch :


L'Allemagne présente une courbe similaire. La valeur R croissante a juste eu une petite bosse. De plus, l'infection se répand comme une traînée de poudre à la fin.
Pourquoi ? Examinons les données autour du 15 juin, juste avant le pic :
Nous avons un total de 292 cas actifs et environ 15 nouveaux cas par jour en Suisse. En fait, le nombre est si petit qu'un seul point chaud fera déjà basculer les valeurs de façon radicale. Un seul petit pic ne suffit donc pas pour prédire l'arrivée de la deuxième vague.
Comme certains pourraient le soupçonner, un virus ne vient pas et ne disparaît pas à jamais. Par exemple, des cas de grippe porcine ont été récemment détectés à nouveau.
Je doute que nous puissions éradiquer complètement le virus (ce que nous essayons actuellement de faire). Elle va plutôt évoluer pour devenir quelque chose avec laquelle nous, les humains, devrons vivre. Il y aura des points chauds dans un avenir proche.
Cependant, je ne m'attends pas à voir une nouvelle deuxième vague similaire à la première de sitôt. Seul le temps nous dira ce qui se passera l'année prochaine en janvier/février.