Extraction de données des numéros Covid

Image du titre de l'histoire

Aujourd'hui, je voudrais m'attarder un peu sur les données de Covid, car je constate qu'il y a certainement une certaine confusion.

La principale raison pour laquelle j'ai lancé ce projet était de dire que les mesures de confinement étaient liées à la "valeur R" et les scientifiques des médias publics ont déclaré que la valeur R ne pouvait être qu'estimée - ce qui m'a paru incroyable. Voyons donc ce que nous pouvons découvrir.

Quelles sont les données dont nous disposons ?

Je vais prendreDonnées de l'Université John's Hopkins car ils semblent disposer de données plus précises et plus rapides jusqu'à présent. Les deux valeurs les plus importantes que nous avons sont le nombre total de personnes infectées et les personnes actuellement infectées. C'est à partir de ces deux mesures que nous allons tout générer.

l'image montre des chats de personnes totalement infectées et actuellement infectées

Cela ne semble pas beaucoup - pour l'instant - mais trouvons des choses simples à sortir de là :

Préparation des données

L'image montre un tableau Excel avec quelques chiffres

Tout d'abord, nous avons besoin de quelque chose avec lequel nous pouvons facilement travailler. Pour cela, j'utiliserai Excel, car il est rapide et facile. Programmer quelque chose avec Python pourrait aussi fonctionner, mais pour un projet court, cela pourrait être trop de travail.

Les données dont nous disposons sont insérées dans deux colonnes comme indiqué ci-dessus. Chaque ligne représente une journée de la pandémie. La pandémie a débuté en Suisse le 25 février.

Nouvelles infections quotidiennes

Les nouvelles infections constituent une valeur susceptible d'être utile. Je ne recueillerai pas ces données à l'université Johns Hopkins, mais je les extrairai des infections totales. Cela permettra d'économiser du temps de copie à l'avenir.

Il suffit de soustraire le total des infections de la veille de celui de la journée en cours.

l'image montre les nouvelles infections par jour et la médiane 5d

On constate une légère augmentation des infections au cours des derniers jours, mais on en reparlera plus tard.

Total des guérisons et durée moyenne de l'infection

Les personnes complètement guéries peuvent être prises en calculant le total des infections moins les personnes actuellement infectées. À des fins d'illustration, je compare le graphique avec le total des personnes infectées.

Le graphique montre le total des personnes infectées et le total des personnes guéries. Les deux courbes sont similaires, à l'exception d'un décalage horizontal

Eh bien, cela ne montre peut-être pas encore grand-chose, sauf que nos hôpitaux sont loin d'être pleins. De plus, nous pouvons en déduire le temps d'infection. En déplaçant le total des guérisons vers la gauche, nous devrions obtenir le temps d'infection s'ils se chevauchent. Pour la Suisse, c'est 16 jours, pour l'Allemagne 15 jours. Cela semble être dans la fourchette de mesure.

Le graphique indique le nombre total de personnes infectées et le nombre total de personnes guéries. Ce temps est décalé du nombre de jours de sorte qu'ils se chevauchent

Le temps d'infection se révélera plus tard utile pour la valeur R

Guérison par jour

Capture d'écran des étranges découvertes

A partir du total des guérisons, nous pouvons générer les guérisons quotidiennes. Comme pour les nouvelles infections quotidiennes, nous soustrayons la guérison totale d'hier de la guérison totale d'aujourd'hui.

C'est là que j'ai obtenu quelques points d'interrogation sur la méthode de collecte de ces données par l'université John Hopkins. Apparemment, depuis le 16 mai, les cas guéris ont été signalés par lots de 100, ce qui me semble très étrange :

Malheureusement, nous devons supposer que les valeurs sont correctes, mais je devrai utiliser la moyenne la moins précise au lieu de la médiane. Je trouve la médiane plus fiable car elle élimine efficacement les valeurs aberrantes. Mais comme nos données sont ici constituées de valeurs aberrantes, nous devons utiliser la moyenne.

Le graphique indique le nombre total de personnes infectées et le nombre total de personnes guéries. Ce temps est décalé du nombre de jours de sorte qu'ils se chevauchent

En outre, nous pouvons désormais superposer les patients guéris et les patients infectés quotidiennement.

le graphique montre les patients guéris par rapport aux patients nouvellement infectés. les patients guéris sont manifestement à la traîne par rapport aux patients infectés

Ce que nous pouvons clairement voir ici, c'est que les patients guéris étaient systématiquement plus nombreux que les nouveaux infectés au 1er avril. Cela signifie essentiellement que les hôpitaux ont eu de moins en moins de travail à partir de ce jour-là.

La mystique R-Value et l'avenir

Pour obtenir la valeur R, il faut d'abord connaître la définition de la valeur R. La définition est la suivante :

"Lanombre prévu de cas générés directement par un cas dans une population où tous les individus sontvulnérables pour l'infection du vin".

comment y arriver ?

nous disposons déjà des informations les plus importantes.

- Combien de temps dure en moyenne une infection ? 16 jours

- Combien de personnes infectées y a-t-il actuellement ?

- Combien y a-t-il de nouvelles infections par jour ?

La valeur R quotidienne peut alors être calculée comme suit :

(nouvelles infections * durée d'une infection) / nombre actuel de personnes infectées

C'est le résultat pour la Suisse :

graphique de la valeur R

De plus, j'ai créé mon propre système de mesure pour savoir si les choses s'améliorent ou se détériorent. Plus vert que lu signifie que les choses s'améliorent. Plus de rouge que de vert signifie que les choses empirent.

Plus les valeurs sont élevées ou plus faibles, plus l'effet est intense.

le graphique montre une mesure que j'ai personnellement trouvée plus utile que la valeur r

Euh oh - la deuxième vague sera sur nous !

mais lentement pour l'instant. Accédons d'abord à ces deux mesures de l'Allemagne également, avec en arrière-plan la valeur R estimée de Robert Koch :

r valeur Allemagne développement des infections Allemagne

L'Allemagne présente une courbe similaire. La valeur R croissante a juste eu une petite bosse. De plus, l'infection se répand comme une traînée de poudre à la fin.

Pourquoi ? Examinons les données autour du 15 juin, juste avant le pic :

Nous avons un total de 292 cas actifs et environ 15 nouveaux cas par jour en Suisse. En fait, le nombre est si petit qu'un seul point chaud fera déjà basculer les valeurs de façon radicale. Un seul petit pic ne suffit donc pas pour prédire l'arrivée de la deuxième vague.

Comme certains pourraient le soupçonner, un virus ne vient pas et ne disparaît pas à jamais. Par exemple, des cas de grippe porcine ont été récemment détectés à nouveau.

Je doute que nous puissions éradiquer complètement le virus (ce que nous essayons actuellement de faire). Elle va plutôt évoluer pour devenir quelque chose avec laquelle nous, les humains, devrons vivre. Il y aura des points chauds dans un avenir proche.

Cependant, je ne m'attends pas à voir une nouvelle deuxième vague similaire à la première de sitôt. Seul le temps nous dira ce qui se passera l'année prochaine en janvier/février.