Поиск данных по номерам Ковидов

Изображение заголовка рассказа

Сегодня я хочу немного углубиться в данные Ковида, потому что вижу, что здесь определенно есть какая-то путаница.

Главной причиной, по которой я начал этот проект, было то, что меры по блокировке были привязаны к "R-значению", а ученые в общественных СМИ говорили, что R-значение можно только оценить - невероятно для меня. Так что давайте посмотрим, что мы сможем выяснить.

Какие данные мы имеем в нашем распоряжении?

Я собираюсь взятьДанные из Университета Джона Хопкинса так как, похоже, у них пока есть более точные и быстрые данные. Две важнейшие ценности, которые мы имеем, - это общее число инфицированных и людей, инфицированных в настоящее время. Из этих двух метрик мы сгенерируем все.

на картинке показаны чаты полностью инфицированных и в настоящее время инфицированных людей.

Пока не похоже, но давайте найдем несколько простых вещей, которые можно вытащить оттуда:

Подготовка данных

На рисунке показана таблица excel с некоторыми цифрами.

Прежде всего, нам нужно что-то, с чем мы сможем легко работать. Для этого я буду использовать Excel, потому что это быстро и просто. Программирование чего-нибудь на Python тоже может сработать, но для короткого проекта, который может быть слишком трудоемким.

Данные, которые мы вставили, разбиты на две колонки, как показано выше. Каждый ряд представляет собой день пандемии. Пандемия началась в Швейцарии 25 февраля.

Ежедневные новые заражения

Одной из ценностей, которая может быть полезной, являются новые случаи инфицирования. Я не буду собирать эти данные в Университете Джона Хопкинса, но буду извлекать их из общего количества инфекций. Это сэкономит время на копирование в будущем.

Нам просто нужно вычесть общее количество заражений предыдущего дня из общего количества заражений текущего дня.

на изображении показаны новые случаи заражения в день и 5-я медиана.

То, что мы можем видеть, это небольшое увеличение числа инфекций за последние несколько дней, но больше об этом позже.

Общее заживление и средняя продолжительность инфекции

Полностью вылечить можно, рассчитав общее количество инфекций за вычетом инфицированных в настоящее время. Для иллюстрации я противопоставляю график с общим количеством зараженных.

График показывает общее количество инфицированных и полностью излеченных. Обе кривые выглядят похожими, за исключением горизонтального смещения.

Ну, это может показать не так уж много, за исключением того, что наши больницы далеко не полны. Кроме того, мы можем прочитать время заражения. Сдвинув вылеченный итог влево, мы должны получить время заражения, если они пересекаются. Для Швейцарии это 16 дней, для Германии 15 дней. Похоже, что это находится в пределах диапазона измерений.

На диаграмме показано общее число инфицированных и общее число излеченных. Это время сдвинуто на количество дней, так что они пересекаются.

Время заражения позже окажется полезным для R-значения.

Исцелялся в день

Скриншот странных находок

Из полного исцеления мы можем генерировать ежедневное исцеление. Подобно ежедневным новым инфекциям, мы вычитаем вчерашнее полное выздоровление из сегодняшнего полного выздоровления.

Здесь я получил несколько вопросительных знаков о методе сбора этих данных Университетом Джона Хопкинса. По всей видимости, с 16 мая об излеченных случаях сообщается партиями по 100, что мне кажется очень странным:

К сожалению, приходится предполагать, что значения верны, но вместо медианы придется использовать менее точное среднее значение. Я нахожу медиану более надежной, так как она эффективно удаляет отклонения. Но так как наши данные здесь состоят из отклонений, мы должны использовать среднее значение.

На диаграмме показано общее число инфицированных и общее число излеченных. Это время сдвинуто на количество дней, так что они пересекаются.

Кроме того, теперь мы можем накладывать ежедневные исцеленные и ежедневно инфицированные пациенты.

на графике показано ежедневное излечение по сравнению с вновь инфицированными пациентами. Вылеченные пациенты явно отстают от инфицированных.

Здесь ясно видно, что по состоянию на ~ 1 апреля восстановленных пациентов было стабильно больше, чем вновь инфицированных. Это в основном означает, что с того дня в больницах стало работать все меньше и меньше.

Мистическая ценность R-Value и будущее

Чтобы получить R-значение, необходимо сначала знать определение R-значения. Определение следующее:

"Theпрогнозируемое количестве дел, возбужденных непосредственно в связи с тем или иным делом в группе населения, в которой все лица являютсяуязвимый сайт от винной инфекции."

как нам туда добраться?

у нас уже есть самая важная информация.

- Как долго в среднем длится инфекция? 16 дней

- Сколько зараженных людей в настоящее время?

- Сколько новых заражений в день?

Ежедневное значение R может быть вычислено следующим образом:

(новые инфекции * длительность инфекции) / текущее количество инфицированных людей

Это результат для Швейцарии:

диаграмма R-значения

Кроме того, я создал свою собственную метрику, чтобы подчеркнуть, становится ли ситуация хуже или лучше. Больше зелени, чем чтения, означает, что дела идут на поправку. Больше красного, чем зеленого, означает, что все становится хуже.

Чем выше или ниже значения, тем сильнее эффект.

график показывает метрику, которую я лично нашел более полезной, чем r-значение.

Вторая волна будет на нас!

но пока медленно. Давайте сначала познакомимся и с этими двумя метриками из Германии, на заднем плане - угаданная R-Value Роберта Коха:

r стоимость Германия развитие инфекций Германия

У Германии похожая кривая. Возрастающее R-значение только что имело небольшую шишку. Кроме того, событие с инфекцией прыгает, как сумасшедший в конце.

Почему это? Давайте посмотрим на данные около 15 июня, как раз перед пиком:

Всего у нас 292 действующих дела и ~15 новых дел в день в Швейцарии. На самом деле, число настолько мало, что одна "горячая точка" уже кардинально перевернет значения. Поэтому одного короткого всплеска недостаточно, чтобы предсказать приход второй волны.

Как некоторые могут подозревать, вирус не приходит и затем исчезает навсегда. Например, недавно вновь были обнаружены случаи заболевания свиным гриппом.

Я сомневаюсь, что мы сможем полностью искоренить вирус (что мы сейчас и пытаемся сделать). Скорее, он превратится в то, с чем нам, людям, придется жить. В ближайшем будущем будут горячие точки.

Однако я не ожидаю, что в ближайшее время увижу новую 2-ю волну, похожую на первую. Что произойдет в следующем году в январе/феврале, покажет только время.