Как графовая аналитика спасла мир: Data Science vs COVID-19

Как графовая аналитика спасла мир: Data Science vs COVID-19

    На протяжении всей истории человечества пандемии являлись причинами глобальных макроэкономических изменений. Например, эпидемия чумы привела к окончательному падению монгольской империи, изменив баланс сил между мусульманским и европейским миром в пользу последнего. А эпидемия испанки, разразившаяся в конце первой мировой войны, привела к окончательной капитуляции Германии. Последняя пандемия COVID-19 изменила мир в 2020 году, хотя ее последствия и количество смертей не столь катастрофичны, как у предыдущих эпидемий. Читайте далее, как огромному мегаполису Москве удалось избежать глобального вымирания с помощью аналитики больших данных.

    Как это было: за кулисами недавней истории

    30 марта 2020 года в Москве был введен локдаун, но еще до этого группа аналитиков, созданная при поддержке правительства РФ, уже начала борьбу с пандемией с использованием современных аналитических технологий. Первый случай заражения COVID-19 в России был зафиксирован 1 марта. Чтобы не допустить экспоненциального роста числа заразившихся, действовать нужно было очень быстро. В предельно сжатые сроки была разработана аналитическая система, позволяющая:

    • оценить вероятность заболевания человека COVID-19;
    • определить степень опасности человека для окружающих, т.е. кого следует изолировать в первую очередь;
    • оценить эффективность принятых мер;
    • провести расследование и найти пути распространения инфекции

    COVID-19 – это инфекционное заболевание, которое передается от человека к человеку при личном контакте, например, в разговоре. Изучая граф контактов между людьми и зная тех, кто заразился, можно с высокой степенью вероятности определить носителей инфекции, которые еще не выявлены как заболевшие.

    На рисунке 1 показан кластер заболевших COVID-19, состоящий из 117 человек и имеющий одного человека в качестве основного источника распространения болезни.

    Графовая аналитика больших данных против COVID-19: реальный кейс

    Рис 1. Кластер заболевших covid-19

    Обнаружив заболевшего, полезно отследить всю цепочку графа контактов, по которой прошла болезнь. Это позволит найти уже выявленных больных, нарушивших режим самоизоляции и обнаружить новых, еще не зафиксированных, носителей болезни. Выявлено, что в среднем один человек заражает троих других, но есть «рекордсмены», заразившие 12 своих знакомых.

    Графовая аналитика больших данных против COVID-19: реальный кейс

    Рис 2. Отслеживание путей распространения болезни

    Своевременная изоляция/вакцинация людей с высокой степенью центральности в графе контактов позволила локализовать болезнь (голубая компонента в левом нижнем углу рис. 3) и снизить количество заболевших со 117 до 8 человек.

    Графовая аналитика больших данных против COVID-19: реальный кейс

    Рис 3. Локализация эпидемии

    Вместо заключения

    Разумеется, графовая аналитика заболевших и заразившихся – это лишь часть всех мер по борьбе с пандемией на ранней стадии ее распространения, которая позволила существенно сократить печальные последствия эпидемия COVID-19. Однако, как только эта пандемия немного поутихла, началась другая не менее опасная эпидемия с факторами социальной-инженерии. Находясь в изоляции, многие люди испытывали чувство тревоги и стресса. Это сделало их уязвимыми для атак финансовых мошенников, о чем мы расскажем в следующей статье.

    Более подробную информацию об алгоритмах кластеризации, мерах центральности узлов графа, нахождения путей и выявления сообществ средствами графовой аналитики больших данных вы узнаете на нашем новом курсе «Графовые алгоритмы. Бизнес-приложения» в лицензированном учебном центре обучения и повышения квалификации для разработчиков, менеджеров, архитекторов, инженеров, администраторов, Data Scientist’ов и аналитиков Big Data в Москве.