Как данные помогут победить вирус covid-19

Как данные помогут победить вирус covid-19

Крупнейшие компании, специализирующиеся на медико-биологических науках, здравоохранении и аналитике: Datavant, Health Care Cost Institute, Mirador Analytics, Parexel, SAS, Snowflake, Symphony Health, Verana Health и многие другие объединили усилия и создали ресурс для предоставления, получения и анализа данных реальной клинической практики для борьбы с коронавирусом covid-19.

Мы поговорили с представителем компании-участницы этой инициативы – Александром Жуковым, руководителем департамента решений для здравоохранения SAS Россия/СНГ. И попросили рассказать подробнее об этом ресурсе и о том, почему без него невозможны полноценные исследования вируса.

Пандемия стала неожиданностью для всех. Но реакция на нее была ожидаема – компании самых разных отраслей и размеров объединили усилия, чтобы противостоять вирусу. И сегодня главная цель мирового сообщества – найти работающую вакцину, а также определиться с наиболее эффективными методами лечения.

Данные для спасения

Сделать это возможно, проанализировав огромные массивы данных, которые накоплены за прошедшие полгода. Источниками их выступают электронные медицинские карты, аптеки, куда пациенты приходят за лекарствами, страховые компании, которые владеют реестрами счетов за оказанные медицинские услуги. Однако эти данные затруднительно использовать в исследованиях в их исходном виде, ведь они строго конфиденциальны.

Даже если медицинские или исследовательские лаборатории имеют доступ к ним, то все равно сталкиваются с проблемами, например:
— данные касаются небольшой части населения и не отражают полную картину происходящего;
— нет информации о клинической истории болезни пациента до COVID-19;
— доступен только один тип документов, а не весь необходимый набор сразу;
— данные не обновляются или обновляются с редкой периодичностью.

Кроме того, зачастую у исследователей нет доступа к аналитическим технологиям, с помощью которых необходимо обрабатывать данные. Во многих лабораториях отсутствуют высокопроизводительные базы данных, технологии управления данными, подготовленные аналитики и инструменты искусственного интеллекта, а также облачные платформы, которые могли бы помочь быстрее находить правильные ответы.

Новый ресурс – ключ к более эффективным исследованиям

Именно поэтому компания SAS и решила поддержать инициативу. Фактически это информационно-аналитическая среда, в которой содержатся предоставленные партнерами обезличенные данные, собранные с учетом HIPPA – федерального закона США, устанавливающего правила обмена личной медицинской информацией и ее защиты от несанкционированного использования.

Цель начинания – предоставить ученым централизованный доступ к данным, из которых они смогут извлечь ценную информацию для борьбы с пандемией.

Исследователи могут подключаться к базе данных COVID-19 через аналитическую платформу, проводить крупномасштабные исследования и не нарушать конфиденциальность пациентов при этом.

Из базы можно получить следующие данные: оценка эффективности применения тех или иных медицинских препаратов, влияние демографического положения и условий проживания на уровень заболеваемости, соотношение количества доступных аппаратов ИВЛ и смертность, воздействие строгих карантинных мер на уровень заболеваемости.

Ученые и исследовательские организации, подающие заявки на доступ к базе данных, получают его бесплатно, а их исследования в дальнейшем будут общедоступны и опубликованы на научных ресурсах.

Роль SAS в этой инициативе

SAS в этом проекте предоставляет экспертизу и, конечно, программное обеспечение – решение SAS Health.

Это облачная платформа для работы и анализа медицинских и клинических данных, с возможностью интеграции в процесс анализа и/или подготовки данных open source-инструментов для создания единой, легко управляемой экосистемы. Решение позволяет строить когорты и проводить по ним исследования, выделять эпизоды медицинской помощи и использовать множество классических аналитических инструментов – анализ неструктурированных данных, машинное обучение и другие методы искусственного интеллекта, прогнозные и оптимизационные методы, анализ выживаемости и проч.

Доступ к новейшим аналитическим технологиям многократно увеличивает эффективность работы с базой данных:

— увеличивается скорость обработки данных;
— повышается точность результатов исследований;
— возрастает качество мониторинга, так как данные регулярно обновляются;
— расширяются возможности поиска и изучения корреляций в новейших данных многочисленных исследований, которые не были бы очевидны в одном исследовании;
— повышается эффективность сотрудничества между командами исследователей, есть возможность работать одновременно над одной проблемой, используя одну и ту же аналитическую технологию.

COVID-19: конец близок?

В условиях пандемии крупнейшие компании мира используют то, что у них есть – технологии и интеллект, – чтобы защитить тех, кто им дорог – людей.

Мы смотрим в будущее и понимаем, что у этой общей инициативы есть все шансы стать самым эффективным и мощным орудием в борьбе с коронавирусом. Она объединяет группы исследователей в единую команду, чтобы помочь им сделать то, что они делают лучше других – находить ответы на сложнейшие вопросы в сложные времена.

Фото: Firestock.

Автор: Александр Жуков, руководитель департамента решений для здравоохранения SAS Россия/СНГ.