Исследователи из Facebook и Нью-Йоркского университета утверждают, что разработали три модели машинного обучения, которые могут помочь врачам предсказать, как может развиваться состояние пациента COVID-19. Модели с открытым исходным кодом требуют не более чем последовательности рентгеновских лучей и якобы предсказывают ухудшение состояния пациента до четырех дней вперед и количество дополнительного кислорода (если таковой имеется), которое может ему понадобиться.
Пандемия коронавируса продолжает достигать тревожных высот в США и во всем мире. В США на прошлой неделе число ежедневных смертей превысило 4000 впервые с начала кризиса здравоохранения. Рекордное количество инфекций в сотни тысяч в день создало нагрузку на системы здравоохранения по всей стране, и такие штаты, как Калифорния, изо всех сил пытаются сохранить места в перегруженных отделениях интенсивной терапии.
Huiying Medical, Alibaba, RadLogics, Lunit, DarwinAI, Infervision, Qure.ai и другие разработали алгоритмы искусственного интеллекта, которые якобы диагностируют COVID-19 по рентгеновским лучам с высокой точностью. Однако подход Facebook и Нью-Йоркского университета отличается тем, что они пытаются предсказать долгосрочные клинические траектории. Стэнфорд, Маунт-Синай и поставщики электронных медицинских карт Epic и Cerner разработали модели, которые дают оценки шансов пациента умереть или нуждаться в аппарате искусственной вентиляции легких, но немногие (если таковые имеются) делают эти прогнозы на основе одного сканирования или электронной медицинской карты.
В рамках продолжающегося сотрудничества с подразделением прогностической аналитики NYU Langone Health и кафедрой радиологии исследователи Facebook предварительно обучили систему искусственного интеллекта на двух больших общедоступных наборах данных рентгенографии грудной клетки, MIMIC-CXR-JPG и CheXpert, используя метод самоконтроля обучения под названием Momentum Contrast (MoCo). Самоконтролируемое обучение позволило модели MoCo учиться на рентгеновских снимках в наборах данных, даже когда метки, объясняющие эти снимки, были недоступны.
Следующим шагом была точная настройка модели MoCo с использованием расширенной версии общедоступного набора данных NYU COVID-19. Исследователи построили классификаторы с 26 838 рентгеновскими изображениями от 4914 пациентов, аннотированными, чтобы указать, ухудшилось ли состояние пациента в течение 24, 48 или 72 часов после сканирования. Один классификатор предсказывает ухудшение состояния пациента на основе одного рентгеновского снимка, в то время как другой использует последовательность агрегированных рентгеновских лучей.

Исследователи утверждают, что классификаторы, основанные на серии рентгеновских снимков, превзошли экспертов-людей в прогнозировании потребностей в интенсивной терапии, смертности и неблагоприятных событий до 96 часов вперед. Хотя результаты не обязательно применимы к другим больницам с уникальными наборами данных, исследователи полагают, что новые классификаторы могут быть построены на основе модели MoCo с относительно небольшим количеством ресурсов, возможно, с одним графическим процессором.
«Возможность предсказать, будет ли пациент нуждаться в кислородных ресурсах, также будет первой и может помочь больницам, когда они решат, как распределить ресурсы в ближайшие недели и месяцы. В связи с тем, что число случаев заболевания COVID-19 снова растет по всему миру, больницам нужны инструменты для прогнозирования и подготовки к предстоящим скачкам, поскольку они планируют распределение своих ресурсов, — сообщает команда Facebook в своем блоге. — Эти прогнозы могли бы помочь врачам избежать отправки пациентов из группы риска домой слишком рано и помочь больницам лучше прогнозировать спрос на дополнительный кислород и другие ограниченные ресурсы”.
Недавние исследования, проведенные Университетом Торонто, Векторным институтом и Массачусетским технологическим институтом, показали, что наборы данных рентгенографии грудной клетки, используемые для обучения диагностических моделей, включая MIMIC-CXR и CheXpert, демонстрируют дисбаланс, смещая их против определенных гендерных, социально-экономических и расовых групп. Женщины-пациенты страдают от самых высоких уровней диспропорций, хотя доля женщин в наборе данных лишь немного меньше, чем мужчин. Белые пациенты — 67,6% всех рентгеновских изображений — являются наиболее благоприятной подгруппой, в то время как латиноамериканские пациенты являются наименее благоприятными.
Исследователи Facebook и Нью-Йоркского университета говорят, что они решили эту проблему, предварительно обработав нековидные данные и тщательно отобрав каждый тестовый образец. Но в начале прошлого года американские центры по контролю и профилактике заболеваний, а также Американский колледж радиологии (ACR) и радиологические организации в Канаде, Новой Зеландии и Австралии рекомендовали не использовать компьютерную томографию или рентгеновские лучи для диагностики COVID-19. Это потому, что даже лучшие системы искусственного интеллекта иногда не могут отличить COVID-19 от обычных легочных инфекций, таких как бактериальная или вирусная пневмония.
Отчасти из-за сдержанности в выпуске кода, наборов данных и методов большая часть данных, используемых сегодня для обучения алгоритмов ИИ для диагностики заболеваний, может углубить неравенство. Группа британских ученых обнаружила, что почти все наборы данных о болезнях глаз поступают от пациентов из Северной Америки, Европы и Китая, что означает, что алгоритмы диагностики глазных заболеваний не так хорошо работают для расовых групп из недопредставленных стран. В другом исследовании исследователи из Стэнфордского университета утверждали, что большинство американских данных для исследований, связанных с медицинским использованием ИИ, поступают из Калифорнии, Нью-Йорка и Массачусетса. Исследование алгоритма группой UnitedHealth показало, что он может недооценивать вдвое число чернокожих пациентов, нуждающихся в большем уходе. И растущий объем работ говорит о том, что алгоритмы обнаружения рака кожи, как правило, менее точны при использовании на чернокожих пациентах, отчасти потому, что модели ИИ обучаются в основном на изображениях светлокожих пациентов.
Определение того, насколько надежны алгоритмы Facebook и Нью-Йоркского университета, вероятно, потребует тщательного тестирования в различных системах здравоохранения по всему миру — с согласия пациентов. Исследование, опубликованное в Nature Machine Intelligence, показало, что модель ухудшения COVID-19, успешно развернутая в Ухане, Китай, дала результаты, которые были не лучше броска кости, когда применялись к выборке пациентов в Нью-Йорке. Хотя тщательная тонкая настройка может помочь алгоритму Facebook и Нью-Йоркского университета избежать той же участи, невозможно предсказать, где могут возникнуть предубеждения, что говорит о необходимости проверки перед развертыванием в любом масштабе.