Не так давно заголовки пестрели сообщениями от исследователей Google, что их система искусственного интеллекта может превзойти специалистов-людей в диагностике рака молочной железы при помощи маммограмм. Казалось, это большая победа, и еще один пример того, как ИИ скоро изменит здравоохранение: будет выявляться больше раковых заболеваний! Меньше ложноположительных результатов! Более дешевая и качественная медицинская помощь!
Попридержите восклицательные знаки. Медицинское обслуживание с использованием машин может принести нам много пользы в предстоящие годы, но результат будет зависеть от способов их использования. Если врачи с самого начала задают неправильные вопросы — заставляют ИИ гоняться за ошибочными предположениями, — эта технология не приживется. И даже может усугубить ранние ошибки.
Это касается и недавнего заявления Google. Они попытались повторить, а затем и превзойти человеческие достижения в том, что по своей сути — глубоко ошибочная медицинская процедура. Если вы не следили за многолетней полемикой по поводу скрининга рака, она сводится к следующему: если на маммографию отправлять людей, у которых нет симптомов, в конечном итоге обнаружится множество вещей, которые выглядят как рак, но не угрожают жизни. По мере того, как ученым стала лучше понятна биология рака, а скрининговые технологии распространились повсеместно, стало понятно, что не каждая опухоль обречена стать смертельной. На самом деле многие люди живут с безобидными формами рака, которые не представляют опасности для их здоровья. К сожалению, стандартные скрининговые тесты лучше всего обнаруживают именно их — медленно растущие опухоли, которые лучше игнорировать.
В теории это не так и плохо. Когда скрининг-тест обнаруживает неопасный рак, можно просто проигнорировать его, верно? Проблема в том, что во время проверки практически невозможно узнать, окажется ли конкретное поражение опасным или нет. На практике большинство врачей склонны лечить любой рак, который выглядит как потенциальная угроза, а вопрос о том, действительно ли маммограммы спасают жизни, активно обсуждается. Кто-то считает, что спасают, кто-то — что нет, но, даже если мы примем за чистую монету самые радужные интерпретации, число жизней, спасенных благодаря этой массовой процедуре, невелико. Некоторые исследователи даже подсчитали, что маммография в целом вредна для здоровья пациентов: совокупный вред с точки зрения чрезмерного лечения, к которому она приводит, и опухолей, вызванных излучением, перевешивает любые преимущества.
Другими словами, системы искусственного интеллекта, такие как у Google, обещают объединить людей и машины, чтобы облегчить диагностику рака, но из-за этого существующие проблемы, такие как избыточное тестирование, гипердиагностика и чрезмерное лечение, могут только усугубиться. Даже не ясно, реальны ли улучшения в показателях ложноположительных и ложноотрицательных результатов. В исследовании Google ИИ показал результаты лучше, чем рентгенологи, которые не были специально обучены изучению маммографии. Но обошел бы ИИ команду более специализированных экспертов? Трудно сказать без проверки. Кроме того, большинство изображений, использованных в исследовании, были созданы с помощью устройств визуализации, сделанных одной компанией. Еще неизвестно, будут ли результаты такими же при использовании изображений с других машин.
Проблема не ограничивается только скринингом рака молочной железы. Отчасти привлекательность ИИ заключается в том, что он может анализировать множество знакомых данных и выбирать переменные, которые мы никогда не посчитали бы важными. В принципе это может помочь диагностировать любое заболевание на ранней стадии, точно так же, как еле различимые всплески сейсмографа предупреждают о землетрясении. (ИИ, кстати, там тоже помогает.) Но иногда эти скрытые переменные действительно не важны. Например, поступает набор данных из клиники, которая делает тесты на рак легких только по пятницам. В результате алгоритм искусственного интеллекта может решить, что сканирование по пятницам с большей вероятностью связано с раком легких. Эти тривиальные корреляции затем будут включены в формулу для дальнейшей постановки диагнозов.
Ранняя диагностика, даже если она точна, не всегда идет во благо. Так, некоторые медицинские проекты ИИ были направлены на раннее выявление болезни Альцгеймера и аутизма, двух состояний, при которых ранняя диагностика не сильно меняет исход дела. Это демонстрирует лишь, что алгоритм может научиться определять характеристики, которые мы учим его находить, но эта способность не влечет за собой жизненно важные для пациентов улучшения.
Некоторые способы использования алгоритмов и машинного обучения могут также создавать новые и сложные проблемы для лечащих врачей. Взять, к примеру, функцию часов Apple для выявления мерцательной аритмии — типа сердечной аритмии, которая служит фактором риска развития инсульта. Мерцательная аритмия лечится с помощью антикоагулянтов, но из-за их побочных эффектов незначительное падение может превратиться в опасную для жизни травму. Если вы действительно рискуете получить инсульт, то оно того стоит. А как насчет людей, чья мерцательная аритмия была обнаружена умными часами? Традиционно это состояние диагностируется, когда кто-то приходит к врачу с характерными жалобами. Теперь же Apple проверяет здоровых людей без симптомов и находит случаи, которые, возможно, никогда не проявились бы клинически. Неясно, будет ли для этой группы пациентов лечение так же полезно.
«Мы не знаем, одинаковы ли эти две группы людей», — говорит кардиолог Венкатеш Мурти. Более плодотворный подход заключается в использовании ИИ для выявления людей, которым доступные методы лечения принесут реальную пользу.
Если ИИ и впрямь станет революционным, ему придется сделать нечто большее, чем просто изменить статус-кво в медицине. И до принятия любого такого подхода важно решить пару фундаментальных вопросов: какую проблему пытается решить технология и как она улучшит результаты лечения пациентов? Поиск ответов на эти вопросы может занять некоторое время.
Вот почему знаменитый девиз Марка Цукерберга «Двигайся быстро и ломай», подходящий для Facebook, не очень хорош для медицины, с искусственным интеллектом или нет. По словам гематолога-онколога Виная Прасада, мышление Кремниевой долины может быть опасным для врачей. Именно такое отношение — когда на карту поставлены жизни, нам необходимо реализовать новые многообещающие идеи как можно быстрее, — и втянуло нас в этот скрининговый хаос. Прасад говорит, что маммография была принята еще до того, как появились все эти данные, а если медицинская процедура стала стандартом, ее очень трудно вывести из употребления. «В культуре, которая привыкла к оперативности и завышенным требованиям, трудно проявить смирение и терпение».