Методы искусственного интеллекта в медицинской визуализации могут привести к неправильному диагнозу


Согласно новому исследованию, машинное обучение и искусственный интеллект очень нестабильны при реконструкции медицинских изображений и могут приводить к ложноположительным и ложноотрицательным результатам.

Группа исследователей под руководством Кембриджского университета и Университета Саймона Фрейзера разработала серию тестов для алгоритмов реконструкции медицинских изображений на основе искусственного интеллекта и глубокого обучения и обнаружила, что эти методы приводят к бесчисленным артефактам или нежелательным изменениям в данные, среди других серьезных ошибок в окончательных изображениях. Эффекты обычно отсутствовали в методах визуализации, не основанных на искусственном интеллекте.

Это явление было широко распространено в различных типах искусственных нейронных сетей, что позволяет предположить, что проблему нелегко исправить. Исследователи предупреждают, что использование методов реконструкции изображений на основе искусственного интеллекта для постановки диагноза и определения лечения может в конечном итоге навредить пациентам. Их результаты опубликованы в Трудах Национальной академии наук .

«ИИ вызывает большой энтузиазм в области медицинской визуализации, и он вполне может произвести революцию в современной медицине: однако есть потенциальные ловушки, которые нельзя игнорировать», — сказал д-р Андерс Хансен из Кембриджского департамента прикладных наук. Математика и теоретическая физика, руководивший исследованием с доктором Беном Адкоком из Университета Саймона Фрейзера. «Мы обнаружили, что методы искусственного интеллекта очень нестабильны в медицинской визуализации, поэтому небольшие изменения входных данных могут привести к большим изменениям в выходных данных».

Обычное МРТ-сканирование может занять от 15 минут до двух часов, в зависимости от размера сканируемой области и количества снимков. Чем дольше пациент находится внутри аппарата, тем с более высоким разрешением будет окончательное изображение. Однако желательно ограничить количество времени, которое пациенты проводят внутри аппарата, как для снижения риска для отдельных пациентов, так и для увеличения общего количества сканирований, которые могут быть выполнены.

Использование методов искусственного интеллекта для улучшения качества изображений, полученных при сканировании МРТ или других медицинских изображений, является привлекательной возможностью для решения проблемы получения изображения высочайшего качества за наименьшее время: теоретически искусственный интеллект может занять мало времени. -разрешение изображения и превратить его в версию с высоким разрешением. Алгоритмы ИИ «учатся» восстанавливать изображения на основе обучения на основе предыдущих данных и посредством этой процедуры обучения стремятся оптимизировать качество реконструкции. Это представляет собой радикальное изменение по сравнению с классическими методами реконструкции, которые основаны исключительно на математической теории и не зависят от предыдущих данных. В частности, не учатся классическим техникам.

Для надежности любого алгоритма ИИ необходимы две вещи: точность и стабильность. ИИ обычно классифицирует изображение кошки как кошку, но крошечные, почти невидимые изменения в изображении могут заставить алгоритм вместо этого классифицировать кошку, например, как грузовик или стол. В этом примере классификации изображений единственное, что может пойти не так, — это неправильная классификация изображения. Однако, когда дело доходит до реконструкции изображения, например, используемой в медицинской визуализации, есть несколько вещей, которые могут пойти не так. Например, такие детали, как опухоль, могут быть потеряны или добавлены ложно. Детали могут быть скрыты, а на изображении могут появиться нежелательные артефакты.

«Когда дело доходит до критических решений, касающихся здоровья человека, мы не можем позволить, чтобы алгоритмы допускали ошибки», — сказал Хансен. «Мы обнаружили, что малейшее искажение, например, вызванное перемещением пациента, может дать совсем другой результат, если вы используете ИИ и глубокое обучение для восстановления медицинских изображений — это означает, что этим алгоритмам не хватает стабильности, в которой они нуждаются».

Хансен и его коллеги из Норвегии, Португалии, Канады и Великобритании разработали серию тестов для выявления недостатков в медицинских системах визуализации на основе искусственного интеллекта, включая МРТ, КТ и ЯМР. Они рассмотрели три важных вопроса: нестабильность, связанная с крошечными возмущениями или движениями; нестабильность в отношении небольших структурных изменений, таких как изображение мозга с небольшой опухолью или без нее; и нестабильность в отношении изменения количества образцов.

Они обнаружили, что некоторые крошечные движения приводили к множеству артефактов на конечных изображениях, детали были размыты или полностью удалены, а качество восстановления изображения ухудшалось при повторной субдискретизации. Эти ошибки широко распространены в разных типах нейронных сетей.

По мнению исследователей, наиболее тревожными являются ошибки, которые радиологи могут интерпретировать как проблемы со здоровьем, в отличие от тех, которые легко могут быть отклонены из-за технической ошибки.

«Мы разработали тест, чтобы проверить наш тезис о том, что методы глубокого обучения будут нестабильны во всех случаях при медицинской визуализации», — сказал Хансен. «Основанием для нашего прогноза было то, что существует предел того, насколько хорошая реконструкция может быть предоставлена с ограниченным временем сканирования. В некотором смысле современные методы искусственного интеллекта преодолевают этот барьер и в результате становятся нестабильными. Мы математически показали, что существует цена, которую нужно заплатить за эту нестабильность, или, проще говоря: бесплатного обеда до сих пор не существует «.

В настоящее время исследователи сосредотачиваются на определении фундаментальных ограничений того, что можно сделать с помощью методов ИИ. Только когда эти ограничения будут известны, мы сможем понять, какие проблемы можно решить. «Исследования, основанные на пробах и ошибках, никогда не обнаружат, что алхимики не могут делать золото: мы находимся в аналогичной ситуации с современным ИИ», — сказал Хансен. «Эти методы никогда не обнаружат своих собственных ограничений. Такие ограничения можно показать только математически».


Добавить комментарий