Часть 1: Мои выводы из полевых исследований и медицинского сотрудничества

Прежде чем я углублюсь в предмет, позвольте мне дать вам некоторый контекст. Я научный сотрудник, работаю над проектированием моделей глубокого обучения (DL) и разработкой полностью автоматизированных диагностических инструментов на основе искусственного интеллекта в области биомедицинской визуализации. Короче говоря, я разрабатываю алгоритмы и конвейеры DL в рамках классификации изображений, обнаружения объектов, семантической сегментации, сегментации экземпляров и глубокой кластеризации.

К настоящему времени вы, должно быть, сделали вывод, что в моей биографии нет ни капли «медицины» или «биологических наук». По правде говоря, биология была предметом, которого я абсолютно боялся в школе. Никогда не знаешь, что приготовили для тебя Фортуна и ее Колесо . Вскоре я несколько раз посещал нашу партнерскую больницу для клинической проверки и сбора данных. Все, что потребовалось, чтобы принять эту идею, - это смещение точки зрения. работы над постановкой биомедицинской проблемы.

Примечание. Подробная информация о совместных проектах Spectrum Lab, IISc, является конфиденциальной. Поэтому я не беру прямого упоминания о постановке задачи. Мотив написания этой статьи - исключительно обогащение знаний посредством экспериментального обучения. В следующих разделах рассказывается о моих знаниях - надеюсь, мой опыт просветит вас! 🌟

Ценить разные точки зрения

«Лучший способ« узнать »что-то - в контексте другой дисциплины», - Леонард Бернстайн.

Формулировку биомедицинской проблемы можно рассматривать с медицинской и технической точки зрения. Чтобы понять это, рассмотрим пример обнаружения злокачественной опухоли. Группа энтузиастов DL могла бы найти способы оптимизации алгоритмов обнаружения объектов для обнаружения злокачественных / доброкачественных опухолей, в то время как онкологи используют свой опыт для диагностики. Представьте себе сценарий, в котором оба объекта не работают в тандеме. Это можно сравнить с разработкой новой модели истребителя без какого-либо взаимодействия между пилотами (целевыми пользователями), авиаконструкторами и производителями комплектующих для самолетов.

Что может быть лучше, чем обсуждение проблем, с которыми сталкиваются заинтересованные стороны, для детализации различных взглядов на одну тему? За несколько посещений я понял, что наши технические проблемы и задачи врачей такие же разные, как мел и сыр! Рис. 2 суммирует мои наблюдения относительно диагностического программного инструмента.

Data Science Cognoscenti против совместной команды

На этом этапе мы собираемся рассмотреть следующие вопросы с точки зрения специалиста по данным (Олли). Сможет ли Олли самостоятельно ответить на следующие вопросы?

  • Какие устройства сбора изображений используются для решения проблемы Олли ? Если оборудование различается или датчики имеют разные характеристики, то распределение данных будет различаются. Проще говоря, если Олли обучит свою модель прогнозирования с помощью данных из распределения-1 и проверит модель по данным из распределения-2, она получит ошибочные результаты.
  • Требуется ли улучшение изображения? Олли может потребоваться включить методы очистки данных и устранения шумов на основе четкости изображения.
  • Насколько серьезным является состояние или патология? Серьезные заболевания (например, рак) требуют более низкой погрешности, ложноположительных и ложноотрицательных результатов.
  • Хотя модели DL извлекают функции высокого и низкого уровня, следует ли Олли рассматривать какие-либо дополнительные функции, созданные вручную?
  • Как врач ставит правильный диагноз? Давайте рассмотрим, что Олли разрабатывает модель DL, исходя из того, что онкологи делают ставку на визуальное восприятие, т. е. на цвет, текстуру и глубину опухоли. Что, если расположение опухоли и жизненно важные органы тоже играют важную роль?
  • Какие риски связаны и какая степень риска приемлема? Несомненно, опасность для здоровья может иметь тяжелые последствия . Поэтому Олли должен узнать о дополнительных симптомах, отклонениях, стандартах эффективности, необходимости срочной диагностики и т. д. То, что кажется полиповидным, на самом деле может быть злокачественной опухолью - представьте, что вы ошибаетесь!
  • Сколько случаев встречается ежегодно? Это позволит Олли оценить количество выборок данных, которые она может собрать. Большое количество может усилить аргумент в пользу полностью автоматизированных диагностических инструментов или других платформ автоматизации.
  • Какова продолжительность и стоимость процедур? Олли хотел бы создать устойчивое, надежное, эффективное с вычислительной точки зрения, доступное и точное технологическое решение (аппаратное обеспечение / программное обеспечение), что дешевле существующих на рынке.
  • С какими проблемами сталкиваются врачи? Олли следует подумать, на самом деле собираются ли врачи использовать какие-либо вспомогательные технологии. Например, врачу может не понадобиться диагностический инструмент для обнаружения кожных язв, поскольку их легко идентифицировать.
  • Было бы предпочтительнее решение, работающее в режиме реального времени? Если у пациента интенсивной терапии есть активная область кровотечения в желудке, врач обязан немедленно принять меры, например прижечь пораженные участки, чтобы уменьшить кровотечение. Он не сможет использовать диагностическое приложение, в котором ему придется вручную вводить отдельные изображения для подтверждения своего диагноза.
  • Как будут проводиться клинические проверки? В некоторых случаях врачи могут быть не в состоянии подтвердить выводы Олли только на основе визуального восприятия. Например, онколог может потребовать второго этапа проверки (биопсии), проведенного гистопатологом, чтобы определить, является ли опухоль злокачественной.
  • Существуют ли какие-либо стандарты эффективности? Для таких процедур, как глаукома, проверка степени тяжести проводится в соответствии со стандартами ICD - 9 и DDLS.

Сбор данных - непростая задача для приложений биомедицинской визуализации

Отсутствие аннотированных данных может стать серьезным недостатком, когда дело доходит до обучения глубоких нейронных сетей. Нельзя просто очистить пару веб-сайтов, пометить данные вручную без специалиста или провести опрос - чтобы создать обширный репозиторий медицинских данных (это не оскорбление для поклонников НЛП). Вдобавок ко всему, медицинские эксперты иногда не могут точно отметить пораженные области.

Что произойдет, если вы попробуете аннотировать несколько примеров самостоятельно? Я принялся за аннотацию данных, помня о том, чему меня научили врачи. К моему разочарованию, границы поражений были неоднозначными и было несколько вариантов одной и той же аномалии. Кроме того, я неправильно определил нормальную область (большие ярко-красные пугающие полосы) и аномальные области (крохотную мягкую пурпурную массу на периферии). 😝

Пища для размышлений: Как модель могла бы распознать аномалию, если бы у нее было несколько вариантов, таких как кластеры, пятнистые, зернистые и вязкие массы? Что, если модель начнет изучать более крупные красные области вместо фиолетовой?

Когда мои навыки аннотации ниндзя обернулись против меня, я прибег к слабо контролируемому обучению и альтернативам искусственного синтеза данных с использованием GAN / передачи текстур. Я довольно оптимистично получил несколько искусственных образцов, только чтобы понять, что целевое распределение, изученное моей моделью, не дает визуально реалистичных изображений.

«Как кровь может быть прозрачной? Мы не должны видеть ткань под вязкой массой. »- Врачи

Впоследствии я также узнал, что фон (нормальная область) изображения имеет такое же значение, как и передний план (аномальная область), поскольку некоторые поражения зависят от местоположения. Это был настоящий облом. Иногда лучше полагаться на медицинских экспертов - даже если для этого требуются часы полевых работ, - чтобы получить надежные ручные аннотации.

Продажа идеи доктору

Начнем с того, что нельзя легкомысленно уйти, предоставив врачу слабое доказательство концепции, цели или обоснования (просто для того, чтобы вывести некоторые исследовательские публикации из проекта). Опытные специалисты смогут увидеть ваше решение раньше, чем вы его узнаете. Конкретизируйте результаты, подробно описывая, какую пользу они принесут врачам и пациентам. В то же время избегайте сложных описаний алгоритмов и технических жаргонов - это только рассердит врачей. Вот несколько хитростей, которые я освоил.

Упростите концепцию

Во-первых, изображение, объясняющее новичку применение, новизну, объем и производительность предлагаемого решения. Ключ состоит в том, чтобы начать с общего обзора / «общей картины» и постепенно погрузиться в подробности более низкого уровня (только если врач проявляет любопытство и просит вас уточнить конкретную тему). При составлении содержания презентации поставьте себя на место врача. После этого спросите любого из своих друзей-медиков, что они сочтут подходящим, если вы представите им формулировку своей проблемы.

Используйте инструменты визуального обучения

Помните, как ваш школьный преподаватель биологии использовал анимационные видеоролики для описания различных систем и функций организма? Вы когда-нибудь использовали видео Khan Academy или TED-Ed, чтобы удовлетворить свое любопытство? Эти платформы демонстрируют силу визуального обучения.

Использование анимированных видеороликов, инфографики или концептуальных карт может помочь объяснить сложные конвейеры и рабочие процессы.

Уделите несколько минут, чтобы посмотреть видео выше. Спросите себя, как бы вы объяснили это новичку в области техники и медицины, в течение 2 минут. Обратите внимание, что ваша стратегия должна быть такой, чтобы человек мог вспомнить проект в течение нескольких дней по крайней мере. После этого нужно ли мне обосновывать, почему нужно создавать видео-прототип продукта здравоохранения?

Врачи заботятся о показателях эффективности

«Какой показатель эффективности вы использовали и почему?»

Просто сказать врачу, что я использовал точность / отзыв / F-Score / AUROC - потому что это упоминалось в соответствующей академической литературе - было явно недостаточно. Мои современные результаты почти не учитывались, если бы я не мог привести веские доводы в пользу выбора определенных показателей.

Простой пример может подчеркнуть необходимость правильных параметров производительности. Фиг.5 (A) представляет собой аннотацию микроаневризм на изображении глазного дна. Если модель сегментации ошибочно предсказывает карту сегментации 5 (B), будут наблюдаться очень высокие значения точности (›98 +%). К сожалению, ни одной микроаневризмы не обнаружено. Здесь на помощь приходит чуткость!

Большой вопрос

Очень немногие врачи примут идею использования технологий, которые заменят их знания и профессиональные обязанности. Если вы обратитесь к врачу и заявите, что ваше программное обеспечение будет интерпретировать ультразвуковые изображения лучше, чем сам врач, высока вероятность того, что вы будете получать снисходительные замечания на протяжении всего сеанса.

«Что может этот инструмент, чего я или имеющееся у меня оборудование не могу сделать эффективно?» - врачи

Этот вопрос должен иметь первостепенное значение, если кто-то хочет работать над приложением для здравоохранения. Для любого совместного предприятия врачи в идеале будут искать взаимовыгодное, эффективное решение, которое либо ново, либо значительно лучше существующих (насколько вы знаете, они тоже следуют правилу 10X. неосознанно). В любом случае, нужно, чтобы врач чувствовал себя вовлеченным, а ее знания / опыт всегда ценились. Упомянув что-нибудь столь простое, как: « Вспомогательные технологии, сокращающие время диагностики »было бы гораздо лучшим описанием, чем заявить, что« этот инструмент может снизить потребность в медицинских специалистах ».

Для начала составьте список того, какую пользу ваше оборудование / программное обеспечение принесет местному медицинскому сообществу. Ваше решение может быть сосредоточено на:

  1. Разработка более совершенных устройств для получения изображений.
  2. Причинение меньшего дискомфорта пациенту.
  3. Сокращение времени экспертной оценки.
  4. Перепроектирование оборудования для создания доступного оборудования.
  5. Предоставление вспомогательных технологий для уменьшения диагностических ошибок.
  6. Разработка инструментов предварительного скрининга для конкретной патологии.
  7. Предоставление инструментов моделирования / визуализации данных.
  8. Разработка многоцелевого приложения для пациентов.

(Этот список ни в коем случае не является исчерпывающим).

Стоит потратить некоторое время на чтение об успешных медицинских и технических совместных проектах, чтобы понять факторы, которые выделяют их для финансирования (99Dots - хорошее место для начала).



Проведите умные параллели

Естественно заметить разрыв между функциями вашего медицинского приложения и восприятием приложения врачом. Врачу может потребоваться время, чтобы визуализировать дизайн и использование приложения, если вы не покажете ему прототип. Чтобы восполнить этот пробел, я обратился к инструментам создания макетов и прототипов пользовательского интерфейса, чтобы донести свои идеи до людей.

Когда у врачей все еще не было двусмысленности в том, как будет выглядеть конечный продукт, я понял, что соответствующая аналогия приведет к необычному образу мыслей.

Врачи могут обращаться к медицинской терминологии; найдите существующую медицинскую процедуру / инструмент, которые передают вашу идею. Например, мы обнаружили сходство между нашим приложением и отчетом ЭКГ. Последний состоит из демографических данных пациента, отметок времени и прогнозов - все они являются одними из основных функций нашего приложения.

Что может пойти не так

Будьте прозрачны при объяснении любых ограничений предлагаемого решения, чтобы врач знал о связанных с этим рисках. То, что может быть ошибкой из-за недостаточной подгонки модели, может привести к серьезным последствиям (из-за неправильной диагностики).

Только врач должен решить, стоит ли рисковать.

Уточните золотой стандарт и допустимую норму на случай ошибок, ориентируясь на любую медицинскую проблему. Помните, что превосходство передовых достижений на некоторых конференциях по ИИ не гарантирует, что ваше решение будет принято медицинским сообществом.

Опишите свой образец набора данных (даже если он общедоступен)

Одним из преимуществ работы со старшими врачами является то, что вы учитесь сталкиваться с неожиданными вопросами. Во время посещения меня попросили описать демографические данные пациента на основе используемого общедоступного репозитория наборов данных.

«Каково количество пациентов, у них было взято несколько образцов?»

«Каковы характеристики устройства для сбора информации и этническая принадлежность людей?»

Я мало знал, что врачи пытались представить, как наше решение поможет местным массам.

Когда я спросил о необходимости этих подробностей, врачи объяснили, что 4 0% патологий в моем наборе данных чрезвычайно редки в Индии и распространены в западных странах. Следовательно, разработка прогнозирующей модели Модель таких редких аномалий не принесла бы особого смысла в контексте Индии. Во-вторых, устройства получения изображений, используемые в западных странах, были намного более совершенными и дорогими по сравнению с устройствами, используемыми в местных больницах; обучение наших моделей DL на изображениях с высоким разрешением с таких устройств может не помочь медицинскому сообществу в Индии.

Перспективы медицинских исследований

Должен сказать, что мне очень повезло работать с такими старшими врачами в одной из крупнейших государственных больниц моей страны. Поскольку нам нужно было предложить наше решение внешним правительственным агентствам, они преподали мне важный урок из первых рук.

«Ваша (техническая) команда должна предложить немного пряника, чтобы убедить вышестоящие органы в необходимости внешнего сотрудничества».

Проще говоря, важно выделить все преимущества, предлагаемые другой стороне в условиях совместной работы. Обоснуйте, что их сообщество выиграет, уделив время вашему проекту.

В этом контексте мы подробно рассказали о том, как наше исследование может помочь исследованиям врачей. Как и ученые, врачи публикуют свои работы на известных медицинских конференциях и в журналах. Пока энтузиасты ИИ публикуют свои исследования полностью автоматизированных решений, их медицинские партнеры могут одновременно писать об открытии белка, результатах тематического исследования или первой в своем роде процедуре! Врачи, безусловно, хотели бы изучить область, которая стимулирует интеллектуальный рост и дает хорошие возможности для исследования.

Дайте врачам повод потратить драгоценное время из их загруженного графика (состоящего из непрерывных смен и бессонных ночей, перемежающихся непредвиденными случаями) для проекта.

Примечание. Я благодарен своему профессору за руководство моим проектом. Часть 2 скоро выйдет! Надеюсь, вам это понравилось. Не стесняйтесь комментировать. : D

[1] Роннебергер, Олаф, Филипп Фишер и Томас Брокс. «U-net: сверточные сети для сегментации биомедицинских изображений». Международная конференция по медицинской обработке изображений и компьютерному вмешательству. Спрингер, Чам, 2015 г.