Многопрофильная группа исследователей во главе с Гарвардской медицинской школой и Институтом биомедицинских исследований Novartis создала инструмент машинного обучения с открытым исходным кодом, который определяет белки, связанные с побочными эффектами лекарств.
В работе, опубликованной 18 июня в журнале Lancet EBioMedicine , предлагается новый метод разработки более безопасных лекарств путем выявления потенциальных побочных реакций до того, как лекарственные препараты-кандидаты дойдут до клинических испытаний на людях или выйдут на рынок в качестве одобренных лекарств.
Результаты также позволяют понять, как человеческий организм реагирует на лекарственные соединения на молекулярном уровне как желаемым, так и непреднамеренным образом.
«Машинное обучение — не панацея для открытия новых лекарств, но я верю, что оно может ускорить многие аспекты в сложном и долгом процессе разработки новых лекарств», — сказал соавтор статьи Роберт Иетсваарт, научный сотрудник в области генетики. в лаборатории Стирлинга Черчмана в Институте Блаватника при HMS. Черчман не принимал участия в исследовании.
«Хотя он не может предсказать все возможные побочные эффекты, мы надеемся, что наша работа поможет исследователям выявить потенциальные проблемы на раннем этапе и разработать более безопасные лекарства в будущем», — сказал Иетсваарт.
Побочные эффекты лекарств, известные как побочные реакции на лекарства, варьируются от легких до смертельных. Они могут возникать либо при приеме лекарства по назначению, либо в результате неправильных дозировок, взаимодействия нескольких лекарств или использования не по назначению (прием лекарства для чего-то другого, кроме того, для чего он был одобрен). По данным Министерства здравоохранения и социальных служб США, нежелательные реакции на лекарства являются причиной 2 миллионов госпитализаций в год и происходят от 10 до 20 процентов госпитализаций, согласно руководствам Merck.
Исследователи и медицинские работники на протяжении десятилетий применяли множество тактик, чтобы избежать или, по крайней мере, минимизировать побочные реакции на лекарства. Но поскольку одно лекарство часто взаимодействует с несколькими белками в организме — не всегда ограничиваясь намеченными целями, — может быть трудно предсказать, какие побочные эффекты может вызвать лекарство, если таковые имеются. И если лекарство в конечном итоге вызывает неблагоприятную реакцию, может быть трудно определить, какая из его белковых мишеней может быть ответственной.
В новом исследовании исследователи взяли одну существующую базу данных о нежелательных реакциях на лекарства и другую базу данных из 184 белков, с которыми, как известно, часто взаимодействуют определенные лекарства. Затем они создали компьютерный алгоритм для соединения точек.
«Изучая» полученные данные, алгоритм выявил 221 связь между отдельными белками и конкретными побочными реакциями на лекарства. Некоторые из них были известны, а некоторые были новыми.
Ассоциации показали, какие белки, вероятно, представляют собой мишени для лекарств, которые способствуют определенным побочным эффектам, а какие другие могут быть невинными свидетелями.
Основываясь на том, что она уже «узнала» и подкреплена любыми новыми данными, которые ей предоставляют исследователи, программа может помочь врачам и ученым предсказать, может ли новый кандидат на лекарство вызвать определенный побочный эффект сам по себе или когда в сочетании с определенными лекарствами. Алгоритм может помочь с этими прогнозами до того, как лекарство будет испытано на людях, на основе лабораторных экспериментов, которые показывают, с какими белками взаимодействует лекарство.
Есть надежда повысить вероятность того, что кандидат в лекарство окажется безопасным для пациентов до и после того, как попадет на рынок.
«Это может снизить риски, с которыми сталкиваются участники исследования во время первых клинических испытаний на людях, и минимизировать риски для пациентов, если лекарство получит одобрение FDA и войдет в клиническую практику», — сказал Иетсварт.
Избавьтесь от побочных эффектов
Проект родился на хакатоне количественной науки, организованном Novartis Institutes for BioMedical Research (NIBR) в 2018 году.
Ласло Урбан, руководитель отдела доклинической вторичной фармакологии в NIBR, рассказал о некоторых проблемах, с которыми сталкивается его команда при оценке безопасности новых лекарственных препаратов-кандидатов. Группа аспирантов и докторантов из Бостона на хакатоне прыгнула, чтобы применить свои знания в области науки о данных и машинного обучения.
По словам Урбана, в большинстве случаев проекты с хакатона заканчиваются в виде учебных упражнений. Однако в этом редком случае тесное и продолжительное взаимодействие вдохновленных ученых из разных организаций привело к публикации нового приложения в уважаемом журнале, сказал он.
Четыре члена первоначальной группы хакатона стали соавторами статьи: Иетсваарт из HMS, Седа Арат из лаборатории Джексона, Аманда Чен из Массачусетского технологического института и Саман Фараманд из Массачусетского университета в Бостоне. Арат сейчас работает в Pfizer. Другой член команды, Бумджун Ким из Северо-Восточного университета, является соавтором. Урбан стал старшим автором статьи.
Чтобы решить эту проблему, команда разработала алгоритм машинного обучения и применила его к двум большим наборам данных: один от Novartis с информацией о белках, с которыми взаимодействует каждый из 2000 лекарств, а другой от FDA с 600000 отчетов врачей о неблагоприятных исходах. лекарственные реакции у пациентов.
Алгоритм генерировал статистически надежную информацию о том, как отдельные белки способствуют задокументированным побочным реакциям, — сказал Иетсваарт.
«Это предполагает физиологический ответ на нарушение определенного белка — или гена, который его производит — на молекулярном уровне», — сказал он.
Многие результаты подтверждают предыдущие наблюдения, например, связывание с белком hERG может вызывать сердечную аритмию. Подобные результаты укрепили уверенность исследователей в том, что алгоритм работает хорошо.
Однако другие результаты были неожиданными.
Например, алгоритм показал, что белок PDE3 связан с более чем 40 побочными реакциями на лекарства. Врачи и исследователи в течение многих лет знали, что ингибиторы PDE3 — распространенные противосвертывающие средства для лечения острой сердечной недостаточности, профилактики инсульта и осложнения сердечного приступа, известного как кардиогенный шок, — могут вызывать аритмию, низкое количество тромбоцитов и повышенный уровень ферментов, называемых трансаминазами. возможный индикатор поражения печени. Но не было известно, что нацеливание на PDE3 может повысить риск множества других побочных эффектов, в том числе связанных с мышцами, костями, соединительной тканью, почками, мочевыводящими путями и ухом.
В будущее
Алгоритм также предлагал прогнозы вероятности того, что конкретный препарат вызовет определенную неблагоприятную реакцию.
Насколько точны были эти новые прогнозы? Чтобы выяснить это, исследователи скормили своему алгоритму обновленную информацию. До этого программа извлекала информацию из побочных реакций на лекарства, о которых сообщалось в течение 2014 года. Команда добавила отчеты, собранные с 2014 по 2019 год, некоторые из которых выявили побочные эффекты, которые ранее не наблюдались при применении определенных препаратов.
Конечно, многие из ранее недоказанных прогнозов алгоритма совпадали с недавними реальными отчетами.
«То, что казалось ложноположительным прогнозом, оказалось вовсе не ложным, когда стали доступны новые отчеты», — сказал Иетсваарт.
Чтобы убедиться в надежности алгоритма, команда сравнила его результаты с этикетками лекарств, провела анализ текстов научной литературы и использовала другие методы проверки.
Хотя исследователи максимально усилили модель, она по-прежнему оценивает менее 1 процента из 20 000 генов в геноме человека.
«Наша работа ни в коем случае не является полным пониманием побочных эффектов лекарств, потому что многие другие гены и белки могут вносить свой вклад, для которых не существует анализа или лекарства не тестировались», — сказал Иетсварт.
Ученые могут использовать, улучшать и развивать модель, которая бесплатно размещается в Интернете по адресу https://github.com/samanfrm/ADRtarget .
«Эта работа была результатом совместной работы духа« открытой науки »и коллективных усилий», — сказали Иетсваарт и Урбан.