Алгоритм, созданный с помощью глубокого обучения, находит потенциальные терапевтические цели по всему геному


Команда исследователей из Технологического института Нью-Джерси (NJIT) и Детской больницы Филадельфии (CHOP) с помощью машинного обучения разработала алгоритм, который помогает прогнозировать участки метилирования ДНК — процесс, который может изменить активность ДНК без изменение его общей структуры — и может выявить механизмы, вызывающие заболевание, которые в противном случае были бы упущены с помощью обычных методов скрининга.

Статья была опубликована в Интернете на этой неделе журналом Nature Machine Intelligence .

Метилирование ДНК участвует во многих ключевых клеточных процессах и является важным компонентом экспрессии генов. Точно так же ошибки в метилировании могут быть связаны с различными заболеваниями человека. Хотя инструменты геномного секвенирования эффективны при выявлении полиморфизмов, которые могут вызывать заболевание, те же методы не могут уловить эффекты метилирования, потому что отдельные гены по-прежнему выглядят одинаково. В частности, были предприняты значительные усилия по изучению метилирования ДНК по N6-аденину (6 мА) в эукариотических клетках, включая клетки человека, но, хотя геномные данные доступны, роль метилирования в этих клетках остается неуловимой.

«Раньше методы, которые были разработаны для идентификации этих сайтов метилирования в геноме, были очень консервативными и могли смотреть только на определенные длины нуклеотидов в данный момент времени, поэтому большое количество сайтов метилирования было упущено», — сказал Хакон Хаконарсон. MD, PhD, директор Центра прикладной геномики (CAG) при CHOP и один из старших соавторов исследования. «Нам нужно было разработать лучший способ идентификации и прогнозирования сайтов метилирования с помощью инструмента, который мог бы идентифицировать эти мотивы по всему геному, которые могут иметь сильное функциональное воздействие и потенциально могут вызывать болезни».

Чтобы решить эту проблему, с которой сталкивается исследовательское сообщество, CAG и ее партнеры из NJIT обратились к глубокому обучению. Чжи Вэй, доктор философии, профессор информатики в NJIT и старший соавтор исследования, работал с Хаконарсоном и его командой над разработкой алгоритма глубокого обучения, который мог бы предсказать, где происходят эти сайты метилирования, что затем помогло бы исследователям определить влияние, которое они могут оказать на определенные близлежащие гены.

Вэй называет свою программу Deep6mA. Чтобы предсказать, где могут быть обнаружены эти сайты метилирования, Вэй руководил разработкой нейронной сети, которая представляет собой модель машинного обучения, которая пытается учиться аналогично мозгу. Нейронные сети и раньше использовались в клеточных исследованиях, но это их первое применение для изучения сайтов метилирования ДНК в естественных многоклеточных организмах.

Вэй назвал четыре преимущества нового метода: автоматизация представления признаков последовательности с разными уровнями детализации; интеграция широкого спектра последовательностей метилирования, фланкирующих интересующие гены; обеспечение возможности визуализации присущих мотивов последовательности для интерпретации; и содействие разработке моделей и прогнозированию крупномасштабных геномных данных.

Исследовательская группа применила этот алгоритм к трем различным типам репрезентативных организмов: A. thaliana, D. melanogaster и E.coli, первые два из которых являются эукариотическими. Deep6mA смог идентифицировать сайты метилирования 6mA с точностью до одного нуклеотида или базовой единицы ДНК. Даже в этом первоначальном подтверждающем исследовании исследователи смогли визуализировать регуляторные паттерны, которые они не могли наблюдать с помощью ранее существовавших методов.

«Одним из ограничений является то, что предлагаемый нами прогноз основан исключительно на информации о последовательности», — сказал Вэй в своем обсуждении исследования. «Является ли кандидат участком 6 мА или нет, также будет зависеть от многих других факторов. Метилирование, включая 6 мА, — это динамический процесс, который будет меняться в зависимости от клеточного контекста. В будущем мы хотели бы принять во внимание другие факторы [такие как as] экспрессии гена. Мы надеемся предсказать 6 мА в клеточном контексте путем интеграции других данных «.

«Мы уже знаем, что у ряда генов есть механизм, вызывающий заболевание, вызванный метилированием, и хотя это исследование не проводилось на человеческих клетках, модели эукариотических клеток были очень сопоставимы», — сказал Хаконарсон. «Ученые-геномисты, стремящиеся воплотить свои открытия в клиническое применение, сочтут этот инструмент очень полезным, а уровень точности может в конечном итоге привести к открытию конкретных клеток или мишеней, которые являются кандидатами на терапевтическое вмешательство».


Добавить комментарий