Представьте, что вы работаете над головоломкой, состоящей из такого количества частей, что даже края кажутся неотличимыми от других в центре головоломки. Решение кажется почти невозможным. И, что еще хуже, эта головоломка находится в футуристическом сеттинге, где части не только многочисленны, но и постоянно меняются. Фактически, вы должны не только решить головоломку, но и «отменить решение», чтобы понять, как каждая деталь полностью фокусирует изображение.
Это проблема, с которой молекулярные и клеточные биологи сталкиваются при сортировке клеток для изучения структурного происхождения организма и способа его развития, известного как морфогенез. Если бы только был инструмент, который мог бы помочь. Газета eLife , вышедшая на этой неделе, показывает, что теперь она есть.
Исследовательская группа EMBL под руководством Анны Крешук, ученого-информатика и эксперта в области машинного обучения, присоединилась к финансируемому DFG консорциуму биологов растений и специалистов по информатике FOR2581, чтобы разработать инструмент, который может решить эту клеточную головоломку. Начав с компьютерного кода и перейдя к более удобному графическому интерфейсу под названием PlantSeg, команда разработала простой метод открытого доступа, обеспечивающий наиболее точный и универсальный анализ развития тканей растений на сегодняшний день. В состав группы входили специалисты из EMBL, Гейдельбергского университета, Мюнхенского технического университета и Института селекции растений им. Макса Планка в Кельне.
«Создание чего-то вроде PlantSeg, которое может использовать трехмерную перспективу клеток и фактически разделять их все, на удивление сложно, учитывая, насколько это легко для людей», — говорит Крешук. «Компьютеры, как правило, не так хороши, как люди, когда дело доходит до большинства задач, связанных со зрением. При всех последних разработках в области глубокого обучения и искусственного интеллекта в целом мы близки к решению этой проблемы сейчас, но она все еще не решена. — не для всех условий. Этот документ представляет собой презентацию нашего текущего подхода, на разработку которого потребовалось несколько лет «
Если исследователи хотят изучить морфогенез тканей на клеточном уровне, им необходимо получить изображение отдельных клеток. Большое количество ячеек означает, что они также должны разделять или «сегментировать» их, чтобы видеть каждую ячейку по отдельности и анализировать изменения с течением времени.
«У растений есть клетки, которые выглядят чрезвычайно регулярными, которые в поперечном сечении выглядят как прямоугольники или цилиндры», — говорит Крешук. «Но у вас также есть ячейки с так называемой« высокой долей », которые имеют выступы, что делает их больше похожими на кусочки головоломки. Их сложнее сегментировать из-за их неправильности».
Команда Крешука обучила PlantSeg работе с трехмерными микроскопическими изображениями репродуктивных органов и развивающихся боковых корней обычного растения Arabidopsis thaliana, также известного как талайский кресс. Алгоритм должен был учесть несоответствия в размере и форме ячеек. Иногда клетки были более правильными, иногда менее. Как отмечает Крешук, это природа ткани.
Прекрасной стороной этого исследования стала микроскопия и изображения, которые она предоставила алгоритму. Результаты проявились в красочных изображениях, на которых очерчены клеточные структуры, что облегчило истинную сегментацию.
«У нас есть гигантские доски головоломки с тысячами ячеек, и мы по сути раскрашиваем каждую из этих частей головоломки в разные цвета», — говорит Крешук.
Биологи растений давно нуждаются в таком инструменте, поскольку морфогенез лежит в основе многих вопросов биологии развития. Этот вид алгоритма позволяет проводить все виды анализа формы, например, анализ изменений формы в процессе развития или при изменении условий окружающей среды или между видами. В статье приводятся некоторые примеры, такие как характеристика изменений в развитии семяпочек, изучение первого асимметричного деления клеток, которое инициирует формирование бокового корня, а также сравнение и сопоставление формы клеток листа двух разных видов растений.
Хотя этот инструмент в настоящее время предназначен специально для растений, Крешук отмечает, что его можно настроить для использования и для других живых организмов.
Алгоритмы на основе машинного обучения, подобные тем, которые используются в основе PlantSeg, обучаются на основе правильных примеров сегментации. Группа обучила PlantSeg работе со многими объемами тканей растений, так что теперь он довольно хорошо обобщается на невидимые данные о растениях. Однако лежащий в основе метод применим к любой ткани с окрашиванием границ клеток, и его можно легко перенастроить для животных тканей.
«Если у вас есть ткани с пограничным окрашиванием, например, клеточные стенки растений или клеточные мембраны животных, этот инструмент можно использовать», — говорит Крешук. «При таком окрашивании и при достаточно высоком разрешении растительные клетки выглядят очень похожими на наши клетки, но они не совсем такие же. Сейчас инструмент действительно оптимизирован для растений. Что касается животных, нам, вероятно, придется переобучать его части, но это сработает. «
В настоящее время PlantSeg является независимым инструментом, но со временем команда Крешук объединит его с другим инструментом, над которым работает ее лаборатория, — рабочим процессом ilastik Multicut.