Исследователи из Университета Цукубы создали новую программу искусственного интеллекта для автоматической классификации стадий сна мышей, которая сочетает в себе два популярных метода машинного обучения. Алгоритм, получивший название «MC-SleepNet», обеспечивает точность, превышающую 96%, и высокую устойчивость к шумам в биологических сигналах. Использование этой системы для автоматического аннотирования данных может значительно помочь исследователям сна при анализе результатов своих экспериментов.
Ученые, изучающие сон, часто используют мышей в качестве животных моделей, чтобы лучше понять, как изменяется активность мозга на разных этапах. Эти фазы можно классифицировать как бодрствование, быстрый сон (быстрое движение глаз) и сон без быстрого сна. Раньше исследователи, которые отслеживали мозговые волны спящих мышей, в конечном итоге получали горы данных, которые требовалось кропотливо маркировать вручную, часто группами студентов. Это было серьезным препятствием в исследовании.
Теперь исследователи из Университета Цукубы представили программу для автоматической классификации стадии сна, которую пережила мышь, на основе сигналов электроэнцефалограммы (ЭЭГ) и электромиограммы (ЭМГ), которые регистрируют электрическую активность мозга и тела. соответственно. Они объединили два метода машинного обучения, сверточные нейронные сети (CNN) и рекуррентные нейронные сети с долговременной краткосрочной памятью (LSTM), чтобы достичь точности, превосходящей точность лучших существующих автоматических методов.
«Машинное обучение — это захватывающая новая область исследований с важными приложениями, которые сочетают медицину с информатикой. Это позволяет нам автоматически классифицировать новые данные на основе помеченных примеров», — объясняет корреспондент Казумаса Хори. Это особенно ценно, когда закономерности, на которые следует обратить внимание, не очень хорошо известны, как, например, стадии сна. Таким образом, алгоритм может «научиться» принимать сложные решения, не будучи явно запрограммированным. В этом проекте точность была очень высокой из-за использования большого набора данных. Имея более 4200 биологических сигналов, это был самый большой набор данных за любой сон. исследований. Кроме того, благодаря внедрению CNN алгоритм показал высокую устойчивость к индивидуальным различиям и помехам.
Основным достижением в этой работе стало разделение задачи между двумя методами машинного обучения. Сначала была использована CNN для извлечения интересующих объектов из записей электрической активности мозга и тела. Затем эти данные были переданы в LSTM, чтобы определить, какие функции наиболее характерны для фазы сна, в которой находилась мышь. «Мы с оптимизмом надеемся, что сможем применить эту работу к классификации стадий сна у людей», — говорит старший автор исследования Хироюки Китагава. Между тем, эта программа уже может ускорить работу исследователей в области сна, что может привести к более четкому пониманию того, как работает сон.