Машинное обучение хорошо помогает выявлять сигналы, которые человек может не заметить. Исследователи из Лос-Аламоса использовали его в созданной в лаборатории симуляции землетрясения, чтобы предсказать время, оставшееся до разрушения разлома.
Мы уже видели, как машинное обучение применяется в различных сценариях, поэтому можно подумать, что новость о том, что машинное обучение предсказания землетрясений в лаборатории показывает многообещающие результаты, не является чем-то необычным. Однако если вы геолог, то это действительно интересно. Процитируем первое предложение раннего черновика отчета, который был принят к публикации в Geophysical Research Letters:
Прогнозирование разрушения разломов является фундаментальной, но труднодостижимой целью в науке о землетрясениях.
Исследование проводится в Национальной лаборатории Лос-Аламоса, и его ведущий исследователь Пол Джонсон объясняет:
Новизна нашей работы заключается в использовании машинного обучения для обнаружения и понимания новой физики разрушения, посредством изучения записанного слухового сигнала с экспериментальной установки. Я думаю, что будущее физики землетрясений будет в значительной степени зависеть от машинного обучения для обработки огромного количества необработанных сейсмических данных. Наша работа представляет собой важный шаг в этом направлении.
Аннотация статьи, написанной Джонсоном в соавторстве с Бертраном Руэ-Ледюком, Клаудией Халберт, Николасом Лабберсом, Киптоном Барросом и Колином Хамфрисом, посвящена геофизике:
Мы применяем машинное обучение к наборам данных, полученных в ходе лабораторных экспериментов по сдвигу, с целью выявления скрытых сигналов, которые предшествуют землетрясениям. Здесь мы показываем, что, прослушивая акустический сигнал, испускаемый лабораторным разломом, машинное обучение может с большой точностью предсказать время, оставшееся до его разрушения. Эти прогнозы основаны исключительно на мгновенных физических характеристиках акустического сигнала и не используют его историю. Удивительно, но машинное обучение выявляет сигнал, излучаемый из зоны разлома, который ранее считался низкоамплитудным шумом и который позволяет прогнозировать разрушения на протяжении всего цикла землетрясений в лаборатории. Мы пришли к выводу, что этот сигнал возникает из-за непрерывных движений зерен в желобе разлома при смещении блоков разлома. Мы полагаем, что применение этого подхода к непрерывным сейсмическим данным может привести к значительному прогрессу в выявлении неизвестных в настоящее время сигналов, в обеспечении нового понимания физики разлома и в установлении границ времени разрушения разлома.
Метод машинного обучения, использованный для прогнозирования времени, оставшегося до разрушения в симуляции землетрясения, — это метод Random Forest, который прогнозирует время, оставшееся до следующего разрушения, путем усреднения прогнозов 1000 деревьев решений для каждого временного окна.
Как показано на рисунке выше, каждое дерево делает свое предсказание (узел с белым листом), следуя серии решений (цветные узлы), основанных на особенностях акустического сигнала во время текущего окна). РФ предсказывает (синяя линия) на данных, которые оно никогда не видело (тестовые данные) с 90% доверительным интервалом (синяя заштрихованная область). Прогнозы хорошо согласуются с фактическим временем, оставшимся до отказа (красная кривая).
Особым успехом этого исследования стало то, что оно выявило новые сигналы, которые ранее считались низкоамплитудным шумом и которые предоставляют информацию для прогнозирования на протяжении всего цикла землетрясений. Как поясняется в статье:
Удивительно, но модель RF точно предсказывает отказ не только тогда, когда отказ неизбежен, но и на протяжении всего цикла лабквейка, демонстрируя, что система непрерывно движется к отказу на протяжении всего цикла напряжения. Это неожиданно, поскольку импульсивные предвестники наблюдаются только тогда, когда система находится в критическом напряженном состоянии.
Заглядывая в следующий этап исследований, перенося их из лаборатории на саму Землю, авторы статьи делают вывод:
Независимо от того, удастся ли применить ML-подходы к непрерывным сейсмическим или другим геофизическим данным для получения информации о времени землетрясений (не говоря уже о магнитуде землетрясений), этот подход может выявить неопознанные сигналы, связанные с неразведанной физикой разломов. Кроме того, этот метод может быть полезен для прогнозирования разрушения широкого спектра промышленных и природных материалов. В настоящее время технологии находятся на стыке значительных достижений в области измерительной техники, машинного обучения, способности обрабатывать огромные массивы данных и более быстрых компьютеров. Таким образом, создана основа для потенциально значительных достижений в науке о землетрясениях.
Что касается компьютерщиков, то это, похоже, возможность для проверки методики машинного обучения RF.