Когда вы проверяете прогноз погоды утром, результаты, которые вы видите, скорее всего, определяются моделью исследования и прогнозирования погоды (WRF) — комплексной моделью, моделирующей эволюцию многих аспектов окружающего нас физического мира.
«Он описывает все, что вы видите за окном, — сказал Цзяли Ван, ученый-эколог из Аргоннской национальной лаборатории Министерства энергетики США (DOE), — от облаков до солнечного излучения, от снега до растительности». — даже то, как небоскребы мешают ветру ».
Множество характеристик и причин погоды и климата взаимосвязаны и взаимодействуют друг с другом. Ученым еще предстоит полностью описать эти сложные взаимосвязи простыми унифицированными уравнениями. Вместо этого они аппроксимируют уравнения, используя метод, называемый параметризацией, в котором они моделируют взаимосвязи в масштабе, превышающем масштаб реальных явлений.
Хотя параметризация упрощает физику таким образом, что позволяет моделям давать относительно точные результаты за разумное время, они по-прежнему являются дорогостоящими в вычислительном отношении. Ученые-экологи и ученые-вычислители из Аргонны совместно используют глубокие нейронные сети, тип машинного обучения, чтобы заменить параметризацию определенных физических схем в модели WRF, что значительно сокращает время моделирования.
«С помощью менее дорогих моделей мы можем добиться имитационного моделирования с более высоким разрешением, чтобы предсказать, как краткосрочные и долгосрочные изменения погодных условий влияют на локальный масштаб», — сказал Ван, — «вплоть до районов или конкретной критически важной инфраструктуры. «
В недавнем исследовании ученые сосредоточились на планетном пограничном слое (PBL) или самой нижней части атмосферы. PBL — это атмосферный слой, на который деятельность человека влияет больше всего, и он простирается всего на несколько сотен метров над поверхностью Земли. Динамика этого слоя, такая как скорость ветра, профили температуры и влажности, имеет решающее значение для определения многих физических процессов в остальной части атмосферы и на Земле.
PBL — важный компонент модели WRF, но он также является одним из наименее дорогостоящих в вычислительном отношении. Это делает его отличным испытательным стендом для изучения того, как можно таким же образом улучшить более сложные компоненты с помощью нейронных сетей с глубоким обучением.
«Мы использовали 20-летние компьютерные данные из модели WRF для обучения нейронных сетей и двухлетние данные, чтобы оценить, могут ли они предоставить точную альтернативу параметризации на основе физики», — сказала Прасанна Балапракаш, компьютер. ученый и обладатель премии DOE Early Career Award в отделе математики и информатики Аргонна и в Argonne Leadership Computing Facility (ALCF), пользовательском центре DOE Office of Science
Балапракаш разработал нейронную сеть и обучил ее изучать абстрактную взаимосвязь между входами и выходами, передавая ей более 10 000 точек данных (8 в день) из двух мест, одного в Канзасе, а другого на Аляске. Результатом стал алгоритм, который, как уверены ученые, может заменить параметризацию PBL в модели WRF.
Ученые продемонстрировали, что глубокая нейронная сеть, которая учитывает некоторую базовую структуру взаимосвязи между входными и выходными переменными, может успешно моделировать скорость ветра, температуру и водяной пар с течением времени. Результаты также показывают, что обученная нейронная сеть из одного места может предсказывать поведение в соседних местах с корреляцией выше 90 процентов по сравнению с данными теста.
«Сотрудничество между учеными-климатологами и учеными-компьютерщиками имело решающее значение для результатов, которых мы достигли», — сказал Рао Котамарти, главный научный сотрудник и руководитель отдела атмосферных исследований и климатических исследований в Аргоннском отделе наук об окружающей среде. «Использование наших знаний в предметной области делает алгоритм более предсказуемым».
Алгоритмы, называемые нейронными сетями с учетом предметной области, которые учитывают известные взаимосвязи, не только могут более точно предсказывать данные об окружающей среде, но также требуют обучения значительно меньшего объема данных, чем алгоритмы, не учитывающие знания предметной области. p >
Любой проект машинного обучения требует большого количества высококачественных данных, и в этом исследовании недостатка не было. Ресурсы суперкомпьютеров в ALCF и Национальном центре энергетических исследований, научном вычислительном центре Министерства энергетики США в Национальной лаборатории Лоуренса Беркли, способствовали получению данных за более чем 300 лет (700 терабайт), описывающих прошлую, настоящую и будущую погоду и климат Северной Америки.
«Эта база данных уникальна для науки о климате в Аргонне, — сказал Ван, — и мы используем ее для проведения дальнейших исследований в области глубокого обучения и определения того, как ее можно применить к моделям климата».
Конечная цель ученых — заменить все дорогостоящие параметризации в модели WRF нейронными сетями с глубоким обучением, чтобы обеспечить более быстрое моделирование с более высоким разрешением.
В настоящее время команда работает над эмуляцией параметризации длинноволнового и коротковолнового солнечного излучения — двух частей модели WRF, которые вместе занимают почти 40% времени расчета физики в симуляциях. p >