С генеративным искусственным интеллектом существует большая проблема, — говорит Саша Луччиони из Hugging Face, компании, занимающейся машинным обучением. Генеративный ИИ — пожиратель энергии.
«Каждый раз, когда вы запрашиваете модель, она активируется, поэтому с вычислительной точки зрения это крайне неэффективно», — говорит она.
Возьмите большие языковые модели (LLM), лежащие в основе многих систем генеративного искусственного интеллекта. Они обучены работе с огромными запасами письменной информации, что помогает им набирать текст в ответ практически на любой запрос.
«Когда вы используете генеративный искусственный интеллект… он генерирует контент с нуля, то есть, по сути, дает ответы», — объясняет доктор Луччиони. Это означает, что компьютеру приходится работать очень усердно.
Согласно недавнему исследованию доктора Луччиони и его коллег, система генеративного искусственного интеллекта может потреблять примерно в 33 раза больше энергии, чем машины, на которых работает программное обеспечение для конкретных задач. Работа прошла рецензирование, но еще не опубликована в журнале.
Однако не ваш персональный компьютер использует всю эту энергию. Или ваш смартфон. Вычисления, на которые мы все больше полагаемся, происходят в гигантских центрах обработки данных, которые для большинства людей находятся вне поля зрения и вне поля зрения.
«Облако», — говорит доктор Луччиони. «Вы не думаете об этих огромных металлических ящиках, которые нагреваются и потребляют так много энергии».
Мировые центры обработки данных потребляют все больше электроэнергии. В 2022 году они поглотили 460 тераватт-часов электроэнергии, и Международное энергетическое агентство (МЭА) ожидает, что эта цифра удвоится всего за четыре года. К 2026 году центры обработки данных могут использовать в общей сложности 1000 тераватт-часов в год. «Этот спрос примерно эквивалентен потреблению электроэнергии в Японии», — заявляет МЭА. Население Японии составляет 125 миллионов человек.
В центрах обработки данных хранятся огромные объемы информации, которую можно найти в любой точке мира — от ваших электронных писем до голливудских фильмов. Компьютеры в этих безликих зданиях также поддерживают искусственный интеллект и криптовалюту. Они лежат в основе жизни, какой мы ее знаем.
Но некоторые страны слишком хорошо знают, насколько энергоемкими являются эти объекты. В настоящее время действует мораторий, запрещающий строительство новых центров обработки данных в Дублине. Почти пятая часть электроэнергии Ирландии потребляется центрами обработки данных, и ожидается, что в ближайшие несколько лет эта цифра значительно вырастет – тем временем ирландские домохозяйства сокращают свое потребление.
Глава National Grid заявил в своем выступлении в марте, что спрос на электроэнергию в центрах обработки данных в Великобритании всего за 10 лет вырастет в шесть раз, во многом благодаря развитию искусственного интеллекта. Однако National Grid ожидает, что общее количество энергии, необходимой для электрификации транспорта и отопления, будет намного больше.
Коммунальные предприятия в США начинают ощущать давление, говорит Крис Сейпл из консалтинговой компании Wood Mackenzie.
«Они сталкиваются со спросом на центры обработки данных в то же время, когда у нас происходит ренессанс – благодаря государственной политике – в отечественном производстве», — объясняет он. Согласно сообщениям в США, законодатели в некоторых штатах сейчас переосмысливают налоговые льготы, предлагаемые разработчикам центров обработки данных из-за огромной нагрузки, которую эти объекты оказывают на местную энергетическую инфраструктуру.
Сейпл говорит, что происходит «захват земель» для центров обработки данных рядом с электростанциями или центрами возобновляемой энергетики: «Айова является рассадником развития центров обработки данных, там много ветрогенерации».
В наши дни некоторые центры обработки данных могут позволить себе переезд в более удаленные места, поскольку задержка – задержка, обычно измеряемая в миллисекундах, между отправкой информации из центра обработки данных и получением ее пользователем – не является серьезной проблемой для все более популярных генеративных технологий. системы ИИ. В прошлом центры обработки данных, обеспечивающие, например, экстренную связь или алгоритмы финансовой торговли, располагались внутри крупных населенных пунктов или очень близко к ним, что обеспечивало наилучшее время реагирования.
Нет никаких сомнений в том, что потребности центров обработки данных в энергии в ближайшие годы вырастут, но существует огромная неопределенность относительно того, насколько именно, подчеркивает Сейпл.
Частично эта неопределенность связана с тем, что оборудование, лежащее в основе генеративного ИИ, постоянно развивается.
Тони Грейсон, генеральный директор компании Compass Quantum, занимающейся центрами обработки данных, указывает на недавно выпущенные суперкомпьютерные чипы Nvidia Grace Blackwell (названные в честь ученого-компьютерщика и математика), которые разработаны специально для поддержки высокопроизводительных процессов. включая генеративный искусственный интеллект, квантовые вычисления и компьютерный дизайн лекарств.
В Nvidia заявляют, что в будущем компания сможет обучать ИИ, в несколько раз превосходящие самую крупную имеющуюся в настоящее время систему ИИ, за 90 дней, используя 8000 чипов Nvidia предыдущего поколения. Для этого потребуется источник электроэнергии мощностью 15 мегаватт.
Но, по данным Nvidia, ту же работу можно выполнить одновременно всего с помощью 2000 чипов Grace Blackwell, и для них потребуется мощность в четыре мегаватта.
В итоге потребляется 8,6 гигаватт-часов электроэнергии – примерно столько же, сколько весь город Белфаст потребляет за неделю.
«Производительность возрастает настолько, что общая экономия энергии становится значительной», — говорит Грейсон. Но он согласен с тем, что спрос на электроэнергию формируется там, где операторы центров обработки данных размещают свои объекты: «Люди едут туда, где дешевая электроэнергия».
Доктор Луччиони отмечает, что для производства новейших компьютерных чипов требуется значительная энергия и ресурсы.
Тем не менее, это правда, что центры обработки данных со временем стали более энергоэффективными, утверждает Дейл Сартор, консультант и филиал Национальной лаборатории Лоуренса Беркли в США. Их эффективность часто измеряется эффективностью использования энергии или PUE. Чем меньше число, тем лучше. По его словам, в современных центрах обработки данных показатель PUE составляет около 1,1.
Эти предприятия по-прежнему создают значительное количество отработанного тепла, и Европа опережает США в поиске способов использования этого отработанного тепла, например, для подогрева плавательных бассейнов, — говорит Сартор.
Брюс Оуэн, управляющий директор британской компании Equinix, занимающейся центрами обработки данных, говорит: «Я по-прежнему думаю, что спрос будет расти дальше, чем тот прирост эффективности, который мы видим». Он прогнозирует, что будет построено больше центров обработки данных, включающих в себя электрогенерирующие мощности. В прошлом году Equinix было отказано в разрешении на строительство газового центра обработки данных в Дублине.
Сартор добавляет, что затраты могут в конечном итоге определить, стоит ли использовать генеративный искусственный интеллект для определенных приложений: «Если старый способ дешевле и проще, то для нового способа не будет большого рынка».
Однако д-р Луччиони подчеркивает, что людям необходимо четко понимать, чем варианты, стоящие перед ними, различаются с точки зрения энергоэффективности. Она работает над проектом по разработке энергетических рейтингов для ИИ.
«Вместо того, чтобы выбирать модель, производную от GPT, которая очень громоздка и потребляет много энергии, вы можете выбрать модель A+ Energy Star, которая будет намного более легкой и эффективной», — говорит она.