Почему ИИ нужно столько электричества
Один разговор с чат-ботом стоит дороже, чем кажется: за вежливым ответом стоят тысячи раскалённых видеокарт и целые электростанции. Разбираемся, куда утекают киловатты и почему ИИ — это в первую очередь история про электричество.
Ты пишешь чат-боту «привет», он отвечает за секунду — и кажется, что это бесплатно, как открыть страницу в интернете. Но где-то далеко в этот момент гудят тысячи видеокарт, ревут вентиляторы и крутятся счётчики на целую электростанцию. Почему же умные машины такие прожорливые?
Сначала разберёмся, что вообще ест электричество
Когда говорят «ИИ потребляет много энергии», на самом деле речь о двух очень разных вещах. Первая — это обучение нейросети: момент, когда модель только создают и «накачивают» знаниями. Вторая — использование уже готовой модели, то есть твои ежедневные вопросы чат-боту. Это как разница между постройкой дома и тем, чтобы просто включить в нём свет.
Обучение — это самый дорогой этап. Чтобы нейросеть научилась отвечать, ей показывают гигантское количество текстов, картинок или кода — миллиарды примеров. И на каждом примере она чуть-чуть подкручивает свои внутренние «настройки», которых у крупных моделей сотни миллиардов. Каждая такая подкрутка — это математическая операция. А теперь умножь миллиарды настроек на миллиарды примеров, повтори всё это много раз подряд — и ты получишь число с таким количеством нулей, что его сложно даже вслух произнести.
Почему именно видеокарты, и почему их так много
Все эти подкрутки — это, по сути, перемножение огромных таблиц с числами. Обычный процессор в твоём ноутбуке умный, но делает дела по очереди, как один кассир в магазине. А для нейросетей нужен не один умный кассир, а тысячи простых, которые считают одновременно. Именно так устроены видеокарты (их ещё называют GPU): они умеют параллельно перемалывать тысячи чисел за раз.
Для обучения большой модели не хватает одной видеокарты — их ставят тысячами, и работают они неделями, а то и месяцами без перерыва. Каждая такая карта потребляет столько же энергии, сколько хороший электрочайник или даже небольшой обогреватель. Теперь представь комнату, где одновременно кипят тысячи чайников, и так — круглые сутки много недель. Вот примерно это и происходит при обучении современной нейросети.
Главная причина прожорливости ИИ не в том, что он «думает», а в том, что он выполняет невообразимое количество простых вычислений — и делает это на тысячах раскалённых чипов одновременно.
Дата-центр: завод, который никогда не выключается
Все эти видеокарты живут не у кого-то дома, а в специальных зданиях — дата-центрах. Это огромные ангары, набитые стойками с компьютерами от пола до потолка. И вот здесь прячется коварная вторая половина расходов энергии: охлаждение.
Любой работающий чип греется — ты замечал, как нагревается телефон, когда долго играешь? А теперь представь тысячи мощных чипов в одном помещении. Без охлаждения они бы за минуты раскалились и сгорели. Поэтому дата-центры гоняют гигантские системы кондиционирования, прокачивают тонны воздуха и воды, чтобы держать технику в холоде. Получается обидный парадокс:
- часть электричества тратится на сами вычисления;
- а ещё значительная часть — просто на то, чтобы остудить то, что эти вычисления нагрело.
Грубо говоря, ты платишь и за работу печки, и за работу холодильника рядом с ней. Поэтому многие дата-центры строят там, где холодно от природы, или рядом с реками — так на охлаждении можно сэкономить.
А что насчёт одного вопроса чат-боту?
Хорошая новость: когда модель уже обучена, один твой запрос стоит несравнимо дешевле, чем всё обучение. Но есть нюанс — таких запросов миллиарды каждый день. Когда сотни миллионов людей по всему миру одновременно о чём-то спрашивают ИИ, генерируют картинки и пишут код, маленькие капли складываются в целую реку.
Сравни с водой из крана. Один раз помыть руки — ерунда. Но если кран открыт у миллиарда человек одновременно и не закрывается ни на секунду — это уже масштаб целой реки. Именно поэтому компании борются за то, чтобы каждый ответ модели стоил чуть меньше энергии: даже крошечная экономия на одном запросе превращается в экономию целой электростанции, когда запросов миллиарды.
Почему это важно знать
ИИ кажется чем-то невесомым — просто текст на экране. Но за этим текстом стоит очень физический мир: металл, электричество, тепло и вода. Чем умнее и больше становятся модели, тем больше энергии они хотят, и инженеры по всему миру ломают голову, как сделать их экономнее: придумывают модели поменьше, чипы поэффективнее и питают дата-центры от солнца и ветра.
Так что в следующий раз, печатая «спасибо» чат-боту, можешь мысленно подмигнуть тысячам видеокарт где-то далеко. Они только что слегка нагрелись ради твоего ответа — и кто-то уже думает, как в следующий раз потратить на это чуть меньше киловатт.