MIT Technology Review’ın yapay zekanın bireysel ve kolektif enerji talebini hesaplamak için veri karmaşası ve gizli değişkenler arasında nasıl ilerlediğini öğrenelim.
James O’Donnell ve Crownhart / 20 Mayıs 2025
Yapay zekanın enerji ve emisyon yükü için mevcut en iyi tahminler hakkında bir hikaye yazmaya koyulduğumuzda , bu sayılarda çekinceler ve belirsizlikler olacağını biliyorduk. Ancak, çekincelerin de hikaye olduğunu hemen keşfettik.
Bir AI modelinin kullandığı enerjiyi ölçmek, bir arabanın yakıt ekonomisini veya bir cihazın enerji derecesini değerlendirmek gibi değildir. Üzerinde anlaşılmış bir yöntem veya genel bir değer veri tabanı yoktur. Standartları uygulayan düzenleyiciler yoktur ve tüketiciler bir modeli diğerine göre değerlendirme şansına sahip değildir.
Yapay zekanın ihtiyaçları etrafında enerji altyapısını yeniden şekillendirmek için milyarlarca dolar harcanmasına rağmen, hiç kimse yapay zekanın enerji kullanımını nicelleştirmenin bir yolunu belirlemedi. Daha kötüsü, şirketler genellikle bulmacanın kendi parçalarını ifşa etmeye isteksizdir. Ayrıca, şebeke karmaşık, sürekli değişen bir enerji kaynakları karışımına ev sahipliği yaptığı için, bu enerji talebiyle ilişkili emisyonları tahmin etmenin de sınırlamaları vardır.
Bir modelin kullandığı enerjinin ölçülmesi
“Kapalı kaynak” modelleriyle uğraşan OpenAI gibi şirketler, genellikle bir soru girdiğiniz ve bir cevap aldığınız bir arayüz aracılığıyla sistemlerine erişim sunar. Arada olanlar -dünyadaki hangi veri merkezinin isteğinizi işlediği, bunu yapmak için gereken enerji ve kullanılan enerji kaynaklarının karbon yoğunluğu- yalnızca şirketler tarafından bilinebilen bir sır olarak kalır. Bu bilgileri yayınlamaları için çok az teşvik vardır ve şimdiye kadar çoğu bunu yapmadı.
Bu yüzden, analizimiz için açık kaynaklı modellere baktık. Çok kusurlu bir proxy olarak hizmet ediyorlar ancak sahip olduğumuz en iyi proxy’dir. (OpenAI, Microsoft ve Google, kapalı kaynaklı modellerinin ne kadar enerji kullandığına dair ayrıntıları paylaşmayı reddetti.)
Açık kaynaklı AI modellerinin enerji tüketimini ölçmek için en iyi kaynaklar AI Energy Score , ML.Energy ve MLPerf Power’dır . ML.Energy’nin arkasındaki ekip, metin ve görüntü modeli hesaplamalarımızda bize yardımcı oldu ve AI Energy Score’un arkasındaki ekip, video modeli hesaplamalarımızda bize yardımcı oldu.
Metin modelleri
Yapay zeka modelleri enerjiyi iki aşamada tüketir: başlangıçta büyük miktarda veriden öğrendikleri zaman, eğitim olarak adlandırılır ve sorgulara yanıt verdikleri zaman, çıkarım olarak adlandırılır. ChatGPT birkaç yıl önce piyasaya sürüldüğünde, teknoloji şirketleri ayak uydurmak ve giderek daha büyük modeller oluşturmak için yarışırken odak noktası eğitimdi. Ancak şimdi, en fazla enerjinin kullanıldığı yer çıkarımdır.
Bir AI modelinin çıkarım aşamasında ne kadar enerji kullandığını anlamak için en doğru yol, isteği işleyen sunucunun kullandığı elektrik miktarını doğrudan ölçmektir. Sunucular her türlü bileşeni içerir: hesaplamanın büyük kısmını yapan GPU adı verilen güçlü yongalar, CPU adı verilen diğer yongalar, her şeyi serin tutan fanlar ve daha fazlası. Araştırmacılar genellikle GPU’nun çektiği güç miktarını ölçer ve geri kalanını tahmin eder (bunun hakkında daha fazla bilgi yakında).
Bunu yapmak için, Michigan Üniversitesi’nde ML.Energy projesine liderlik eden doktora adayı Jae-Won Chung ve doçent Mosharaf Chowdhury’ye yöneldik. Ekiplerinden farklı modellerin GPU enerji kullanımına ilişkin rakamları topladıktan sonra, soğutma gibi diğer süreçler için ne kadar enerji kullanıldığını tahmin etmemiz gerekiyordu. Bir sunucunun toplam enerji talebinin ne kadarından GPU’ların sorumlu olduğunu anlamak için Microsoft’un 2024 tarihli bir makalesi de dahil olmak üzere araştırma literatürünü inceledik . Bunun yaklaşık yarısı olduğu ortaya çıktı. Bu yüzden ekibin GPU enerji tahminini aldık ve toplam enerji talepleri hakkında bir fikir edinmek için iki katına çıkardık.
ML.Energy ekibi, modelleri test etmek için daha büyük bir veri kümesinden 500 istemlik bir grup kullanır . Donanım her zaman aynı tutulur; GPU, H100 adlı popüler bir Nvidia çipidir. Meta Llama ailesinden üç boyuttaki modellere odaklanmaya karar verdik: küçük (8 milyar parametre), orta (70 milyar) ve büyük (405 milyar). Ayrıca test edilecek bir dizi istem belirledik. Bunları, 500 istemlik tüm grubun ortalamalarıyla karşılaştırdık.
Görüntü modelleri
Stability AI’dan Stable Diffusion 3, en yaygın kullanılan açık kaynaklı görüntü oluşturma modellerinden biridir, bu yüzden onu odak noktamız yaptık. Metin tabanlı Meta Llama modelinin birden fazla boyutunu test etmemize rağmen, 2 milyar parametreye sahip Stable Diffusion 3’ün en popüler boyutlarından birine odaklandık.
Ekip, bir modelin enerji gereksinimlerini test etmek için örnek istemlerden oluşan bir veri kümesi kullanır . Büyük dil modelleri tarafından kullanılan enerji kısmen istem tarafından belirlense de, bu difüzyon modelleri için geçerli değildir. Difüzyon modelleri, bir görüntü veya video ürettiklerinde belirli sayıda “gürültü giderme adımından” geçecek şekilde programlanabilir ve her adım, görüntüye daha fazla ayrıntı ekleyen algoritmanın bir yinelemesidir. Belirli bir adım sayısı ve model için, üretilen tüm görüntülerin enerji ayak izi aynıdır.
Adım sayısı arttıkça, nihai sonuç daha kaliteli olur; ancak daha fazla enerji kullanılır. Adım sayısı modele ve uygulamaya göre değişir, ancak 25 oldukça yaygındır ve standart kalitemiz için bunu kullandık. Daha yüksek kalite için 50 adım kullandık.
GPU’ların genellikle büyük dil modeli isteklerinin enerji taleplerinin yaklaşık yarısından sorumlu olduğunu belirtmiştik. Görüntü ve video üreten difüzyon modelleri için bunun nasıl değiştiğini bilmek için yeterli araştırma yoktur. Daha iyi bir tahminin olmaması ve araştırmacılara danıştıktan sonra, görüntüler ve videolar için de bu %50 kuralına bağlı kalmayı tercih ettik.
Video modelleri
Chung ve Chowdhury video modellerini test ediyor, ancak yalnızca kısa, düşük kaliteli GIF’ler üretenleri. Bu modellerin ürettiği videoların, birçok kişinin görmeye alışkın olduğu AI tarafından üretilen videonun doğruluğunu yansıtmadığını düşünüyoruz.
Bunun yerine, AI Energy Score projesini yöneten Hugging Face’deki AI ve iklim lideri Sasha Luccioni’ye yöneldik . O, AI istekleri sırasında GPU tarafından kullanılan enerjiyi ölçüyor. Test etmek için CogVideoX modelinin iki versiyonunu seçtik: eski, düşük kaliteli bir versiyon ve daha yeni, yüksek kaliteli bir versiyon.
Luccioni’den, hem metin hem de görüntü testlerimizle aynı donanımı kullanarak seçtiğimiz bir grup video isteminin sonuçlarını ölçmek ve Code Carbon adlı aracını kullanmasını istedik, böylece mümkün olduğunca çok değişkeni aynı tuttuk. Toplam enerji taleplerini tahmin etmek için tekrar iki katına çıkardığımız GPU enerji taleplerini bildirdi.
Bu enerjinin nereden geldiğini takip etmek
Bir sorguya yanıt vermenin ne kadar enerji gerektirdiğini anladıktan sonra, bunu toplam emisyon etkisine çevirebiliriz. Bunu yapmak, veri merkezlerinin elektriğini aldığı elektrik şebekesine bakmayı gerektirir.
Şebekenin iklim etkisini belirlemek karmaşık olabilir, çünkü hem birbirine bağlı hem de inanılmaz derecede yereldir. Şebekeyi, birbirine bağlı kanallar ve su havuzlarından oluşan bir sistem olarak düşünün. Elektrik santralleri kanallara su ekler ve elektrik kullanıcıları veya yükler onu dışarı atar. ABD’de şebeke bağlantıları ülke çapında uzanır. Yani bir bakıma hepimiz birbirimize bağlıyız, ancak enerji kaynaklarının ülke genelinde nasıl değiştiğine dair bir fikir edinmek için şebekeyi bileşenlerine ayırabiliriz.
Karbon yoğunluğunu anlamak
Burada anlaşılması gereken en önemli ölçüt, karbon yoğunluğu olarak adlandırılır; bu temelde, üretilen her kilovatsaat elektrik için kaç gram karbondioksit kirliliğinin salındığının bir ölçüsüdür.
Karbon yoğunluğu rakamlarını elde etmek için, dünya çapındaki şebekeler hakkında veri toplayan Danimarkalı bir girişim şirketi olan Electricity Maps’e ulaştık. Ekip, hükümetler ve kamu hizmetleri de dahil olmak üzere kaynaklardan bilgi topluyor ve bunları şebekenin karbon yoğunluğunun geçmiş ve gerçek zamanlı tahminlerini yayınlamak için kullanıyor. Metodolojileri hakkında daha fazla bilgiyi burada bulabilirsiniz .
Şirket, hem tüm ABD hem de birkaç önemli dengeleme otoritesi için 2024’ten itibaren tarihi verileri bizimle paylaştı (bunun hakkında birazdan daha fazla bilgi vereceğiz). Electricity Maps kurucusu Olivier Corradi ve diğer uzmanlarla yaptığımız görüşmelerden sonra, hesaplamalarımızda hangi rakamları kullanacağımıza dair birkaç karar aldık.
Karbon yoğunluğunu ölçmenin bir yolu, şebekede faaliyet gösteren tüm elektrik santrallerine bakmak, şu anda ürettikleri kirliliği toplamak ve bu toplamı ürettikleri elektriğe bölmektir. Ancak bu, önemli olabilen elektrik santrallerinin inşası ve yıkılmasıyla ilişkili emisyonları hesaba katmaz. Bu nedenle, bir elektrik santralinin tüm yaşam döngüsünü hesaba katan karbon yoğunluğu rakamlarını kullanmayı seçtik.
Ayrıca üretim bazlı yerine tüketim bazlı enerji karbon yoğunluğunu kullanmayı seçtik. Bu rakam, şebekenin farklı bölümleri arasında hareket eden ithalat ve ihracatı hesaba katar ve belirli bir bölgede gerçek zamanlı olarak kullanılan elektriği en iyi şekilde temsil eder.
Hikayede gördüğünüz hesaplamaların çoğunda, Electricity Maps’e göre 2024 yılı ABD ortalama karbon yoğunluğunu kullandık; bu da kilovatsaat başına 402,49 gram karbondioksit eşdeğeri.
Dengeleme yetkilerini anlamak
Resmin ABD genelinde anlaşılması faydalı olabilir ancak tablo farklı yerlerde inanılmaz derecede farklı görünebilir.
İşleri parçalamanın bir yolu dengeleme otoritelerine bakmaktır. Bunlar belirli bir bölgedeki şebeke dengelemesinden sorumlu bağımsız kuruluşlardır. Çoğunlukla bağımsız olarak faaliyet gösterirler, ancak aralarında sürekli bir elektrik hareketi de vardır. ABD’de 66 dengeleme otoritesi vardır ve belirli bir dengeleme otoritesi tarafından kapsanan şebekenin bir kısmı için bir karbon yoğunluğu hesaplayabiliriz.
Elektrik Haritaları, birkaç önemli dengeleme otoritesi için karbon yoğunluğu rakamları sağladı ve veri merkezi operasyonlarında en büyük rolleri oynayan birkaçına odaklandık. Harvard Halk Sağlığı Okulu’nun araştırmasına göre, ERCOT (Teksas’ın çoğunu kapsar) ve PJM (Doğu Yakası’ndaki Virginia, Pensilvanya ve New Jersey’i içeren bir eyalet kümesi), veri merkezlerinin en büyük yüküne sahip bölgelerden ikisidir .
CAISO’yu (Kaliforniya’da) ekledik çünkü ABD’deki en kalabalık eyaleti kapsıyor. CAISO ayrıca önemli sayıda yenilenebilir enerji kaynağına sahip bir şebekeyi yönetiyor ve bu da karbon yoğunluğunun günün saatine bağlı olarak nasıl büyük ölçüde değişebileceğine dair iyi bir örnek teşkil ediyor. (Örneğin, gün ortasında güneş enerjisi baskın olma eğilimindeyken, doğal gaz geceleri daha büyük bir rol oynuyor.)
Buradaki önemli bir uyarı, şirketlerin bireysel AI çıkarım isteklerini nereye gönderme eğiliminde olduklarından tam olarak emin olmamamızdır. Örnek olarak seçtiğimiz bölgelerde veri merkezi kümeleri vardır, ancak bir teknoloji devinin AI modelini kullandığınızda, isteğiniz şirketin sahibi olduğu veya sözleşmesini yaptığı herhangi bir sayıda veri merkezi tarafından işlenebilir. Makul bir yaklaşım konumdur: Bir isteği karşılayan veri merkezinin, isteğin yapıldığı yere yakın olması muhtemeldir, bu nedenle Batı Yakası’ndaki bir istek, ülkenin o tarafındaki bir veri merkezine yönlendirilme olasılığı en yüksek olabilir.
Bulduğumuz şeyi açıklıyoruz
Hesaplamalarımızı daha iyi bağlamlandırmak için, insanların kilowatt-saat ve karbondioksit gramından daha aşina olabileceği birkaç karşılaştırma sunduk. Birkaç yerde, bir model tarafından kullanılması tahmin edilen elektrik miktarını aldık ve bu elektriğin standart bir mikrodalgayı ne kadar süreyle çalıştırabileceğini ve ayrıca bir e-bisikletle birinin ne kadar uzağa gidebileceğini hesapladık.
E-bisiklet durumunda, pedal destekli bir bisiklet için sıkça belirtilen verimlilik aralığına giren mil başına 25 watt-saatlik bir verimlilik varsaydık. Mikrodalga için, ABD’deki ortalama aralıkta kalan 800 watt’lık bir model varsaydık.
Ayrıca sera gazı emisyonlarını bağlamlandırmak için bir karşılaştırma da sunduk: benzinle çalışan bir arabada gidilen miller. Bunun için, ABD Çevre Koruma Ajansı’ndan alınan verileri kullandık ; bu, ABD’deki araçların 2022’deki ağırlıklı ortalama yakıt ekonomisini mil başına 393 gram karbondioksit eşdeğeri olarak belirliyor.
Yapay zekanın gelecekte ne kadar enerji kullanacağını tahmin etmek
Bireysel bir sorgunun enerji talebini ve ürettiği emisyonları ölçtükten sonra, tüm bunların ulusal talebe nasıl yansıdığını tahmin etmenin zamanı geldi.
Bunu yapmanın iki yolu vardır. Aşağıdan yukarıya bir analizde, kaç tane bireysel sorgu olduğunu tahmin edersiniz, her birinin enerji taleplerini hesaplarsınız ve toplamı belirlemek için bunları toplarsınız. Yukarıdan aşağıya bir görünüm için, daha geniş eğilimlere bakarak tüm veri merkezlerinin ne kadar enerji kullandığını tahmin edersiniz.
Aşağıdan yukarıya özellikle zordur, çünkü bir kez daha, kapalı kaynaklı şirketler bu tür bilgileri paylaşmaz ve bizimle ayrıntıları konuşmayı reddeder. Şu anda neler olabileceğine dair bize bir resim vermek için bazı eğitimli tahminlerde bulunabilirken, geleceğe bakmak için yukarıdan aşağıya bir yaklaşım benimsemek belki de daha iyi hizmet eder.
Bu veriler de kıt. En önemli rapor Aralık ayında Enerji Bakanlığı tarafından finanse edilen Lawrence Berkeley Ulusal Laboratuvarı tarafından yayınlandı ve rapor yazarları bunun son 20 yılda yayınlanan yalnızca üçüncü rapor olduğunu belirtti. Konuştuğumuz akademik iklim ve enerji araştırmacıları, AI’nın emisyon ölçümleri için kendi ekonomik sektörü olarak kabul edilmemesinin ve titiz raporlama gerekliliklerinin olmamasının büyük bir sorun olduğunu söyledi. Sonuç olarak, AI’nın iklim bedelini takip etmek zor.
Yine de, raporun sonuçlarını inceledik, bunları diğer bulgular ve tahminlerle karşılaştırdık ve veriler hakkında bağımsız uzmanlara danıştık. Raporun büyük kısmı daha genel olarak veri merkezleriyle ilgili olsa da, yapay zekanın geleceğine özgü veri noktaları çıkardık.
Şirket hedefleri
Bu rakamları, AI şirketlerinin kendilerinin ihtiyaç duyduklarını söyledikleri enerji miktarlarıyla karşılaştırmak istedik. Bunu yapmak için, önde gelen teknoloji ve AI şirketlerinin enerji ve veri merkezi genişletme planları ve yatırım yapmayı vaat ettikleri dolar miktarları hakkında raporlar topladık. Mümkün olduğunda, bu iddialarda verilen sözleri doğruladık. (Örneğin, Meta ve Microsoft’un daha fazla nükleer güç kullanma taahhütleri, şirketlerin karbon emisyonlarını gerçekten azaltacaktır, ancak bu ek nükleer santrallerin devreye girmesi yıllar, hatta on yıllar alacaktır.)
Şirketlere yönelik talepler
Microsoft, Google ve OpenAI’ye, yapay zeka çıkarımı için modellerinin enerji talepleri hakkında veri odaklı görüşmeler yapmak için talepler gönderdik. Şirketlerin hiçbiri, enerji kullanımları hakkında kayıtlı görüşmeler için yöneticileri veya liderleri müsait kılmadı.
