Yapay Zekada Şeffaflık Azalıyor.

9 Aralık 2025 /Rishi Bommasan /Kevin Klyman / Alexander Wan / Percy Liang

Yeni bir araştırma, yapay zeka sektörünün önemli bilgileri gizlediğini gösteriyor.

Yapay zekâ şirketleri ve genel olarak yapay zekâ sektörü hiç bu kadar önemli olmamıştı. Google ve Meta dahil olmak üzere yedi köklü yapay zekâ şirketi, S&P 500’ün tamamının %35’inden fazlasını oluşturuyor. OpenAI ve Anthropic gibi girişimler, tarihin en değerli özel şirketleri arasında yer alıyor. Milyarlarca insan artık bilgi aramak, yazmaya yardımcı olmak ve görüntü, video ve ses üretmek için temel modeller kullanıyor. Peki, ortak geleceğimizi inşa eden şirketler ne kadar şeffaf?

Bugün, Stanford, Berkeley, Princeton ve MIT’den oluşan araştırma ekibimiz, yıllık Temel Model Şeffaflık Endeksi’nin üçüncü baskısı olan 2025 Temel Model Şeffaflık Endeksi’ni yayınladı . 2024’ten bu yana şeffaflığın azaldığını ve şirketlerin şeffaflık düzeylerinde büyük farklılıklar gösterdiğini tespit ettik.

**2025 FMTI araştırması 13 şirketi inceledi ve şirketlerin şeffaflığa verdikleri öncelik derecesinde büyük farklılıklar tespit etti.**

Temel Model Şeffaflık Endeksi, büyük yapay zeka şirketlerinin amiral gemisi modelleriyle ilgili şeffaflığını kapsamlı bir şekilde değerlendiren yıllık bir rapordur. Her şirket, eğitim verileri, risk azaltma ve ekonomik etki gibi konuları kapsayan 100 puanlık bir ölçekte puanlandırılır. Bu yılki endeks, sektör genelindeki şeffaflık düzeyinin düşük olduğunu ortaya koymaktadır. 100 puanlık bir ölçekte şirketler ortalama sadece 40 puan almıştır.

Ortalama düşük olsa da, şirketlerin uygulamaları büyük ölçüde farklılık gösteriyor. Üç küme ortaya çıkıyor: En iyi performans gösterenler yaklaşık 75 puan alırken, orta sıralarda yer alanlar yaklaşık 35 puan, düşük puan alanlar ise ortalama 15 puan aldı.

En üst sırada yer alan IBM, endeksin tarihindeki en yüksek puanı olan 95/100’ü elde etti. IBM, başka hiçbir şirketin uygulamalarını paylaşmadığı birçok gösterge hakkında bilgi açıklayarak sektörde emsal teşkil ediyor. Örneğin, IBM, dış araştırmacıların eğitim verilerini tekrarlayabilmeleri için yeterli ayrıntı sağlayan ve denetçiler gibi dış kuruluşlara bu verilere erişim izni veren tek şirkettir.

Öte yandan, xAI ve Midjourney’nin 100 üzerinden 14 puan alması, Endeks tarihinin en düşük puanları arasında yer alıyor. Modellerini oluşturmak için kullanılan veriler, modelleriyle ilişkili riskler veya bu riskleri azaltmak için attıkları adımlar hakkında hiçbir bilgi paylaşmıyorlar. Genel olarak, değerlendirdiğimiz on üç şirket, temel modellerinin oluşturulması ve uygulanmasının çevresel veya toplumsal etkileri hakkında çok az veya hiç bilgi paylaşmıyor.

Bu örüntüler, mevcut şeffaflık uygulamalarının, sektör genelindeki şeffaflık teşviklerinden (veya caydırıcılarından) ziyade, bireysel şirketlerin şeffaflığa ne kadar öncelik vermeyi tercih ettiklerine bağlı olarak belirlendiğini göstermektedir.

**2023’ten beri şeffaflığı takip eden Vakıf Modeli Şeffaflık Endeksi, 2025’te genel bir düşüş ve önde gelen oyuncularda büyük bir yeniden yapılanma gördü.**

Bu çalışma, kurumsal şeffaflığın değişen durumunu ortaya koymaktadır. Yapay zeka ekosisteminin kendisi son üç yılda önemli ölçüde değiştiği için, 2025 Endeksi, 2023 baskısında tanıtılan orijinal göstergeleri güncelleyen ilk baskıdır. Bu kriter değişikliği göz önünde bulundurulduğunda, puanlar 2024’te ortalama 58/100’den 2025’te 40/100’e düşmüştür. Bireysel şirketler şeffaflıklarını önemli ölçüde azaltmıştır: Meta’nın puanı 60’tan 31’e, Mistral’in puanı ise 55’ten 18’e düşmüştür. 2025 baskısı ayrıca ilk kez dört şirketi (Alibaba, DeepSeek, Midjourney, xAI) içermektedir; bunlar arasında ilk kez büyük Çin şirketleri de yer almaktadır. Bu şirketlerin tümü Endeksin alt yarısında yer almaktadır.

Genel şeffaflık düşüşünün yanı sıra, şirketlerin sıralaması da değişti. Her yıl puanladığımız altı şirketten Meta ve OpenAI, 2023’te sırasıyla birinci ve ikinci sırada yer alırken, şimdi sonuncu ve sondan ikinci sıradalar. Buna karşılık, AI21 Labs 2023’te sondan ikinci sıradan 2025’te birinci sıraya yükseldi. Bu puan değişiklikleri, şeffaflık uygulamalarındaki büyük değişiklikleri yansıtıyor. Meta, amiral gemisi modeli Llama 4 için teknik rapor yayınlamadı. Google, Gemini 2.5 için model kartı ve teknik raporu yayınlamada önemli ölçüde gecikti ve bu durum, İngiliz yasa koyucularının bu belgeleri yayınlama konusundaki kamuoyu taahhütleriyle ilgili olarak incelemelerine yol açtı.

**Temel Model Şeffaflık Endeksi, veri toplama, modele erişim ve uygulama sonrası izleme dahil olmak üzere 15 ana alanda şirketleri puanlandırır.**

Temel Model Şeffaflık Endeksi, mevcut bilgi ekosisteminin karmaşık yapısını açıklığa kavuşturuyor. Tüm sektör, dört kritik konuda sistematik olarak şeffaf değil: eğitim verileri, eğitim hesaplama gücü, modellerin nasıl kullanıldığı ve bunun toplum üzerindeki etkisi. Bu alanların her biri, temel model geliştiricilerini daha geniş yapay zeka tedarik zincirine bağlıyor . Bu alanların birçoğunun son üç yıldır sürekli olarak şeffaf olmaması göz önüne alındığında, bu yılki Endeks, bu alanların politika müdahalesi için uygun olduğunu vurguluyor.

Çevresel Etki Hakkında Çok Az Bilgi

Şirketler, bina temel modellerinin çevresel etkileri konusunda son derece şeffaf olmayan bir tutum sergiliyor. 10 şirket, çevresel etkiyle ilgili temel bilgilerin hiçbirini açıklamıyor: AI21 Labs, Alibaba, Amazon, Anthropic, DeepSeek, Google, Midjourney, Mistral, OpenAI ve xAI. Bu, enerji kullanımı, karbon emisyonları veya su kullanımı hakkında hiçbir bilgi içermemektedir. Şirketlerin bu bilgileri gizlemesi özellikle önemlidir, çünkü veri merkezlerine yapılan devasa yatırımlar enerji şebekesini zorlamış ve ABD’de ve diğer yerlerde enerji fiyatlarının artmasına katkıda bulunmuştur.

**Açıklık, şeffaflığı garanti etmez; DeepSeek ve Meta gibi büyük açık kaynaklı geliştiriciler oldukça şeffaf olmayan bir yapıya sahiptir.**

Açıklık mı, Şeffaflık mı?

Açıklık ve şeffaflık, sıklıkla eş anlamlı olarak kullanılan, birbirine bağlı kavramlardır. Bu terimleri ayırt etmek için, bir modelin ağırlıkları kamuya açık ise modelin açık olduğunu, bir şirketin ise uygulamaları hakkında önemli bilgileri kamuya ifşa etmesi durumunda şirketin şeffaf olduğunu söyleriz. Model ağırlıklarının açık bir şekilde yayınlanması, eğitim hesaplaması, risk değerlendirmesi ve sonraki kullanım gibi birçok konuda şeffaflığı garanti etmez. Ampirik olarak, açık kaynaklı geliştiriciler, kapalı kaynaklı geliştiricilere göre daha şeffaf olma eğilimindedir.

Ancak bu toplu etki yanlış anlaşılmalara açıktır. IBM ve AI21 Labs gibi iki açık model geliştiricisi oldukça şeffafken, en etkili üç açık geliştirici olan DeepSeek, Meta ve Alibaba oldukça kapalıdır. Bir geliştiricinin açık model ağırlıklarını yayınlama kararının, şirket uygulamaları veya toplumsal etki hakkında daha geniş bir şeffaflık sağlayacağı varsayımında dikkatli olunmalıdır.

İleriye dönük

Yapay zekâ şirketleri içinde birbirinden ayrı tutulan bilgilerin paylaşılması, kurumsal yönetimi sağlamak, yapay zekâdan kaynaklanan zararları azaltmak ve bu son teknoloji üzerinde güçlü bir denetim sağlamak için hayati önem taşımaktadır. Daha fazla şeffaflık ihtiyacı, birçok yargı bölgesinde yapay zekâ politikası için en önemli önceliklerden biridir. Kaliforniya ve Avrupa Birliği, sınır yapay zekâsının riskleri konusunda şeffaflığı zorunlu kılan yasalar çıkarmıştır. Beyaz Saray’da eski yapay zekâ danışmanı ve Amerika’nın Yapay Zekâ Eylem Planı’nın baş yazarı Dean Ball ise, yapay zekâ düzenlemesinin sağduyulu bir bileşeni olarak şeffaflık önlemlerini önermiştir . Foundation Model Şeffaflık Endeksi, hem yapay zekâ sektörünün mevcut bilgi durumunu hem de politika olmaksızın zaman içinde hangi alanların iyileşmeye daha dirençli olduğunu belirleyerek politika yapıcılar için bir yol gösterici görevi görebilir.

https://hai.stanford.edu/news/transparency-in-ai-is-on-the-decline?utm_source=newsletter&utm_medium=email&utm_content=Transparency%20in%20AI%20Is%20on%20the%20Decline&utm_campaign=Research%2C%20News%2C%20and%20Events%20Newsletter

The 2025 Foundation Model Transparency Inex’ine ulaşmak için aşağıdaki linki tıklayınız.

https://crfm.stanford.edu/fmti/paper.pdf

Indeksin giriş bölümünde şu görüşler yer almaktadır:

Vakıf modeli geliştiricileri, dünyanın en önemli şirketleri arasındadır. Bu şirketler giderek daha önemli hale geldikçe, şeffaflık uygulamaları nasıl gelişmektedir?

2025 Vakıf Modeli Şeffaflık Endeksi, vakıf modeli geliştiricilerinin şeffaflığını karakterize etmek ve ölçmek için her yıl yapılan çalışmanın üçüncü baskısıdır.

FMTI, veri toplama, kullanım verileri ve izleme ile ilgili yeni göstergeler sunar ve Alibaba, DeepSeek ve xAI gibi şirketleri ilk kez değerlendirir. 2024 FMTI, şeffaflığın iyileştiğini bildirmiş, ancak 2025 FMTI bu ilerlemenin gerilediğini tespit etmiştir: 100 üzerinden ortalama puan 2024’te 58 iken 2025’te 40’a düşmüştür. Şirketler, eğitim verileri ve eğitim hesaplamaları ile amiral gemisi modellerinin dağıtım sonrası kullanımı ve etkisi konusunda en şeffaf olmayanlar. Şirketler model yetenekleri ve risklerinin değerlendirmelerini açıklamaya eğilimli olsa da, sınırlı metodolojik şeffaflık, üçüncü tarafların katılımı, tekrar üretilebilirlik ve eğitim-test çakışmasının raporlanması zorluklar yaratıyor. Bu genel eğilime rağmen, IBM 95 puanla olumlu bir istisna olarak öne çıkarken, en düşük puanı alan xAI ve Midjourney sadece 14 puan aldı. Bazı şirket grupları, rakiplerine göre ortalama olarak daha yüksek puanlar aldı: açık model geliştiriciler, kurumsal odaklı B2B şirketleri, kendi şeffaflık raporlarını hazırlayan şirketler ve AB AI Yasası Genel Amaçlı AI Uygulama Kuralları’nı imzalayanlar.

Değerlendirilen beş Frontier Model Forum üyesi, Puanladığımız Frontier Model Forum’un beş üyesi, Endeks’in ortasında yer almaktadır: büyük şirketlerin özellikle düşük sıralamaları önlemek istediğini, ancak aynı zamanda yüksek şeffaflık için teşviklerden yoksun olduğunu varsayıyoruz.

Dünya çapında politika yapıcılar belirli şeffaflık türlerini giderek daha fazla zorunlu hale getirirken, bu çalışma mevcut durumu, yeni yürürlüğe giren politikalarla nasıl değişebileceğini ve kritik bilgi eksikliklerini gidermek için daha agresif politikamüdahalelerinin gerekli olduğu alanları ortaya koymaktadır.