İlaçları keşfedebilen ve kod yazabilen yapay zeka, sıradan bir insanın dakikalar içinde çözebileceği bulmacaları hala çözemiyor.
Bu fenomen, genel yapay zeka (AGI) alanındaki zorluğun merkezinde yer alıyor. Günümüzün yapay zeka devrimi, tüm alanlarda insan zekasını rakip veya aşan modeller üretebilir mi? Eğer öyleyse, bunları çalıştırmak için gereken hesaplama verimliliği için hangi temel unsurlar (donanım, yazılım veya her ikisinin uyumu) optimize edilmelidir?
Anthropic’in kurucu ortağı Dario Amodei, Nobel Ödülü düzeyinde alan bilgisi, metin, ses ve fiziksel dünya gibi arayüzler arasında geçiş yapma yeteneği ve şu anda olduğu gibi sorulara ve komutlara yanıt vermek yerine hedeflere yönelik akıl yürütme özerkliği gibi özelliklere sahip bir tür “güçlü yapay zeka”nın 2026 gibi erken bir tarihte ortaya çıkabileceğini öngörüyor. OpenAI’nin CEO’su Sam Altman, AGI benzeri özelliklerin zaten “görünür hale geldiğini” ve elektrik ve internetle eşdeğer bir toplumsal dönüşümü tetiklediğini düşünüyor. Bu ilerlemeyi, eğitim, veri ve hesaplamadaki sürekli kazanımlara, düşen maliyetlere ve “süper üstel” bir sosyoekonomik değere bağlıyor.
Optimizm kurucularla sınırlı değil. Toplam tahminler, YZ sistemlerinin 2028 yılına kadar birkaç AGI kilometre taşını gerçekleştirme olasılığının en az %50 olduğunu gösteriyor. Bir uzman anketine göre, yardım almadan çalışan makinelerin her türlü görevde insanları geride bırakma olasılığı 2027 yılına kadar %10, 2047 yılına kadar ise %50 olarak tahmin ediliyor.
“Zeka, zaten bildiğiniz şeyleri yeni kalıplar halinde yeniden birleştirme, yeni sorunları verimli bir şekilde çözme becerisidir.” François Chollet, Ndea’nın kurucu ortağı ve ARC Prize’ın ortak yaratıcısı.
Her bir atılımla zaman ufku kısalıyor, GPT-3’ün piyasaya sürüldüğü zamanki 50 yıldan 2024’ün sonuna kadar 5 yıla kadar (bkz. Şekil 1). “Büyük dil ve akıl yürütme modellerineredeyse her sektörü dönüştürüyor,” diyor makine öğrenimi teknolojisi başkan yardımcısı ve Arm’da araştırma görevlisi Ian Bratt.
Otonomiden zekaya
Tarih, elbette, zamanla yanlış olduğu kanıtlanan teknoloji tahminleriyle doludur. 1901’de havacılık öncüsü Wilbur Wright, kardeşi Orville’e insan uçuşunun
50 yıl süreceğini söylemişti. Sadece iki yıl sürdü. Tersine, bilişsel ve bilgisayar bilimci Marvin Minsky, 1978’e kadar insan benzeri bilgisayar zekasının geleceğini öngörmüştü.
Bugünün YZ modelleri, ne kadar etkileyici olsalar da, tüm alanlarda insanlarla rekabet edemezler. OpenAI, AGI’yi ekonomik açıdan değerli işler alanında insanları geride bırakacak özerklik olarak tanımlıyor. Bu tanıma göre, hukuktan tıbba kadar uzmanlık alanlarında ve tüketiciler olarak günlük hayatımızda da ortaya çıkmaya başladığına dYZr işaretler var. Bratt, “Araba sürerken, televizyonumuzla veya bilgisayarımızla konuşurken yaptığımız her şeyin, son derece akıllı sistemler tarafından destek lendirdiği bir dünya görüyoruz” diyor.
Otonom yeteneklerdeki bu hızlanma, veri kümeleri, sistemler ve alanlar genelinde model eğitimini destekleyen araçlar ve donanım gerektirir. Bunun nedeni, bu tür sistemlerin hedefler tarafından yönlendirilen geri bildirim döngüleri kullanarak minimum insan müdahalesi ile çalışmasıdır.
Ayrıca, genelleştirilebilirlik ile yüksek düzeyde özel görevleri gerçekleştirme yeteneği arasında denge sağlamak için büyük ölçekli eğitimde yeniliklere ihtiyaç vardır. Büyük ölçekte performans gösterebilmek için, otonom sistemler çeşitli girdileri işlemeli ve platformlar arasında performans göstermelidir.
Heterojen bir bilgi işlem yaklaşımı, doğru iş için doğru aracı kullanır. Bu yaklaşım, merkezi işlem birimleri (CPU’lar) ve grafik işlem birimleri (GPU’lar) gibi işlemcileri ve sinir işlem birimleri (NPU’lar) ve tensör işlem birimleri (TPU’lar) gibi özel YZ hızlandırıcıları ile yeni ortaya çıkan mimarileri birleştirir.
Her işlemci, görev için doğru hesaplamayı sağlar ve her hesaplama motoru doğru kullanım senaryosuna ve talebe katkıda bulunarak AGI geleceğine doğru dengeli, ölçeklenebilir ve pratik bir yol sunar.
Daha yüksek düzeyde özerklik sağlamak için, heterojen bir ortamı karakterize eden çeşitli işlemci yongalarını yönetmek, koordine etmek ve optimize etmek için yazılım araçları ve çerçeveleri de gereklidir. YZ yazılımı, geliştiricilerin işini basitleştirmek için sürekli olarak gelişmektedir ve geliştiricilerin her biri için kod yazmadan birden fazla donanım arka ucunu hedefleyen programlar yazmalarına ve uygulamaları ve iş yükleri için optimize edilmiş performansa erişmelerine olanak tanır. Bu nedenle, orkestrasyon araçları iş akışı geliştirmeyi kolaylaştırmak için giderek daha kritik hale gelmekte ve YZ uygulamalarının iş yüklerini hesaplama ortamları arasında dinamik olarak dağıtmasına ve yönetmesine yardımcı olmaktadır.
Son olarak, standartlar ve protokollerin geliştirilmesi, YZ uygulamalarının dış araçlar, sistemler ve veri kaynaklarıyla etkileşime girmesine yardımcı olmaktadır. Bu, YZ ile donatılmış bir gelecek için bir başka önemli yetenek katmanıdır.
Zekayı tanımlamak
Ndea’nın kurucu ortağı ve daha önce görülmemiş akıl yürütme görevlerine uyum sağlama yeteneğini değerlendiren bir zeka ölçütü olan ARC Ödülü’nün ortak yaratıcısı François Chollet’e göre, daha yüksek bir özerklik düzeyi gerçek zeka ile aynı şey değildir.
“Zekayı yalnızca insan başarılarının dar tanımlarına dayalı olarak değerlendirmek, bir dizi yeteneği gözden kaçırmak anlamına gelir.” Rumman Chowdhury, İcra Kurulu Başkanı, Humane Intelligence.
“Zeka, zaten bildiğiniz şeyleri yeni kalıplar halinde yeniden birleştirerek yeni sorunları verimli bir şekilde çözme yeteneğidir,” diyor Chollet. ARC-AGI-2 karşılaştırma testinde, saf büyük dil modelleri (LLM’ler) %0 puan alıyor, diye açıklıyor. YZ akıl yürütme sistemleri ise tek haneli yüzde puanları alıyor. İnsanlar ise neredeyse her görevi çözebiliyor.
“Test, insan zekasının bugün sahip olduğumuz en güçlü modellerle karşılaştırıldığında ne kadar daha uyumlu olduğunu gösteriyor,” diyor Chollet. Bratt, YZ ile insan beyninin gelişim dinamikleri arasında paralellikler görüyor. Bu dinamikler, beynin işlevselliğinin erken yıllarda nasıl geliştiğinigösteren insan plastisite eğrisinde kodlanmıştır. İlk aşama, görme ve işitme duyu sistemleridir, bunu dil ve son olarak da “Zekayı sadece insan başarılarının dar tanımlarına dayanarak değerlendirmek, bir dizi yeteneği gözden kaçırmak demektir.” Rumman Chowdhury, Humane Intelligence İcra Kurulu Başkanı
ileriye dönük planlama yeteneği gibi bilişsel yetenekler. Tıpkı insan beyninin bebeklik döneminde olduğu gibi, ilk YZ ağları görme ve duyu sistemlerine odaklandı, ardından doğal dil kullanıcı arayüzleri geldi ve şimdi bilişin eşiğindeyiz. YZ “hala bebeklik aşamasında” diyor Bratt ve insanlar gibi, bilişsel sıçrama çok daha uzun sürecek. İnsan benzeri zekaya ulaşmak için
İnsan benzeri zekaya ulaşmak için çeşitli alanlarda ilerleme kaydedilmesi gerekiyor. Bunlardan biri, eğitimli modellerin öğrendikleri bilgileri yeni verilere uygulayıp, edindikleri bilgilere dayalı olarak tahminler ve kararlar verdikleri süreç olan çıkarımdır. Çıkarım, modellerin önceden oluşturulmuş bilgileri çeşitli bağlamlardaki yeni sorunlara uyarlamasını sağlar.
İkincisi ise uyarlanabilirlik ve bilgi aktarımıdır. Geçmişteki YZ sistemleri özel alanlarda başarılı olsalar da, tanıdık olmayan sorunlarla karşılaştıklarında veya kuralları okuduktan sonra yeni bir masa oyunu oynamayı öğrenmek,
matematik problemlerini çözmek veya aynı çerçeve içinde sosyal durumları açıklamak gibi zorluklarla karşılaştıklarında zorlandılar. Bunu başarmak için makine öğrenimi, akıl yürütme, hafıza ve karar verme alanlarında çığır açan gelişmeler gereklidir. Bu yeteneklerin bazıları, GPT-4 gibi LLM’lerde büyük ölçekte gösterilmiştir. Bu modellerde metin anlama ve üretme yetenekleri, dil işlemede genel zeka biçimini sergilemiştir. Küçük dil modelleri, daha verimli olmak ve akıllı telefonlar ve uç cihazlar gibi sınırlı kaynaklara sahip cihazlarda kullanılabilmek için hesaplama gereksinimlerini azaltarak benzer yetenekler sunar.
Metin, görsel ve diğer veri türlerini entegre eden çok modlu modellerin geliştirilmesi, çağdaş YZ’nın genelleme yeteneklerini daha da geliştirir. Bu modeller, farklı modaliteler arasında içeriği anlayabilir ve üretebilir, böylece YZ’yı insan benzeri anlayış ve etkileşime daha da yaklaştırır. Ancak bu modeller, yeni bilgiyi otonom olarak üretme veya eğitim verilerinin dışında uyum sağlama yeteneğinden yoksun oldukları için, gerçek genel zekaya hala ulaşamamaktadır.
Chollet, “Temel modellerin akıcı zekası yoktur” diye savunuyor. LLM’lerdeki ve ölçeklendirmedeki ilerlemelere rağmen, “bildiklerini yeni bir sorunun çözümüne yeniden birleştirebilme yetenekleri yoktur” ve mevcut modellerin “kalıpları ezberlemede çok iyi, ancak anında yeni kalıplar üretmede çok iyi olmadığını” açıklıyor.
Model değerlendirmeye odaklanan kar amacı gütmeyen bir kuruluş olan Humane Intelligence’ın CEO’su Rumman Chowdhury’ye göre, sektör bilgisayar zekasının ne anlama geldiğine dYZr daha geniş bir çerçeveye ihtiyaç duyabilir.
“Hayvan, böcek, miselyal, hatta dünya dışı zekayı tanımlamak için metodolojilerimiz var ve YZ bunlar karşılanmıyor” diyor.
“Hayvan zekası değerlendirmeleri, maymunların Tıp Fakültesi Giriş Sınavını (MCAT) geçip geçemeyeceğine dayanmaz, çünkü zekayı sadece insan başarılarının dar tanımlarına göre değerlendirmek, bir dizi yeteneği gözden kaçırır,” diye ekliyor Chowdhury.
Uyarlanabilirlik ve esneklik gibi akıcı zeka, sosyal anlayış gibi sosyal zeka ve çevresel algı gibi somut zeka gibi ölçüm kriterleri, AGI’yi daha iyi ölçerken, insanlardan farklı yeni zeka biçimlerine da açık olabilir.

Hesaplama zorunluluğu
AGI zaman çizelgesi tartışmasında yer alan bir tartışma konusu, daha fazla hesaplama eklemenin zeka sorununu çözüp çözemeyeceğidir. 2010’dan önce, YZ hesaplama gereksinimleri öngörülebilir bir yörünge izleyerek her 21 ayda bir ikiye katlanıyordu. Derin öğrenme ortaya çıktığında, bu zaman çizelgesi sadece 5,7 aya düştü (bkz. Şekil 2).
Büyük ölçekli YZ modelleri, çağdaş YZ modellerine göre yaklaşık 100 kat daha fazla hesaplama gücü kullanır. AGI, 10^16 teraflop’tan fazla hesaplama gücü gerektirebilir.
“Her şeyin bilişsel olarak geliştirildiği uzak bir geleceği mümkün kılmak istiyorsak, bu, hesaplama alanında büyük bir adım fonksiyonu artışı anlamına gelecektir.”Ian Bratt, ML Teknolojisi Başkan Yardımcısı ve Arm Üyesi
Bazı tahminlere göre, bu maliyet 2037 yılına kadar ABD’nin toplam GSYİH’sini aşacaktır. Brat’ın dediği gibi. NPU’lar, TPU’lar ve yeni ortaya çıkan mimariler dahil olmak üzere YZ hızlandırıcılarındaki ilerlemeler, hesaplama verimliliğini ve enerji tüketimini optimize etmek için gereklidir.
Bratt, “Her şeyin bilişsel olarak geliştirildiği uzak bir geleceği mümkün kılmak istiyorsak, bu [hesaplama alanında] büyük bir adım olacak” diye tahmin ediyor. “O gelecekteki dünyada, en küçük cihazlardan buluta kadar, yığının tüm farklı katmanlarında YZ çalışacak. Bunu mümkün kılmak istiyorsak, bir topluluk ve ekosistem olarak platformlarımızın enerji verimliliğini iyileştirmeye ve bunu yazılım ve yazılım etkinleştirme ile sağlamaya odaklanmalıyız.”
Yazılım ve donanım, algoritmalar ve çiplerdeki (yapay zeka hesaplama yığını) atılımlar çok önemli olacak (bkz. Şekil 3). Ancak, yalnızca hesaplama ile AGI’ye ulaşmaya çalışmak yerine, başarı için hızın yanı sıra gecikme süresi, bant genişliği ve enerji açısından da optimize edilmiş, daha verimli, dağıtılmış ve bağlam farkında hesaplama mimarileri gerekecek. Bratt, YZ işlemenin geleceğinin muhtemelen bazı iş yükleri için hafif modeller ve hesaplama verimliliğinde sürekli iyileştirme içeren heterojen bir yaklaşım gerektireceğini belirtiyor.
“Donanım ve yazılımın bir kombinasyonu olmalı. Tüm ekosistemle işbirliği yapmalı ve onu desteklemeliyiz.”
Chollet, daha fazla entelektüel ilerlemenin de kritik öneme sahip olacağına inanıyor. “Ben hesaplamanın darboğaz olduğunu düşünmüyorum.
Gerçek darboğaz fikirlerdir. Doğru fikirleriniz olduğunda, bunlar tanım gereği hesaplama açısından verimli olacaktır, çünkü zeka verimliliktir. İyi haber ise, ürettiğimiz hesaplamaların yeniden kullanılabilir olacağıdır.” ve Latent Space Advisory’nin kurucusu, günümüzün büyük dil modellerinin teknik temeline atıfta bulunarak.
“AGI’ye ulaşmak, tıpkı transformatörlerin üretken YZ’da önemli ilerlemelere yol açtığı gibi, yeni bir mimariyle ilgili olabilir.”
AGI, özellikle akıl yürütme, hafıza ve öğrenme alanlarında, derin öğrenme devrimi veya günümüzün üretken YZ’sının arkasındaki dil ve görüntü tahmin yeteneklerine benzer yeni atılımlar gerektirebilir.
“AGI, insan zekasının tüm alanlarında performans gösterebilen ve yeni sorunlara yeni yollarla yaklaşabilen bir şey olarak tanımlanır. “AGI, insan zekası ve bilgisinin tüm alanlarında performans gösterebilen ve yeni sorunlara yeni yollarla hareket edebilen bir şey olarak tanımlanır.
Dilın nasıl çalıştığına dYZr çok boyutlu temsillere dayalı olasılık haritası üzerinde çalışırken, AGI iyi sonuç vermez,” diyor YZ uzmanı Henry Ajder.
AGI’ye giden yol, muhtemelen farklı felsefelerin ve yaklaşımların sentezini gerektirecek ve bu da birleşik bir ekosistem oluşturmak için sektör genelinde işbirliğini gerektirecektir. Özel donanım ve heterojen hesaplama gibi yeni hesaplama yaklaşımlarındaki ilerlemeler, ölçeklendirmeyi daha verimli hale getirebilir.
Mimari tasarımdaki atılımlar, yeni akıl yürütme ve anlama biçimlerinin önünü açabilir. Ve AGI’nin şekli ve anlamı hakkındaki tartışma, ilerlemeyi teşvik etmektedir. Chowdhury’nin yeni zeka çerçeveleri çağrısı da gösterdiği gibi, AGI’ye giden yol bize zekanın doğası hakkında akıllı makineler inşa etmek kadar çok şey öğretebilir.
“AGI’ye ulaşmak, tıpkı transformatörlerin üretken YZ’da önemli ilerlemelere yol açtığı gibi, yeni bir mimariyle ilgili olabilir.”Henry Ajder, YZ Uzmanı ve Kurucu, Latent Space Advisory
“Yapay genel zekaya giden yol”, MIT Technology Review Insights tarafından hazırlanan bir yönetici brifing belgesidir. Laurel Ruma bu raporun editörü, Nicola Crepaldi ise yayıncısıdır. MIT Technology Review Insights, bu belgede yer alan tüm bulguları bağımsız olarak toplamış ve raporlamıştır.
Henry Ajder, YZ Uzmanı ve Latent Space Advisory Kurucusu / Ian Bratt, ML Teknolojisi Başkan Yardımcısı ve Arm Üyesi / François Chollet, Ndea Kurucu Ortağı ve ARC Prize Ortak Yaratıcısı / Rumman Chowdhury, Humane Intelligence İcra Kurulu Başkanı
