Yapay zekanın iniş-çıkış döngüsünden çıkmanın bir yolu var mı?
Eliza Strickland / Eylül 2021
1956 yazında, bir grup matematikçi ve bilgisayar bilimcisi Dartmouth College’ın matematik bölümünün bulunduğu binanın en üst katını ele geçirdi. Yaklaşık sekiz hafta boyunca yeni bir araştırma alanının olasılıklarını hayal ettiler. O zamanlar Dartmouth’ta genç bir profesör olan John McCarthy , atölye için önerisini yazarken ” yapay zeka ” terimini ortaya atmıştı . Önerinin, “öğrenmenin her yönü veya zekanın herhangi bir başka özelliğinin prensipte o kadar kesin bir şekilde tanımlanabileceği ve bir makinenin bunu simüle edebileceği” hipotezini araştıracağını söylemişti.
O efsanevi toplantıdaki araştırmacılar, bugün bildiğimiz şekliyle yapay zekayı ana hatlarıyla çizdiler. Bu, ilk araştırmacı kampının ortaya çıkmasına neden oldu: Uzman sistemleri 1980’lerde zirveye ulaşan “sembolistler”. Toplantıdan sonraki yıllarda, yakın zamanda popülerlik kazanan yapay sinir ağları üzerinde onlarca yıl çalışan “bağlantıcılar” da ortaya çıktı . Bu iki yaklaşım uzun süre birbirini dışlayan şeyler olarak görüldü ve araştırmacılar arasındaki fon rekabeti düşmanlık yarattı. Her iki taraf da yapay genel zekaya doğru yolda olduğunu düşünüyordu .
O toplantıdan bu yana geçen on yıllara bakıldığında, YZ araştırmacılarının umutlarının ne sıklıkla yıkıldığı ve bu aksiliklerin onları ne kadar az caydırdığı görülüyor. Bugün, YZ endüstrileri devrim niteliğinde değiştirirken ve küresel işgücü piyasasını altüst etmekle tehdit ederken, birçok uzman günümüz YZ’sının sınırlarına ulaşıp ulaşmadığını merak ediyor. Charles Choi’nin ” YZ’ların Başarısız Olmasının Yedi Açıklayıcı Yolu ” adlı eserinde belirttiği gibi, günümüzün derin öğrenme sistemlerinin zayıflıkları giderek daha belirgin hale geliyor. Yine de araştırmacılar arasında pek de kıyamet hissi yok. Evet, çok da uzak olmayan bir gelecekte bir başka YZ kışı daha yaşamamız mümkün. Ancak bu, ilham veren mühendislerin bizi nihayet makine zihninin sonsuz yazına götürdüğü zaman olabilir.
Sembolik YZ geliştiren araştırmacılar, bilgisayarlara dünya hakkında açık bir şekilde eğitim vermeyi amaçladılar. Kuruluş ilkeleri, bilginin bir dizi kuralla temsil edilebileceğini ve bilgisayar programlarının bu bilgiyi manipüle etmek için mantığı kullanabileceğini savundu. Önde gelen sembolistler Allen Newell ve Herbert Simon, sembolik bir sistemin yeterli yapılandırılmış gerçek ve öncüllere sahip olması durumunda, bir araya gelmenin sonunda geniş bir zeka üreteceğini savundu.
Bağlantıcılar ise biyolojiden ilham alarak, bilgiyi alıp kendi başlarına anlamlandıracak “yapay sinir ağları” üzerinde çalıştılar. Öncü örnek , ABD Donanması’ndan aldığı fonla Cornell psikoloğu Frank Rosenblatt tarafından inşa edilen deneysel bir makine olan perceptron’du . Birlikte bir retina gibi davranan ve işlemeyi yapan ve tek bir çıktı üreten yaklaşık 1.000 ” nörona ” bilgi sağlayan 400 ışık sensörüne sahipti. 1958’de New York Times’da yayınlanan bir makalede Rosenblatt’ın “makinenin insan beyni gibi düşünen ilk cihaz olacağını” söylediği aktarıldı.

Dizginsiz iyimserlik, ABD ve Birleşik Krallık’taki hükümet kurumlarını spekülatif araştırmalara para yatırmaya teşvik etti. 1967’de, MIT profesörü Marvin Minsky şöyle yazdı: “Bir nesil içinde… ‘yapay zeka’ yaratma sorunu önemli ölçüde çözülecek.” Ancak kısa bir süre sonra, YZ araştırmasının kendi abartısına uymadığı duygusuyla hükümet fonları kurumaya başladı. 1970’ler ilk YZ kışını gördü.
Ancak gerçek inananlar devam etti. Ve 1980’lerin başında yenilenen coşku, hukuk veya tıp gibi belirli bir disiplinin bilgisini kodlayan ” uzman sistemler ” için övgü ve fon alan sembolik YZ araştırmacıları için bir altın çağ getirdi. Yatırımcılar bu sistemlerin hızla ticari uygulamalar bulacağını umuyordu. En ünlü sembolik YZ girişimi, araştırmacı Douglas Lenat’ın bir makinede sağduyuyu kodlamayı amaçlayan Cyc adını verdiği bir proje üzerinde çalışmaya başladığı 1984’te başladı . Lenat ve ekibi, bugüne kadar Cyc’nin ontolojisine terimler (gerçekler ve kavramlar) eklemeye ve aralarındaki ilişkileri kurallar aracılığıyla açıklamaya devam ediyor. 2017’ye gelindiğinde, ekip 1,5 milyon terime ve 24,5 milyon kurala sahipti. Yine de Cyc hala genel zekaya ulaşmaktan çok uzak.
1980’lerin sonlarında, ticaretin soğuk rüzgarları ikinci YZ kışını getirdi. Uzman sistemler pazarı çöktü çünkü özel donanım gerektiriyorlardı ve yaygınlaşan daha ucuz masaüstü bilgisayarlarla rekabet edemiyorlardı. 1990’lara gelindiğinde, sembolik YZ veya sinir ağları üzerinde çalışmak artık akademik olarak moda değildi çünkü her iki strateji de başarısız olmuş gibi görünüyordu.
1956’da bir atölye binasının önündeki çimlerde oturan adamların görüntüsü. Herbert Simon’un bir sınıfta ders verirkenki görüntüsü. Allen Newell’in bir sınıfta yapay zeka kurallarını öğrettiği görüntü.
Ancak uzman sistemlerin yerini alan ucuz bilgisayarlar, birdenbire yapay nöronların birçok katmanıyla sinir ağlarını çalıştırmak için yeterli bilgisayar gücüne erişen bağlantıcılar için bir nimet oldu. Bu tür sistemler derin sinir ağları olarak bilinmeye başlandı ve sağladıkları yaklaşıma derin öğrenme adı verildi . Toronto Üniversitesi’nden Geoffrey Hinton , sinir ağlarının hatalarından ders çıkarmasını sağlamak için geri yayılım adı verilen bir ilke uyguladı (bkz. ” Derin Öğrenme Nasıl Çalışır “).
Hinton’ın doktora sonrası araştırmacılarından Yann LeCun , 1988’de AT&T Bell Laboratuvarları’na gitti ve burada Yoshua Bengio adlı bir doktora sonrası araştırmacıyla birlikte optik karakter tanıma için sinir ağlarını kullandı ; ABD bankaları kısa sürede çekleri işlemek için bu tekniği benimsedi. Hinton, LeCun ve Bengio sonunda 2019 Turing Ödülü’nü kazandılar ve bazen derin öğrenmenin vaftiz babaları olarak anılırlar.
Ancak sinir ağı savunucularının hâlâ büyük bir sorunu vardı: Teorik bir çerçeveleri ve büyüyen bir bilgisayar güçleri vardı, ancak sistemlerini eğitmek için dünyada yeterli dijital veri yoktu, en azından çoğu uygulama için. Bahar henüz gelmemişti.
Son yirmi yılda her şey değişti. Özellikle World Wide Web gelişti ve aniden her yerde veri vardı. Dijital kameralar ve ardından akıllı telefonlar interneti görüntülerle doldurdu, Wikipedia ve Reddit gibi web siteleri serbestçe erişilebilen dijital metinlerle doluydu ve YouTube’da bolca video vardı. Sonunda, sinir ağlarını çok çeşitli uygulamalar için eğitmek için yeterli veri vardı.

Diğer büyük gelişme oyun endüstrisinden geldi. Nvidia gibi şirketler, video oyunlarında görüntüleri işlemek için gereken ağır işleme için grafik işleme birimleri ( GPU ) adı verilen çipler geliştirdiler . Oyun geliştiricileri, GPU’ları karmaşık gölgelendirme ve geometrik dönüşümler yapmak için kullandılar. Ciddi hesaplama gücüne ihtiyaç duyan bilgisayar bilimcileri, GPU’yu sinir ağlarını eğitmek gibi diğer görevleri yapmaya kandırabileceklerini fark ettiler. Nvidia bu eğilimi fark etti ve araştırmacıların GPU’ları genel amaçlı işleme için kullanmalarını sağlayan bir platform olan CUDA’yı yarattı. Bu araştırmacılar arasında , 2012’de herkesi hayrete düşüren bir sinir ağının kodunu yazmak için CUDA’yı kullanan Hinton’un laboratuvarındaki Alex Krizhevsky adlı bir doktora öğrencisi de vardı.
Bunu, yapay zeka araştırmacılarını 1 milyondan fazla görüntüyü 1.000 nesne kategorisine ayırabilen bilgisayar görüş sistemleri inşa etmeye davet eden ImageNet yarışması için yazdı. Krizhevsky’nin AlexNet’i görüntü tanıma için kullanılan ilk sinir ağı olmasa da , 2012 yarışmasındaki performansı dünyanın dikkatini çekti. AlexNet’in hata oranı, ikinci en iyi katılımcının %26’lık hata oranıyla karşılaştırıldığında %15’ti. Sinir ağı, açık ara zaferini GPU gücüne ve toplamda 650.000 nöron içeren çok katmanlı “derin” bir yapıya borçluydu. Sonraki yılki ImageNet yarışmasında, hemen hemen herkes sinir ağlarını kullandı. 2017’ye gelindiğinde, yarışmacıların çoğunun hata oranları %5’e düştü ve organizatörler yarışmayı sonlandırdı.
Derin öğrenme başladı. GPU’ların hesaplama gücü ve derin öğrenme sistemlerini eğitmek için bol miktarda dijital veriyle, otonom arabalar yollarda seyredebilir, sesli asistanlar kullanıcıların konuşmalarını tanıyabilir ve web tarayıcıları düzinelerce dil arasında çeviri yapabilirdi. Yapay zekalar ayrıca, eski masa oyunu Go ve video oyunu StarCraft II dahil olmak üzere, daha önce makineler tarafından kazanılamayacağı düşünülen birçok oyunda insan şampiyonları alt etti . Yapay zekadaki mevcut patlama, her sektöre dokunarak, kalıpları tanımanın ve karmaşık kararlar almanın yeni yollarını sundu.
On yıllar öncesine bakıldığında, yapay zeka araştırmacılarının umutlarının ne sıklıkla yıkıldığı ve bu aksiliklerin onları ne kadar az caydırdığı görülüyor.
Ancak derin öğrenmedeki zaferlerin genişleyen dizisi, sinir ağlarındaki katman sayısını artırmaya ve bunları eğitmek için ayrılan GPU süresini artırmaya dayanıyordu. YZ araştırma şirketi OpenYZ’nin yaptığı bir analiz , en büyük YZ sistemlerini eğitmek için gereken hesaplama gücünün 2012’ye kadar her iki yılda bir iki katına çıktığını ve bundan sonra her 3,4 ayda bir iki katına çıktığını gösterdi . Neil C. Thompson ve meslektaşlarının ” Deep Learning’s Diminishing Returns ” adlı kitapta yazdığı gibi, birçok araştırmacı YZ’nın hesaplama gereksinimlerinin sürdürülemez bir yörüngede olduğundan endişe ediyor . Gezegenin enerji bütçesini aşmaktan kaçınmak için araştırmacıların bu sistemleri inşa etmenin yerleşik yollarından çıkmaları gerekiyor.
Sinir ağı kampının sembolistleri kesin olarak alt ettiği düşünülebilirken , gerçekte savaşın sonucu o kadar basit değil. Örneğin, bir Rubik küpünü manipüle edip çözmesiyle manşetlere çıkan OpenYZ’dan robotik eli ele alalım . Robot, sinir ağlarını ve sembolik YZ’yı kullandı. Algı için sinir ağlarını ve akıl yürütme için sembolik YZ’yı kullanan birçok yeni nöro-sembolik sistemden biri, hem verimlilik hem de açıklanabilirlik açısından kazanımlar sağlayabilecek bir melez yaklaşım.
Douglas Lenat’ın görüntüsü. Geoffrey Hinton’ın görüntüsü. Yann LeCun’un görüntüsü. Yoshua Bengio’nun görüntüsü. Douglas Lenat’ın [üst] Cyc gibi sembolik YZ projeleri veya [üstten] Geoffrey Hinton, Yann LeCun ve Yoshua Bengio tarafından öncülük edilen derin öğrenme ilerlemeleri henüz insan seviyesinde zeka üretmedi. Üstten: Bob E. Daemmrich/Sygma/Getty Images; Christopher Wahl/The New York Times/Redux; Bruno Levy/REA/Redux; Cole Burston/Bloomberg/Getty Images
Derin öğrenme sistemleri , çıkarımları belirsiz ve gizemli yollarla yapan kara kutular olma eğiliminde olsa da , nöro-sembolik sistemler kullanıcıların kaputun altına bakmalarını ve yapay zekanın sonuçlarına nasıl ulaştığını anlamalarını sağlar. Evan Ackerman’ın ” ABD Ordusu Robotları Takım Oyuncularına Nasıl Dönüştürüyor ” adlı kitabında açıkladığı gibi, ABD Ordusu kara kutu sistemlerine güvenmek konusunda özellikle temkinlidir, bu nedenle Ordu araştırmacıları robotlarını ve otonom araçlarını sürmek için çeşitli hibrit yaklaşımları araştırmaktadır.
ABD ordusunun yol temizleme robotlarından birini alıp ondan size bir fincan kahve yapmasını isteyebileceğinizi hayal edin. Bu, günümüzde gülünç bir önermedir, çünkü derin öğrenme sistemleri dar amaçlar için oluşturulmuştur ve yeteneklerini bir görevden diğerine genelleştiremezler. Dahası, yeni bir görevi öğrenmek genellikle bir yapay zekanın önceki görevini nasıl çözeceğiyle ilgili bildiği her şeyi silmesini gerektirir, bu da felaket unutması olarak adlandırılan bir bilmecedir. Google’ın Londra merkezli yapay zeka laboratuvarı olan DeepMind’da , ünlü robotikçi RYZa Hadsell bu sorunu çeşitli karmaşık tekniklerle ele alıyor. ” DeepMind Robotu Nasıl Yeniden İcat Ediyor ” adlı kitabında Tom Chivers, bu sorunun öngörülemeyen gerçek dünyada hareket eden robotlar için neden bu kadar önemli olduğunu açıklıyor. Diğer araştırmacılar, nasıl öğreneceğini öğrenen ve ardından bu beceriyi herhangi bir alana veya göreve uygulayan yapay zeka sistemleri yaratma umuduyla yeni tür meta öğrenmeyi araştırıyorlar.
Tüm bu stratejiler araştırmacıların en yüce hedeflerine ulaşma çabalarına yardımcı olabilir: Çocuklarımızın geliştirdiğini gördüğümüz türden akıcı zekaya sahip yapay zeka oluşturmak. Küçük çocukların sonuç çıkarmak için çok miktarda veriye ihtiyacı yoktur. Onlar sadece dünyayı gözlemler, nasıl çalıştığına dYZr zihinsel bir model oluşturur, harekete geçer ve eylemlerinin sonuçlarını bu zihinsel modeli ayarlamak için kullanırlar. Anlayana kadar yineleme yaparlar. Bu süreç son derece verimli ve etkilidir ve günümüzün en gelişmiş yapay zekasının bile yeteneklerinin çok ötesindedir.
Mevcut coşku seviyesi YZ’ya kendi Gartner hype döngüsünü kazandırmış olsa da ve YZ için fonlama tüm zamanların en yüksek seviyesine ulaşmış olsa da, geleceğimizde bir sönme olduğuna dYZr çok az kanıt var. Dünya çapındaki şirketler, karlarında anında iyileşme gördükleri için YZ sistemlerini benimsiyorlar ve asla geri dönmeyecekler. Araştırmacıların derin öğrenmeyi daha esnek ve sağlam hale getirmek için uyarlamanın yollarını bulup bulamayacakları veya makineleri bizim gibi yapma yolundaki 65 yıllık arayışta henüz hayal edilmemiş yeni yaklaşımlar tasarlayıp tasarlamayacakları henüz görülecek.
Bu makale Ekim 2021 tarihli basılı sayıda “Yapay Zekanın Çalkantılı Geçmişi ve Belirsiz Geleceği” başlığıyla yer almaktadır.
Bu makale, yapay zeka üzerine hazırlanan raporun bir parçasıdır: “ Büyük Yapay Zeka Hesaplaşması”. Bu makaleye ulaşmak için aşağıdaki linki tıklayınız.
https://spectrum.ieee.org/special-reports/the-great-YZ-reckoning/