Teknoloji liderleri daha akıllı Yapay Zeka için dünya modellerine bakıyor.

Sascha Brodsky Teknoloji Muhabiri, IBM

Ev kediniz ChatGPT’den daha akıllı olabilir. Yapay zeka artık şiir yazabiliyor ve hukuk fakültesi sınavlarını geçebiliyor olsa da, kedinizin pencere kenarlarında gezinmesini ve avına atılmasını sağlayan temel akıl yürütme yeteneklerine hâlâ erişemiyor.

Yapay zekanın insan bilgisine hakimiyeti ile bir hayvanın fiziksel dünya anlayışına ulaşamaması arasındaki bu boşluk, daha zeki makineler arayışında önemli bir zorluk olarak ortaya çıktı. Meta’nın baş yapay zeka bilimcisi Yann LeCun , geçen hafta Paris’te düzenlenen bir yapay zeka güvenlik zirvesinde bu konuyu gündeme getirerek , ” dünya modelleri “nin (yapı, dinamik ve nedensel ilişkilerin içsel temsillerini oluşturan yapay zeka sistemleri) yapay zekayı ilerletmede anahtar olabileceğini savundu .

Ancak bazı önde gelen araştırmacılar bu yaklaşımın göründüğü kadar çığır açıcı olup olmadığını sorguluyor.

“YZ, 1950’lerden beri dünya modelleri kullanıyor ve YZ’nın birkaç alt alanı tamamen dünya modellerine dayanıyor,” diyor Kaliforniya Üniversitesi Berkeley’de Bilgisayar Bilimi Profesörü olan Stuart J. Russell IBM Think’e. “Bu, matematiğin fizik için yararlı olabileceğini öne sürmek kadar yenilikçi ve yaratıcı.”

AGI arayışı

Tartışma, yapay genel zeka (AGI) veya hemen hemen her alanda insan seviyesinde öğrenme ve muhakemeyi karşılayabilen veya aşabilen YZ sistemleri elde etmek için yoğunlaşan bir kovalamacayı vurguluyor. Satranç veya dil işleme gibi dar görevlerde üstünlük sağlayan günümüzün uzmanlaşmış AI sistemlerinin aksine, AGI’nin dünyayı daha temelden anlaması, muhakeme yeteneklerini, fiziksel anlayışı ve uyum sağlama yeteneğini bir araya getirmesi gerekecektir.

Büyük teknoloji şirketleri bu zorluğa farklı yaklaşımlar benimsedi. OpenAI, GPT serisi aracılığıyla giderek daha karmaşık akıl yürütme elde etmek için dil modellerini ölçeklendirmeye odaklandı . AlphaFold ve AlphaGo gibi sistemlerle Google DeepMind , daha genel yetenekler üzerinde çalışırken belirli alanları hedef aldı . Bu arada Meta, yalnızca metinden ziyade gerçek dünya etkileşiminden öğrenmenin önemini vurguladı .

“İnsan zekasını yeniden üretmeye çalışmayı boş verin,” dedi LeCun zirvede. “Kedi zekasını veya fare zekasını bile yeniden üretemeyiz. Herhangi bir ev kedisi çok karmaşık eylemler planlayabilir.”

Mevcut yapay zekanın sınırları

Son yıllarda, YZ sistemleri belirli alanlardaki kıyaslamalarda puanlarını hızla artırdı. Ancak LeCun, araştırmacıların Moravec’in paradoksu dediği şeye işaret ediyor : İnsanların kolay bulduğu becerilerin makinelerin ustalaşmasının çoğu zaman en zor olduğu gözlemi.

“İnsanlar ve hayvanlar yapabildiği için hafife aldığımız şeylerin karmaşık olmadığını düşünüyoruz – aslında çok karmaşık,” diyor LeCun. “Ve dilin manipüle edilmesi ve üretilmesi, satranç oynamak, go oynamak gibi yalnızca insanlara özgü olduğunu düşündüğümüz şeyler… nispeten kolay çıkıyor.”

Bu paradoks, yani yapay zekanın, görünürde temel fiziksel ve algısal yeteneklerle boğuşurken, bizim entelektüel olarak zorlayıcı olduğunu düşündüğümüz görevlerde başarılı olması, bazı uzmanların şüpheciliğine yol açıyor.

“Bir dizi retinal görüntüden, örneğin Maxwell’in elektromanyetizma denklemlerine geçme süreci insan ırkının on binlerce yılını aldı ve kavram oluşturma ve matematikselleştirmenin kümülatif bir sürecini gerektirdi,” diyor Russell. “Mevcut derin öğrenme sistemlerinde buna benzer bir şey görmedim.”

Veri ve anlayış

Mevcut sınırlamaları örneklemek için LeCun çarpıcı bir karşılaştırmaya işaret etti: modern LLM’ler trilyonlarca jetonla eğitim görüyor; bir insanın okuması yarım milyon yıl sürecek bir metin miktarı . Yine de sadece yaklaşık 16.000 saat uyanık kalan dört yaşında bir çocuk, yalnızca görsel algı yoluyla karşılaştırılabilir miktarda veriyi işler.

“Dört yaşında bir çocuk, görsel algı biçiminde en büyük LLM kadar veri görmüştür ve kör çocuklar için bu dokunmadır,” dedi LeCun. “Bu size birçok şey anlatır. Sadece metin üzerinde eğitim alarak asla insan seviyesinde zekaya ulaşamayacağız.”

Bu gözlem araştırmacıları yeni yaklaşımlar keşfetmeye itti. Meta’da, LeCun’un ekibi “yapay genel zeka” teriminden tamamen uzaklaşarak “gelişmiş makine zekası” (AMI) terimini tercih etti. LeCun, “Bunun nedeni insan zekasının aslında oldukça uzmanlaşmış olması ve bu nedenle ona AGI demek biraz yanlış bir adlandırma,” dedi.

İleriye giden yol

LeCun, yapay zekanın nasıl evrimleşeceğini tamamen yeniden düşünmemiz gerektiğini düşünüyor. İnsan beynini kopyalamaya çalışmaktansa, yapay zekanın dünyayı nasıl öğrendiğini ve anlamlandırdığını değiştirmek istiyor. Yapay zekanın, fiziksel nesnelerin sadece videolar izleyerek nasıl davrandığını öğrenmek gibi, “duyuları” aracılığıyla bilgi alarak kendi zihinsel gerçeklik resmini oluşturması gerektiğini savunuyor. Bu yapay zeka sistemlerinin, şeyleri tutarlı bir şekilde hatırlamaları ve işleri halletmek için eylemlerini adım adım nasıl planlayacaklarını bilmeleri gerekir.

Bilgisayar bilimcileri, YZ sistemlerinin dünyaya dair kendi anlayışlarını nasıl geliştirebilecekleri konusunda farklı görüşlere sahip. Washington Üniversitesi Emeritus Profesörü Pedro Domingos, ilerlemenin mümkün olduğunu ancak hemen gerçekleşmeyeceğini düşünüyor. IBM Think’e “Kendi dünya modellerini geliştiren YZ’lar inşa etmek tamamen gerçekçi,” dedi, “ancak henüz nasıl yapılacağını bilmiyoruz ve daha fazla araştırmaya ihtiyaç var.”

Mevcut YZ yetenekleri, özellikle karmaşık görevleri ele almada, insan düzeyindeki akıl yürütmenin gerisinde kalmaktadır. Russell’ın ifade ettiği gibi: “1960’lardan beri, basit, tekdüze dünya modelleri kullanmanın tamamen çözümsüz akıl yürütme ve planlama sorunlarına yol açtığını anladık. (Önceden ihtiyaç duyulacak 800 milyon kas aktivasyonunun tam sırasını hesaplayarak bir tatil planlamaya çalıştığınızı düşünün.)” İnsanların, bilgileri farklı şekilde işlediğini belirtiyor: “İnsanların bunu aşmak için kullandıkları temel araç hiyerarşidir; birçok soyutlama düzeyinde birçok modelle çalışırız, büyük, yüksek seviyeli eylemlerden … bu e-postadaki bir sonraki ‘i’ harfini yazmak için parmağınızı hareket ettirmek gibi küçük, düşük seviyeli eylemlere kadar.”

 

https://www.ibm.com/think/news/world-models-smarter-ai

Scroll to Top