Yapay zeka neden ‘Çilek/Strawberry’ kelimesini yazamıyor?

Amanda Silberling/27 Ağustos 2024

“Çilek/Strawberry” kelimesinde “r” harfi kaç kez görünüyor? GPT-4o ve Claude gibi müthiş AI ürünlerine göre cevap iki kez.

Büyük dil modelleri (LLM’ler) saniyeler içinde denemeler yazabilir ve denklemleri çözebilir. Terabaytlarca veriyi insanların bir kitabı açmasından daha hızlı sentezleyebilirler. Yine de, bu görünüşte her şeyi bilen yapay zekalar bazen o kadar muhteşem bir şekilde başarısız olurlar ki talihsizlik viral bir meme’e dönüşür ve hepimiz belki de yeni yapay zeka efendilerimize boyun eğmemiz için hala zamanımız olduğunu düşünerek rahatlarız.

Büyük dil modellerinin harf ve hece kavramlarını anlamadaki başarısızlığı, sıklıkla unuttuğumuz daha büyük bir gerçeğin göstergesidir: Bu şeylerin beyinleri yoktur. Bizim gibi düşünmezler. İnsan değillerdir, hatta özellikle insan gibi bile değillerdir.

Çoğu LLM, bir tür derin öğrenme mimarisi olan transformatörler üzerine kuruludur. Transformatör modelleri, modele bağlı olarak metni tam kelimeler, heceler veya harfler olabilen belirteçlere ayırır.

“LLM’ler, özellikle metni gerçekten okumayan bu dönüştürücü mimariye dayanmaktadır. Bir istem girdiğinizde olan şey, bunun bir kodlamaya çevrilmesidir,” Alberta Üniversitesi’nde yapay zeka araştırmacısı ve yardımcı doçent olan Matthew Guzdial, TechCrunch’a söyledi . “’The’ kelimesini gördüğünde, ‘the’nin ne anlama geldiğine dair bu tek kodlamaya sahiptir, ancak ‘T’, ‘H’, ‘E’ hakkında bir şey bilmez.”

Bunun nedeni, dönüştürücülerin gerçek metni verimli bir şekilde alamaması veya çıktı alamamasıdır. Bunun yerine, metin kendi sayısal gösterimlerine dönüştürülür ve bu daha sonra AI’nın mantıksal bir yanıt bulmasına yardımcı olmak için bağlamlandırılır. Başka bir deyişle, AI “straw” ve “berry” belirteçlerinin “strawberry”yi oluşturduğunu bilebilir, ancak “strawberry”nin belirli bir sırayla “s”, “t”, “r”, “a”, “w”, “b”, “e”, “r”, “r” ve “y” harflerinden oluştuğunu anlamayabilir. Bu nedenle, “strawberry” kelimesinde kaç harfin -kaç tane “r”nin- göründüğünü size söyleyemez.

Bu, çözülmesi kolay bir sorun değil, çünkü bu sorun, bu LLM’lerin çalışmasını sağlayan mimarinin içine gömülü.

https://techcrunch.com/2024/08/27/why-ai-cant-spell-strawberry/