DeepSeek, Yapay Zeka Endüstrisinin Özündeki Çürümeyi Açığa Çıkardı

Bu yeni model neredeyse her şeyi değiştirdi.

WILL LOCKETT / Şubat 2025

Her birkaç on yılda bir, statükoyu yerle bir eden bir şey ortaya çıkar. 50’lerde bu Sputnik’ti. 90’larda internetti. Ve modern 20’lerde, OpenAI’ye meydan okumayı hedefleyen bir Çin yapay zekası olan DeepSeek gibi görünüyor. Peki DeepSeek’i bu kadar özel yapan şey nedir? Batı’da üretilen her şeyden daha ucuz, daha verimli ve genellikle daha kaliteli. Bu modelin inşası yalnızca 6 milyon dolara mal oldu; OpenAI ise yalnızca geçen yıl yapay zeka eğitimine 3 milyar dolardan fazla harcadı ve ayakta kalabilmek için Microsoft’tan 13 milyar dolar yatırım aldı. Ve sadece inşası daha ucuz değildi. DeepSeek’i çalıştırmanın maliyeti, OpenAI’nin o1 modelinden %96’dan fazla daha ucuz! Herhangi bir OpenAI modelinin aksine, DeepSeek’i ücretsiz olarak kullanabilirsiniz. Yine de, üçüncü taraf testlerinde DeepSeek, her OpenAI modelini belli bir farkla geride bıraktı. Şaşırtıcı olmayan bir şekilde, lansman sırasında DeepSeek App Store’da en yüksek puanlı ücretsiz uygulama oldu ve bu ürünün haberi çıktığında, Amerikan teknoloji borsasından 1 trilyon dolar silindi. Bunu yaparken, AI endüstrisinin özündeki çürümüş ideolojiyi açığa çıkardı. Peki, DeepSeek bunu nasıl başardı? Bu, AI’nın ve Amerikan teknoloji endüstrisinin geleceği için ne anlama geliyor? Ve daha da önemlisi, bu sizin için ne anlama geliyor?

Teknik meselelerle başlayalım. Bu kadar küçük bir bütçeyle bu kadar yetenekli bir modeli nasıl inşa ettiler?

Bu durumda, gereklilik yeniliğin anası gibi görünüyordu. ABD, bir süredir Çin’e yüksek kaliteli AI optimize edilmiş süper bilgisayar GPU’larının satışını kısıtladı. Fikir, bunların AI geliştirmek için olmazsa olmaz altyapılar olduğu ve bu kısıtlamanın ABD’yi oyunun bir adım önünde tutacağıydı ( serbest piyasa kapitalizmi için çok şey, değil mi? ). Sonuç olarak, DeepSeek modelini geliştirmek için yalnızca oyun için tasarlanmış daha zayıf, daha ucuz GPU’ları kullanabildi. Bu onları aşırı verimli olmaya zorladı.

Sonuç olarak, DeepSeek’in modeli OpenAI’nin eski ChatGPT-4 modelinin yalnızca %38’i büyüklüğündedir ve bu daha az güçlü çiplerde verimli bir şekilde çalışacak şekilde optimize edilmiştir. Ancak bu küçük boyut, OpenAI ile aynı yaklaşımı benimserlerse, modellerinin önemli ölçüde düşük performans göstereceği anlamına geliyordu! Bu yüzden, iki kritik değişiklik yaptılar.

Öncelikle mimari. OpenAI, “tam yoğun” olarak bilinen bir AI mimarisi kullanır. Bu temelde mimarinin, tüm parametreleri ve veri noktalarıyla her isteği işleyen tek, geniş bir ağdan oluştuğu anlamına gelir. Bu inanılmaz derecede hesaplama açısından yoğun, ancak fikir, onu daha geniş bir uygulamada daha yetenekli hale getirebilmesidir. DeepSeek bunun yerine çok daha seçicidir ve “uzmanların bir karışımı” mimarisini kullanır. Bu yaklaşımda, AI belirli sorguları yanıtlamada daha iyi olacak şekilde tasarlanmış birçok modele bölünür ve ne tür bir sorgu sorulduğunu anlayabilen ve onu yanıtlamak için en uygun AI modeline göre sınıflandırabilen ön yüzlü bir AI vardır. Bu, yalnızca bir sorunu çözmek için gereken AI parçalarını kullandığı ve tüm AI’yı kullanmadığı için çok daha verimli bir modeldir. Ayrıca, bu uzman AI’lar daha odaklı ve kapsamları sınırlı olduğu için çok maliyetli olan daha az eğitim gerektirdiği anlamına gelir. Ancak, bir takas olarak, bu yaklaşım, teoride, bir modelin tam yoğun mimariye sahip olanlardan daha az geniş bir uygulamaya sahip olmasını sağlamalıdır.

Ancak DeepSeek’i rakiplerine karşı veya gerçek dünyada test ederken bu uygulama kısıtlamasını görmüyoruz. Nasıl oluyor?

İşte bu, DeepSeek’in yaptığı ikinci değişiklik sayesinde oldu: Bitmiş ürünün açık kaynaklı olmasını sağlamak ve Batı’daki yapay zeka modellerinin çoğundan farklı olarak kapalı kaynaklı olmamasını sağlamak.

Kapalı kaynaklı yapay zekalar gizlice geliştirilir ve daha sonra model yayınlandığında kullanım durumları bulunur, bu nedenle OpenAI’nin maliyetli “tam yoğun modeli” kullanması gerekir ve yapay zekanın hayatımızın her olası köşesine zorla sokuluyormuş gibi görünmesinin nedeni, herhangi bir değer katmasa bile. Bu kapalı kaynaklı modellerin oluşturulması pahalıdır ve teknoloji şirketlerinin bunlara yaptıkları astronomik harcamaları haklı çıkaracak uygulamalar bulmaları gerekir. Ancak açık kaynaklı model tam tersi şekilde çalışır. Kullanıcılar akıllarında belirli kullanım durumları bulundurur ve geliştiricilerle birlikte yapay zekayı o belirli uygulamada kullanılabilir hale getirmek için çalışırlar. Bu, kapalı kaynaklı modellere göre gerçekten önemli alanlarda daha kullanışlı olan bir yapay zeka ile sonuçlanan çok daha odaklı, verimli ve daha ucuz bir geliştirmeyi mümkün kılar.

Peki, Batılı AI şirketlerinin çoğu neden kapalı kaynaklı bir yaklaşım kullanıyor? Bu, AI şirketinin tamamen sahip olduğu tescilli bir AI yaratır. Bu, AI şirketinin kullanımı için daha fazla ücret talep etmesini sağlar ve daha güvenli bir varlık yarattığı için daha fazla yatırım almalarına yardımcı olur. Sonuçta, bir teknoloji devi veya yatırım bankası, üzerinde tam güç ve kontrol sahibi olamayacakları veya milyarlarca dolara satamayacakları açık kaynaklı bir modeli finanse etmeyecektir. Bu kritik nokta hakkında birazdan daha fazla bilgi vereceğim.

DeepSeek’in çarpıcı verimliliğinin yapay zeka için büyük bir sıçrama olduğunu ve bunun yakın gelecekte insan benzeri yapay zekayı mümkün kılacağını ve yapay zeka dünyasındaki teknik sorunları çözeceğini iddia eden birkaç söylenti ve makale gördüm. Bu kesinlikle doğru değil. DeepSeek hala tüm yapay zekaların muzdarip olduğu aynı ölçekleme sorunlarından, gerçek biliş eksikliğinden ve sorgu hatalarından muzdarip. OpenAI’dan gelenlerden daha iyi bir araç değil ve daha ucuz maliyeti çok daha iyi araçlara kapı açmayacak. Temelde aynı kusurlara sahip aynı teknoloji; sadece aptalca olmayan bir şekilde yönetildi ve inşa edildi. O halde sorulması gereken soru şu: Batı neden bu kadar pahalı ve aşırı maliyetli kapalı kaynaklı modellere bu kadar takıldı?

Bence DeepSeek’in ana fikri bu. Çin’in AI yarışına hakim olabileceği değil. OpenAI’nin o kadar da eşsiz olmadığı değil. Bunun yerine, ABD ekonomisinin artık gerçek dünyaya dayanmaması ve bu nedenle gerçek inovasyona değer vermemesi. Kısacası, Amerika’nın geç dönem kapitalizme ne kadar düştüğünü ortaya koyuyor.

OpenAI başlangıçta açık kaynaklı olması gerekiyordu, ancak kapalı kaynaklı hale getirildi. Neden? Batılı risk sermayedarları, AI’yı ekonominin hemen hemen her sektöründe insan iş gücünü kendi AI’larıyla değiştirmenin bir yolu olarak görüyor, bu da onlara önemli bir kontrol sağlama ve büyük karlar elde etme olanağı sağlıyor. Bilim insanları ve AI geliştiricilerinin kendilerinin AI’nın bunu yapamayacağını ve asla yapamayacağını söylemelerine rağmen, yıllardır yayılan bir abartı bu. Ancak bu risk sermayedarları umursamadı; AI’ya yatırım yapmanın ve bu yanlış anlatıyı yaymanın hisse senetlerini artıracağını ve AI bunu başarabilsin ya da başaramasın onlara para kazandıracağını biliyorlardı. Bu nedenle, OpenAI ve neredeyse her Batılı AI projesi, bu AI şirketlerinin yatırımcılarını ve yöneticilerini zenginleştirdiği için böyle bir yatırımı mümkün kılmak için kapalı kaynaklı hale geçti.

Aslında Amerika’nın Çin’e GPU satışlarını kısıtlamasının gerçek nedeni de budur; yapay zeka yarışında öne geçmek değil, Amerikan yatırımını ve sektördeki hegemonik hakimiyetini korumak.

Kısacası, AI’yı olması gerekenden daha kötü ve daha pahalı bir ürün haline getiriyorlar, sektör için gerçek serbest piyasa ekonomisini gerçek inovasyon pahasına ortadan kaldırıyorlar, aynı zamanda yatırımcıları zenginleştirmek için tüketici pahasına teknoloji hakkında yanlış bilgi yayıyorlar. Bu, geç dönem kapitalizmi değil, daha çok karmaşık, plütokratik, post-kapitalist bir piyasa müdahalesine benziyor.

DeepSeek’in gerçek dünyada kendini kanıtlamamış ve bazı ciddi güvenlik sorunları olmasına rağmen borsadan 1 trilyon doları silmesinin nedeni budur. Bu, gerçek dünya ekonomisinin yoğun bir şekilde korunan ve yanlış şişirilmiş Amerikan balonuna tecavüz ettiğini temsil ediyordu.

Ve bu ekonomik çürüme sadece AI endüstrisinde mevcut değil. Artık tüm Batı ekonomisinde yaygın. Aslında, orta sınıfın bu kadar sıkıştırılmasının sebebi bu, çünkü bir zamanlar onları koruyan kapitalizmin yerleşik yasaları ve hareketleri %1’i zenginleştirmek için geçersiz kılınıyor.

Yani evet, DeepSeek bir Sputnik veya World Wide Web anı. Sadece AI için değil. Aslında AI dünyasını çok fazla değiştirmediler, çünkü teknolojinin tüm korkunç sorunları ve ölümcül kusurları hala çok fazla duruyor. Ancak Batı ekonomilerinin kalbindeki ekonomik çürümeyi açığa çıkarıyor ve bu da bize çok fazla acı, çekişme ve hak mahrumiyeti getiriyor. İçinde yüzdüğümüz saçmalıkların ötesine geçip gerçek dünyaya geri dönmemiz için ihtiyacımız olan uyanma çağrısı. Sonuçta, yarı-Komünist bir ülke ABD’den daha iyi piyasa ekonomisine ulaşabiliyorsa, ciddi bir sorun var demektir.

https://www.planetearthandbeyond.co/p/deepseek-just-exposed-the-rot-at