Yapay zekanın arkasında çok büyük bir gizli iş gücü var
Teknoloji geliştikçe bunlar gereksiz hale mi gelecek?
Çinli başarılı firma HEN DEEPSEEK , geçen yılın sonlarında piyasaya sürdüğü ucuz büyük dil modelini, yeni nesil yapay zekayı ( YZ ) geliştirmek için gerekenler hakkındaki uzun süredir devam eden varsayımları altüst etti. Bu, yapay zeka hakimiyeti için verilen küresel mücadelede kim üstün gelirse gelsin, önemli olacak .
Geliştiriciler artık ne kadar donanım, enerji ve veriye ihtiyaç duyulduğunu yeniden değerlendiriyor. Makine zekasına daha az tartışılan bir diğer girdi de değişim halindeki: iş gücü.
Sıradan bir insan için, yapay zeka tamamen robotlar, makineler ve modellerden oluşur. İşleri öldüren bir teknolojidir. Aslında, yapay zeka modellerinin üretiminde milyonlarca işçi çalışmaktadır. Çalışmalarının çoğu, otonom araçları eğitmek için yol görüntülerindeki nesneleri etiketlemek ve konuşma tanıma sistemlerini eğitmek için kullanılan ses kayıtlarındaki kelimeleri etiketlemek gibi görevleri içermektedir. Teknik olarak, açıklayıcılar verilere, bilgisayarların bir veri kümesinin bileşenleri ile insanlar için anlamları arasındaki istatistiksel ilişkileri anlamaları için ihtiyaç duydukları bağlamsal bilgileri sağlar. Aslında, yaya geçidi içeren fotoğrafları seçerek bir CAPTCHA testini tamamlayan herkes, istemeden bir yapay zekanın eğitilmesine yardımcı olmuş olabilir .
Bu, veri firması Scale AI’nın patronu Alex Wang’ın da dediği gibi, sektörün “çekici olmayan” kısmıdır bu. Scale AI, katkıda bulunan işlerinin çoğunun Amerika ve Avrupa’da gerçekleştiğini söylese de, sektörde emeğin çoğu, çok sayıda eğitimli insanın iş aradığı dünyanın yoksul bölgelerine taşeron olarak yaptırılıyor. Çin hükümeti, ülkenin ücra köşelerine ek açıklama işleri getirmek için Alibaba ve JD.com gibi teknoloji şirketleriyle iş birliği yaptı. Hindistan’da BT endüstrisi kuruluşu Nasscom, ek açıklama gelirlerinin 2030 yılına kadar yılda 7 milyar dolara ulaşabileceğini ve 1 milyon kişiye istihdam sağlayabileceğini tahmin ediyor. Bu önemli bir rakam, çünkü Hindistan’ın tüm BT endüstrisi yıllık 254 milyar dolar değerinde (donanım dahil) ve 5,5 milyon kişiye istihdam sağlıyor.
Açıklayıcılar uzun zamandır ebeveynlerle, yani model öğreticilerle ve dünyayı anlamalarına yardımcı olanlarla karşılaştırılıyor. Ancak en yeni modeller aynı şekilde onların rehberliğine ihtiyaç duymuyor. Teknoloji geliştikçe, öğretmenler gereksiz mi kalıyor?
Veri açıklamaları yeni bir şey değil. ” Yapay Zeka’nın vaftiz annesi ” olarak bilinen Amerikalı bilgisayar bilimcisi Fei Fei Li, 2000’lerin ortalarında dönemin en büyük görüntü veri kümesi olan ImageNet’i oluşturarak sektörün ilk adımını atmış olarak kabul ediliyor. Li, üniversite öğrencilerine görüntüleri kategorize etmeleri için para ödese bile (ki o zamanlar çoğu araştırmacı bu şekilde çalışıyordu), işin 90 yıl süreceğini fark etti. Bunun yerine, Amazon tarafından işletilen çevrimiçi bir geçici iş platformu olan Mechanical Turk’ü kullanarak dünya çapında çalışanları işe aldı. İki buçuk yılda yaklaşık 3,2 milyon görüntüyü bir veri kümesinde düzenledi. Kısa süre sonra diğer yapay zeka laboratuvarları da açıklama işlerini bu şekilde dış kaynak kullanarak yaptırmaya başladı.
Zamanla geliştiriciler, gig-work sitelerinde eğitimsiz işçiler tarafından yapılan düşük kaliteli açıklamalardan bıktılar. Sama ve iMerit gibi yapay zeka veri şirketleri ortaya çıktı. Yoksul dünyanın dört bir yanından işçi aldılar. Gayriresmi açıklama çalışmaları devam etti, ancak çalışanları test eden ve eğiten Scale AI tarafından yönetilenler gibi , yapay zeka çalışmaları için özel platformlar ortaya çıktı .
Dünya Bankası, küresel iş gücünün %4,4 ila %12,4’ünün yapay zeka için açıklama da dahil olmak üzere gig işlerinde yer aldığını tahmin ediyor . On yıldır çevrimiçi olarak veri işleri yapan Michigan sakini Krystal Kauffman, teknoloji şirketlerinin bu iş gücünü gizli tutmakta çıkarı olduğunu düşünüyor. Bayan Kauffman, “Sihir satıyorlar; tüm bu şeylerin kendiliğinden gerçekleştiği fikrini satıyorlar,” diyor. “Sihirli kısmı olmadan, yapay zeka sadece bir ürün.”

Sektörde bir tartışma, yapay zekanın arkasındaki çalışanlara nasıl davranıldığıyla ilgili . Firmalar ücretler hakkında bilgi paylaşmaya isteksiz. Ancak Amerikalı yorumcular, çevrimiçi platformlarda genellikle saatte 10-20 doların makul bir ücret olduğunu düşünüyor. Yoksul ülkelerdekiler genellikle saatte 4-8 dolar alıyor. Birçoğu bilgisayar aktivitelerini izleyen izleme araçları kullanmak zorunda kalıyor ve yavaş davrandıkları için cezalandırılıyorlar. Scale AI, istihdam uygulamaları nedeniyle birçok davaya maruz kaldı. Firma, herhangi bir suçlamayı reddediyor ve “Kendimizi şiddetle savunmayı planlıyoruz” diyor.
Ancak daha büyük sorun, temel notasyon çalışmalarının giderek azalması. Bu kısmen kaçınılmazdı. Yapay zekâ , bir zamanlar ebeveyninin bir şeyleri işaret etmesine ve etrafındaki dünyayı anlamasına ihtiyaç duyan küçük bir çocukken, teknoloji artık ara sıra uzman rehberliğine ve tavsiyesine ihtiyaç duyan bir ergene dönüştü. Yapay zekâ laboratuvarları, veri kümelerine etiketler uygulamak için algoritmalar kullanan diğer yapay zekâ laboratuvarlarından gelen önceden etiketlenmiş verileri giderek daha fazla kullanıyor .
Tarım ekipmanları devi John Deere’in bir yan kuruluşu olan Blue River Technology tarafından geliştirilen otonom traktörleri ele alalım. Üç yıl önce, grubun Amerika’daki mühendisleri, tarım arazilerinin fotoğraflarını buluta yükleyip Hindistan, Hubli’deki iMerit personeline, traktörler, binalar, sulama ekipmanları gibi neleri etiketlemeleri gerektiği konusunda detaylı talimatlar veriyordu. Şimdi ise geliştiriciler önceden etiketlenmiş veriler kullanıyor. Bu etiketlemeleri kontrol etmek ve örneğin bir toz bulutunun arazinin bir kısmını örtmesi veya bir ağacın ekinlerin üzerine gölge düşürerek modeli karıştırması gibi “uç durumlarla” başa çıkmak için hâlâ iMerit personeline ihtiyaçları var. Aylar süren bir süreç artık haftalar sürüyor.
Bebek adımlarından
En son yapay zeka modelleri dalgası, veri çalışmalarını çok daha dramatik bir şekilde değiştirdi. Open AI’nın halka ilk kez Chat GPT sohbet robotuyla deneme fırsatı verdiği 2022 yılından bu yana, büyük dil modellerine olan ilgi arttı. Bir araştırma şirketi olan Pitchbook’tan alınan veriler, diğer girişimlere sağlanan fonların düşmesine rağmen, yapay zeka girişimleri için küresel risk sermayesi fonlamasının 2024 yılında %50’den fazla artarak 131,5 milyar dolara çıktığını gösteriyor. Bu fonların çoğu, verilerin aynı şekilde açıklanmasını gerektirmeyen, yapay zeka geliştirmeye yönelik daha yeni tekniklere gidiyor . Sosyal bir girişim olan Humans in the Loop’tan Iva Gumnishka, eski bilgisayarlı görüş ve doğal dil işleme müşterileri için düşük beceri gerektiren açıklama yapan firmaların “geride kaldığını” söylüyor.
Açıklayıcılara olan talep hâlâ devam ediyor, ancak işleri değişti. İşletmeler yapay zekâyı kullanmaya başladıkça , daha küçük ve özel modeller geliştiriyor ve yardımcı olacak yüksek eğitimli açıklayıcılar arıyorlar. Açıklayıcılık iş ilanlarının doktora derecesi veya kodlama ve bilim becerileri gerektirmesi oldukça yaygın hale geldi. Araştırmacılar yapay zekâyı daha çok dilli hale getirmeye çalışırken , İngilizce dışındaki dilleri konuşan açıklayıcılara olan talep de artıyor. iMerit’te tıbbi yapay zekâ projeleri üzerinde çalışan diş hekimi Sushovan Das, açıklayıcılık işinin asla ortadan kalkmayacağını düşünüyor. “Bu dünya sürekli gelişiyor,” diyor. “Bu yüzden yapay zekânın sürekli olarak geliştirilmesi gerekiyor.”
Yapay zeka eğitiminde insanlara yeni roller düşüyor. Bir araştırma şirketi olan Epoch AI , eğitim için mevcut yüksek kaliteli metin stokunun 2026 yılına kadar tükenebileceğini tahmin ediyor. Bazı yapay zeka laboratuvarları, modellerin eğitilebileceği metin parçaları ve kod satırları yazacak kişileri işe alıyor. Diğerleri ise bilgisayar algoritmaları kullanılarak oluşturulan sentetik verileri satın alıyor ve bunları doğrulamak için insanları işe alıyor. Doğu Afrika’da operasyonları bulunan Sama’nın patronu Wendy Gonzalez, “Sentetik verilerin hala iyi veriler olması gerekiyor,” diyor.
Çalışanların diğer rolü, modellerden elde edilen çıktıları değerlendirmek ve şekillendirmeye yardımcı olmaktır. Chat GPT’nin önceki sohbet robotlarından daha iyi performans göstermesini sağlayan da budur. Scale AI’dan Xiaote Zhu, yapay zekanın uzmanlar tarafından eğitilmesini kolaylaştırmak amacıyla 2023 yılında kurulan firmanın Outlier platformunda yapılan açık uçlu görevlere bir örnek sunuyor. Çalışanlara, Maldivler’e bir tatil için bir rota öneren bir sohbet robotundan iki yanıt sunuluyor. Hangi yanıtı tercih ettiklerini seçmeleri, derecelendirmeleri, yanıtın neden iyi veya kötü olduğunu açıklamaları ve ardından yanıtı iyileştirmek için yeniden yazmaları gerekiyor.
Zhu’nun örneği oldukça sıradan bir örnek. Ancak yapay zekanın güvenli ve etik olduğundan emin olmak için insan geri bildirimi de hayati önem taşıyor. 2022’de Chat GPT’nin piyasaya sürülmesinden sonra yayınlanan bir belgede , Open AI, modelleri hakkında “niteliksel olarak araştırma yapmak, rakip testler yapmak ve genel olarak geri bildirim sağlamak” üzere uzmanlar işe aldığını belirtti. Bu sürecin sonunda model, insanları terör örgütü El Kaide’ye katılmaya ikna etmeyi amaçlayan sosyal medya içerikleri yazma talepleri gibi bazı taleplere yanıt vermeyi reddetti.
Yuvadan uçmak
Yapay zeka geliştiricileri istedikleri gibi olsaydı , bu tür insan müdahalesine hiç ihtiyaç duymazlardı. Araştırmalar, yapay zekanın geliştirilmesine harcanan zamanın %80’inin veri çalışmalarına harcandığını gösteriyor. Bir yapay zeka firması olan Databricks’ten Naveen Rao, tıpkı kendi çocuklarının kendi kendilerine öğrenmesini istediği gibi, modellerin de kendi kendilerine öğrenmelerini istediğini söylüyor. “Öz yeterliliği olan insanlar yetiştirmek istiyorum,” diyor. “Kendi meraklarına sahip olmalarını ve sorunları nasıl çözeceklerini bulmalarını istiyorum. Her adımda onları kaşıkla beslemek istemiyorum.”
Modellere etiketlenmemiş verilerle beslemeyi içeren gözetimsiz öğrenme ve karar vermeyi iyileştirmek için deneme yanılma yöntemini kullanan takviyeli öğrenme konusunda büyük bir heyecan var. Google DeepMind da dahil olmak üzere yapay zeka firmaları, hiçbir insan müdahalesi olmadan, milyonlarca yarışmada kendileriyle oynayarak ve hangi stratejilerin işe yaradığını izleyerek makineleri Go ve satranç gibi oyunlarda kazanmaya eğittiler. Ancak bu kendi kendine öğrenme yaklaşımı, en azından şimdilik, matematik ve fen bilimleri alanlarının dışında işe yaramıyor.
Dünyanın dört bir yanındaki teknoloji meraklıları, DeepSeek’in modelinin ne kadar ucuz ve verimli olduğuna hayran kaldılar. Ancak DeepSeek’in yapay zekayı , insanlar yerine bilgisayarlar tarafından üretilen geri bildirimleri kullanarak eğitme girişiminden pek etkilenmediler. Model, açık uçlu soruları yanıtlamakta zorlandı ve farklı dillerde anlamsız ifadeler üretti. “Fark şu ki, Go ve satrançta istenen sonuç çok açık: oyunu kazanmak,” diyor bir diğer yapay zeka veri şirketi olan Prolific’in kurucu ortağı Phelim Bradley. “Büyük dil modelleri daha karmaşık ve kapsamlı, bu yüzden insanlar uzun süre döngüde kalacaklar.”
Bay Bradley, birçok teknoloji meraklısı gibi, yapay zeka eğitimine daha az değil, daha fazla kişinin dahil olması gerektiğini düşünüyor . İş gücünde çeşitlilik önemlidir. Chat GPT birkaç yıl önce yayınlandığında, insanlar “delve” (derinlemesine araştırma) kelimesini aşırı kullandığını fark etti. Kelime, metnin bir bot tarafından yazıldığının açık bir işareti olarak ” AI -ese” (yapay zeka -ese) olarak algılandı. Aslında, modeli eğitmek için Afrika’da ek açıklamacılar işe alınmıştı ve “delve” kelimesi Afrika İngilizcesinde Amerikan veya İngiliz İngilizcesinden daha yaygın olarak kullanılıyor. Tıpkı çalışanların beceri ve bilgilerinin modellere aktarılması gibi, kelime dağarcığı da aktarılıyor. Görünen o ki, bir çocuğu yetiştirmek için bir köyden fazlası gerekiyor. ■
https://restofworld.org/2025/the-ai-con-book-invisible-labor/