James O’Donnell / 21 Ocak 2025
Mayo Clinic’in son çalışması bazı ipuçları barındırıyor.
Kanseri bulmak ve teşhis etmek için vücuda bakmak, tamamen leke desenleriyle ilgilidir. Radyologlar, tümörleri aydınlatmak için X-ışınları ve manyetik rezonans görüntüleme kullanır ve patologlar böbreklerden, karaciğerlerden ve diğer alanlardan alınan dokuları mikroskop altında inceler ve bir kanserin ne kadar şiddetli olduğunu, belirli tedavilerin işe yarayıp yaramayacağını ve kötü huylu tümörün nereye yayılabileceğini gösteren desenleri arar.
Teoride, yapay zeka yardımcı olmakta harika olmalı. Mayo Clinic’in dijital patoloji platformunun patolog ve tıbbi direktörü Andrew Norgan, “Bizim işimiz desen tanıma,” diyor. “Slayda bakıyoruz ve önemli olduğu kanıtlanmış bilgi parçalarını topluyoruz.”
Görsel analiz, ilk görüntü tanıma modelleri yaklaşık 15 yıl önce yaygınlaşmaya başladığından beri yapay zekanın oldukça iyi olduğu bir şey. Hiçbir model mükemmel olmasa da, bir gün güçlü bir algoritmanın bir insan patoloğun kaçırdığı bir şeyi yakalayacağını veya en azından teşhis alma sürecini hızlandıracağını hayal edebilirsiniz. Böyle bir model oluşturmak için çok sayıda yeni çaba görmeye başlıyoruz -sadece geçen yıl en azından yedi girişim- ancak hepsi deneysel olarak kalıyor. Bunları gerçek dünyada kullanılabilecek kadar iyi hale getirmek için ne gerekiyor?
Yapay zeka sağlık şirketi Aignostics ve Mayo Clinic’in önderliğinde böyle bir model inşa etmek için yapılan son çabanın ayrıntıları bu ayın başlarında arXiv’de yayınlandı . Makale hakem denetiminden geçmedi ancak böyle bir aracı gerçek klinik ortamlara getirmenin zorlukları hakkında çok şey ortaya koyuyor.
Atlas adı verilen model, 490.000 vakadan alınan 1,2 milyon doku örneği üzerinde eğitildi. Doğruluğu, diğer altı önde gelen yapay zeka patoloji modeline karşı test edildi. Bu modeller, meme kanseri görüntülerini sınıflandırma veya tümörleri derecelendirme gibi paylaşılan testlerde rekabet eder; burada modelin tahminleri, insan patologların verdiği doğru cevaplarla karşılaştırılır. Atlas, dokuz testten altısında rakip modelleri yendi. Kanserli kolorektal dokuyu kategorize etme konusunda en yüksek puanı aldı ve %97,1 oranında insan patologlarla aynı sonuca ulaştı. Ancak başka bir görev için -prostat kanseri biyopsilerinden tümörleri sınıflandırma- Atlas, diğer modellerin en yüksek puanlarını yalnızca %70,5’lik bir puanla geçti. Dokuz kıyaslamadaki ortalaması, %84,6 oranında insan uzmanlarla aynı cevapları aldığını gösterdi.
Bunun ne anlama geldiğini düşünelim. Dokulardaki kanserli hücrelere ne olduğunu bilmenin en iyi yolu, bir patolog tarafından incelenen bir örnektir, bu yüzden AI modellerinin ölçüldüğü performans budur. En iyi modeller, belirli tespit görevlerinde insanlara yaklaşıyor ancak diğer birçok konuda geride kalıyor. Peki bir modelin klinik olarak yararlı olması için ne kadar iyi olması gerekir?
Providence Genomics’in baş tıbbi sorumlusu ve Mayo Clinic çalışmasında incelenen diğer AI patoloji modellerinden biri olan GigaPath’in ortak yaratıcısı Carlo Bifulco, “Yüzde doksan muhtemelen yeterli değil. Daha da iyi olmanız gerekiyor,” diyor. Ancak Bifulco, mükemmel puan almayan AI modellerinin kısa vadede yine de faydalı olabileceğini ve potansiyel olarak patologların çalışmalarını hızlandırmalarına ve daha hızlı teşhis koymalarına yardımcı olabileceğini söylüyor.
Daha iyi performansın önünde hangi engeller var? Bir numaralı sorun eğitim verileridir.
Norgan, “ABD’deki patoloji uygulamalarının %10’undan azı dijitalleştirilmiştir” diyor. Bu, doku örneklerinin slaytlara yerleştirilip mikroskop altında analiz edildiği ve daha sonra dijital olarak belgelenmeden devasa kayıt defterlerinde saklandığı anlamına geliyor. Avrupa uygulamaları daha dijitalleştirilmiş olma eğiliminde olsa da ve yapay zeka modellerinin eğitim alabileceği doku örneklerinin paylaşılan veri kümeleri oluşturma çabaları devam etse de, üzerinde çalışılacak çok fazla veri yok.
Çeşitli veri kümeleri olmadan, AI modelleri insan patologlarının yorumlamayı öğrendiği geniş anormallik yelpazesini tanımlamakta zorlanıyor. Aignostics’in kurucu ortağı ve CTO’su Maximilian Alber, bunun nadir hastalıklar için de geçerli olduğunu söylüyor. Özellikle nadir hastalıkların doku örnekleri için kamuya açık veritabanlarını taradığınızda, “10 yıl boyunca 20 örnek bulacaksınız” diyor.
Mayo Clinic, 2022 civarında bu eğitim verisi eksikliğinin bir sorun olacağını öngördü. Kendi patoloji uygulamalarının tamamını, on yıllar öncesine dayanan arşivlerinden 12 milyon slaytla birlikte dijitalleştirmeye karar verdi (hastalar araştırma için kullanılmalarına izin vermişti). Dokuların yüksek çözünürlüklü fotoğraflarını çekmeye başlayan ve ayda bir milyona kadar numune üzerinde çalışan bir robot inşa etmesi için bir şirket kiraladı. Bu çabalar sayesinde ekip, Mayo modelini eğitmek için kullanılan 1,2 milyon yüksek kaliteli numuneyi toplayabildi.
Bu bizi, kanser tespitinde AI kullanımında ikinci soruna getiriyor. Biyopsilerden alınan doku örnekleri küçüktür -genellikle sadece birkaç milimetre çapındadır- ancak dijital görüntüleri 14 milyardan fazla piksel içerecek kadar büyütülür. Bu, onları bugüne kadarki en iyi AI görüntü tanıma modellerini eğitmek için kullanılan görüntülerden yaklaşık 287.000 kat daha büyük yapar.
Microsoft’ta yapay zeka araştırmacısı olan ve geçen yıl Nature dergisinde yayınlanan GigaPath’i oluşturmak için Bifulco ile çalışan Hoifung Poon, “Bu açıkça çok fazla depolama maliyeti ve benzeri şeyler anlamına geliyor,” diyor . Ancak bu aynı zamanda yapay zeka modelini eğitmek için görüntünün hangi parçalarını kullanacağınız ve süreçte hangi hücreleri kaçırabileceğiniz konusunda önemli kararlar almayı da zorunlu kılıyor. Mayo Clinic, Atlas’ı yapmak için, temelde aynı örnekten yapay zeka modeline aktarılacak çok sayıda anlık görüntü oluşturan bir döşeme yöntemi kullandı. Bu döşemelerin nasıl seçileceğini bulmak hem sanat hem de bilimdir ve bunu yapmanın hangi yollarının en iyi sonuçları verdiği henüz net değil.
Üçüncüsü, kanser tespit eden bir yapay zeka modelinin iyi performans göstermesi için hangi kıstasların en önemli olduğu sorusu var. Atlas araştırmacıları, modellerini moleküler düzeyde neler olduğunu tahmin etmek için örnek doku görüntülerinden ipuçları bulmaya çalışmayı içeren molekülerle ilgili kıstasların zorlu alanında test ettiler. İşte bir örnek: Vücudunuzun uyumsuzluk onarım genleri kanser için özellikle endişe vericidir, çünkü DNA’nız çoğaltıldığında yapılan hataları yakalarlar. Bu hatalar yakalanmazsa, kanserin gelişmesini ve ilerlemesini yönlendirebilirler.
Norgan, “Bazı patologlar, bir şeyin nasıl göründüğüne dayanarak uyumsuzluk onarımının yetersiz olduğunu düşündüklerinde bir his edindiklerini söyleyebilirler,” diyor. Ancak patologlar yalnızca bu içgüdüsel hisle hareket etmezler. Daha kesin bir cevap için moleküler testler yapabilirler. Norgan, bunun yerine, moleküler düzeyde ne olduğunu tahmin etmek için yapay zekayı kullanabilseydik ne olurdu? Bu bir deney: Yapay zeka modeli, insanların göremediği altta yatan moleküler değişiklikleri tespit edebilir mi?
Genel olarak hayır, öyle görünüyor. Ya da en azından henüz değil. Atlas’ın moleküler test için ortalaması %44,9’du. Bu, AI için şimdiye kadarki en iyi performans, ancak bu tür testlerin daha katetmesi gereken uzun bir yol olduğunu gösteriyor.
Bifulco, Atlas’ın artımlı ama gerçek bir ilerlemeyi temsil ettiğini söylüyor. “Ne yazık ki hissiyatım, herkesin benzer bir seviyede takılıp kaldığı yönünde,” diyor. “Gerçekten çarpıcı bir ilerleme kaydetmek için modeller açısından farklı bir şeye ihtiyacımız var ve daha büyük veri kümelerine ihtiyacımız var.”
Yapay zekanın protein katlama bilimi üzerinde uzun zamandır parmak izleri var. Ancak OpenAI artık proteinleri tasarlayabilen , normal hücreleri kök hücrelere dönüştürebilen bir model yarattığını söylüyor. Bu hedef, uzun ömür bilimi alanındaki şirketler tarafından takip ediliyor çünkü kök hücreler vücuttaki diğer dokuları üretebilir ve teoride hayvanları gençleştirmek, insan organları inşa etmek veya yedek hücre tedarik etmek için bir başlangıç noktası olabilir.
Neden önemli: Çalışma, Sam Altman’ın 180 milyon dolar yatırım yaptığı uzun ömürlülük şirketi Retro Labs ile OpenAI’nin iş birliğinin bir ürünüdür . OpenAI’nin biyolojik verilere odaklanan ilk modelini ve modellerinin bilimsel sonuçlar sunabileceğine dair ilk kamu iddiasını temsil eder. AI modelinin, şirketin bilim insanlarından daha etkili proteinleri ve daha hızlı bir şekilde tasarladığı bildiriliyor. Ancak dış bilim insanları, çalışmalar yayınlanana kadar iddiaları değerlendiremez.
MIT Technology Rewiev.
https://www.technologyreview.com/2025/01/21/1110192/why-its-so-hard-to-use-ai-to-diagnose-cancer/