HAI Ortak Direktörü Curt Langlotz, sağlık düzenlemelerinin mevcut durumunu ve hastaları korumak ve doktorlara daha iyi yardımcı olmak için hangi noktaya gelmemiz gerektiğini açıklıyor.
15 Temmuz 2024/Shane Lynch
Bu Mayıs ayında, Stanford İnsan Merkezli Yapay Zeka Enstitüsü, yapay zekanın sağlık sektörüne hızla entegre edilmesiyle ortaya çıkan düzenleyici zorlukları ele almak için 50’den fazla politika yapıcı, akademisyen, sağlık hizmeti sağlayıcısı, yapay zeka geliştiricisi ve hasta savunucusunu kapalı kapılar ardında bir çalıştayda bir araya getirdi. Günün konuşmaları arasında yapay zeka cihazı düzenlemesindeki boşlukların analiz edilmesi ve hem hastaya yönelik hem de yönetim ve operasyonlarda yeni yapay zeka uygulamaları hakkında bilgi edinilmesi yer aldı.
Sağlık Hizmetlerinde Yapay Zeka Teknolojilerini Yönetme Yolları
Stanford HAI yardımcı direktörü ve radyoloji, tıp ve biyomedikal veri bilimi profesörü Curt Langlotz , günün sohbetine liderlik etti. Burada, günün sohbetlerinden bazı üst düzey bilgiler sunuyor ve düzenleme alanının hasta, doktor ve geliştiriciye fayda sağlamak için nasıl değişmesi gerektiğini anlatıyor.
Düzenleyicilerin yapay zeka hakkında bilmesi gerekenler nelerdir?
Gıda ve İlaç Dairesi (FDA), klinik AI’nın birincil federal düzenleyicisidir. AI hakkında zaten çok şey biliyorlar ve zorlu kısıtlamalar altında, kağıt kayıtlar ve faks makineleri zamanında tasarlanmış 50 yıllık bir düzenleyici rejim kullanarak güvenlik ve inovasyonu dengeleyerek iyi bir iş çıkarıyorlar.
Şu anda AI algoritmalarının potansiyel alıcılarının karşılaştığı zorlukları vurgulamak isterim. Benim uzmanlık alanım olan radyolojide, 600’den fazla FDA onaylı algoritma ve radyologlara AI ürünleri satan 100’den fazla şirket var. Bu algoritmaların yeni popülasyonlara iyi genelleştirilemediğini biliyoruz. Pek çok potansiyel müşteri, belirli bir AI ürününün kendi muayenehanelerinde işe yarayıp yaramayacağını belirlemede zorluk çekiyor. Bu ürünlerin eğitildiği veriler hakkında daha fazla şeffaflığa ihtiyacımız var. FDA, kısmen uluslararası bir konsorsiyumla çalışarak bu konuda iyi bir ilerleme kaydediyor . Toplantıda, model kartlarının ve veri sayfalarının avantajlarını tartıştık ve yeni bir ilacın veya cihazın test edildiği hastaların özelliklerini ayrıntılı olarak açıklayan olası klinik deneme yayınlarının incelemesini yaptık.
Yapay zeka geliştiricilerinin düzenlemeler hakkında daha iyi donatılmaları için nelere ihtiyaçları var?
Geliştiriciler düzenlemeleri üstesinden gelinmesi gereken bir sorun olarak görme eğilimindedir. Son zamanlarda, standart eksikliğinin YZ’a olan kamu güvenini nasıl baltalayabileceğini diğer sektörlerde gördük.
Ayrıca geliştiricilerin, düzenleyicilerin beklediği titiz değerlendirmelerin farkında olmaması durumunda ortaya çıkan boşa harcanan çabayı ortadan kaldırmak için daha fazlasını yapmalıyız. Gerekli titizliği en baştan uygularsak, daha sonra deneyleri tekrar çalıştırma ihtiyacını ortadan kaldırırız.
Şu anda en büyük fırsatlar nerede?
Mevcut YZ algoritmalarının çoğu, sepsis, beyin kanaması, akciğer nodülü veya başka bir, şeyleri tespit etmek için tasarlanmıştır. Bu sistemler, marjinal olarak yardımcı olsa da, kullanıcı için sadece yanlış pozitifleri takip etmek için değil, aynı zamanda gerçek pozitifleri takip etmek için de ekstra iş yaratır. Bu nedenle, bu algoritmaları kullanan sağlık çalışanları bunları her zaman faydalı olarak görmez.
Sonunda verimliliği artıran veya yatırım getirisi net olan algoritmalara doğru bir geçiş görüyoruz. Örneğin, bir klinik notu veya radyoloji raporu taslağı hazırlayabilen bir algoritma, kullanıcı için önemli bir zaman tasarrufu sağlayabilir. Ve rutin bir BT’de şüphelenilmeyen koroner arter hastalığı veya osteoporozu olan hastaları bulmak gibi görüntülerden yeni bilgiler çıkaran bir algoritma, yalnızca sonuçları iyileştirmekle kalmayıp sağlık kuruluşuna finansal faydalar da sağlayabilir.
Başka bir fırsat, hastaları bakımlarına dahil etmek için büyük dil modelleri kullanmaktır. Laboratuvarım, hastaların görüntüleme testi sonuçlarını anlamalarına yardımcı olmak için bir sistem tasarladı. Hasta, karmaşık tıbbi terimlerin hiper bağlantılı olduğu bir radyoloji raporu alır. Bir şeyi anlamazlarsa, bağlantıya tıklayabilir ve bir sohbet robotundan basit, net bir açıklama alabilirler.
En büyük tuzaklar nerede?
Bence tıpta büyük dil modellerinin rolü şu anda fazla abartılıyor. Son zamanlardaki bir dizi makale, bu modellerin tıbbi sertifika sınavlarını geçebileceğini ve soyut klinik sorunları çözebileceğini gösterdiği için ilgi gördü. Halüsinasyon sorununu çözmek zor olacak. Ve eğitim verileri esasen tüm internet olduğu için, sistem internette ilgi çeken şeylere dayanarak hastalık olasılığına ilişkin çarpık bir görüşe sahip.
Bunun yerine, uzmanlaşmış alt akış modellerinin ön eğitiminde kullanılmak üzere yalnızca büyük miktarda yüksek kaliteli tıbbi veri üzerinde eğitilmiş modeller oluşturabiliriz.
Bir diğer tuzak ise insanların bu sistemlerle etkileşime girmesinin en iyi yolunun ne olduğu konusunda hala öğrenmemiz gereken çok şey olmasıdır. İnsan ve makinenin birleşiminin tek başına olduğundan daha iyi olma ihtimalinin yüksek olduğunu biliyoruz. Ancak, genellikle kötü sistem tasarımından kaynaklanan yanlış insan-makine etkileşimi kötü sonuçlara yol açabilir. Sistemlerin sonuçlarını daha iyi nasıl açıklayabileceği konusunda bazı harika çalışmalar yapıldı ve bu güvenilir sistemler için önemlidir. Ancak, optimum insan-YZ etkileşimini tasarlamak için yapmamız gereken çok daha fazla şey var.
Gün boyu süren sohbetimizde sizi en çok şaşırtan şey ne oldu?
Meslektaşlarımızın ne kadar ilgili olduklarına hoş bir şekilde şaşırdım. Düzenleyiciler genellikle süreçleri hakkında fazla bilgi paylaşmaya isteksizdir. Ancak karşılaştıkları endişeler hakkında birçok açık tartışma yaptık. Düzenleyicilerimizin ve politika yapıcılarımızın değişime açık olduğu hissine kapıldım. Özellikle, piyasa öncesi izinden ziyade piyasa sonrası gözetime daha fazla vurgu yapılması gerektiği hissi vardı. Bu alanda da iyi bir ilerleme kaydedildi. Bunun sağlıklı bir dinamik olduğunu düşünüyorum.
Sizin için bir sonraki adımlar neler? Bu katılımcı grubu için?
Sonuçlarımızı ve önerilerimizi bir dizi politika brifinginde yazmayı planlıyoruz. Toplantı üç kullanım örneği etrafında yapılandırıldı: görüntülerdeki anormallikleri tespit eden bir YZ algoritması gibi klinik karar desteği; bir doktor-hasta etkileşimini dinleyip not yazabilen uygulamalar gibi kurumsal YZ; ve akıl sağlığı sohbet robotları gibi tüketiciye yönelik YZ. Bu alanların her birinde politika yapıcılar için bazı önerilerimiz olacak.
Stanford HAI’nin misyonu, insan koşullarını iyileştirmek için yapay zeka araştırmalarını, eğitimini, politikasını ve uygulamasını ilerletmektir.
Not: Bu makalenin tercümesinde DeepL tercüme algoritması kullanılmış ve daha sonra revize edilmiştir.