Stanford’lu akademisyenler, insan yaratıcılığını daha iyi desteklemek için yapay zekayı eğitiyor.

Metni görsele dönüştürme araçlarıyla çalışan görsel sanatçılar, can sıkıcı engellerle karşılaşıyor. Bilgisayar bilimi, bilişsel psikoloji ve eğitim bilimcileri ise yardımcı olabileceklerini düşünüyor.

Nikki Goth Itoi

Özetle

Stanford’lu akademisyenler, sanatçılarla iş birliğini geliştirmek, yaratıcı projelerde ve iletişimde hassasiyeti artırmak amacıyla üretken yapay zekayı geliştiriyorlar.

Araştırma ekibi, sanatçıların model çıktılarını yönlendirmesine ve görsel hikaye anlatımını geliştirmesine olanak tanıyan açık kaynaklı yapay zeka araçları geliştiriyor.

Bu yenilikler çeşitli alanları dönüştürebilir ve her beceri seviyesindeki yaratıcıların fikirlerini sorunsuz ve etkili bir şekilde ifade etmelerini sağlayabilir.

Yapay zekâ ve sanat hakkındaki tartışma genellikle iki uç nokta arasında gidip gelir: Yapay zekânın aşırı derecede işe yaramaz hale gelmesi veya yaratıcı çalışmaların tamamen otomatikleştirilmesi. Daha arzu edilen yaklaşım, faydalı bir işbirlikçi gibi davranan bir yapay zekâ olabilir.

Ancak şu ana kadar, metni görüntüye dönüştüren araçlarla çalışan görsel sanatçılar, yapay zekayı yönlendirme yeteneklerinde sinir bozucu temel engellerle karşılaşıyorlar. Bir yapay zekadan bir evin görüntüsünü oluşturmasını mı istiyorsunuz? Çok zor değil. Peki ya evi kırmızı, dört ön cephe penceresi, bir baca ve sol tarafını kaplayan sarmaşıklarla dolu bir şekilde yapmasını mı istiyorsunuz? İyi şanslar.

Stanford’da bilgisayar bilimi, bilişsel psikoloji ve eğitim alanlarında çalışan akademisyenler, yapay zekâ modellerine ve insanlara birbirleriyle fikir alışverişinde bulunmayı öğreterek insan yaratıcılığını daha iyi destekleyebileceklerine inanıyorlar. Stanford İnsan Merkezli Yapay Zekâ Enstitüsü’nün (HAI)  Hoffman-Yee Araştırma Bursu’ndan aldıkları fonla , akademisyenler, illüstrasyonlardan diyagramlara ve animasyonlara kadar üretim kalitesinde görsel içerik oluşturmak için insanlarla üretken yapay zekâ arasında iş birliği yapabilecekleri ortak bir kavramsal temel geliştiriyorlar.

“Modeller harika görünse de, iş birliği konusunda berbatlar,” diyor  Stanford’da bilgisayar bilimi profesörü ve projenin eş baş araştırmacılarından Maneesh Agrawala . “Yaratıcıların, belirli bir metin komutu verildiğinde yapay zekanın ne üreteceğini bilmelerinin hiçbir yolu yok. Banliyöde müstakil bir ev isterseniz, modern bir dubleks üretiyor.”

Agrawala’nın açıkladığına göre, özgün içerik üretmek, görüş sahibi olmayı ve sürekli seçim yapmayı gerektirir. İnsanlar ve yapay zeka, nüansların çeviride kaybolmaması için ortak bir kavramlar kümesine ihtiyaç duyar.

İnsan yaratıcı sürecini çözümlemek

Stanford ekibi bu soruna iki yönden yaklaşıyor. İlk olarak, araştırmacılar insanların görsel içerik oluşturmak için nasıl işbirliği yaptığını daha iyi anlamak amacıyla deneyler yürütüyorlar. Katılımcıların birlikte çalışırken nasıl iletişim kurduklarını sohbet kayıtları ve çizimler aracılığıyla analiz etmek için yaratıcı görevler gerçekleştiren kişiler üzerinde çeşitli çalışmalar yaptılar.

Stanford Üniversitesi’nde psikoloji yardımcı doçenti olan Judith Fan , “Yaratıcı projeler sırasında insanların nasıl düşündüğünü anlayan yapay zeka sistemleri kurmak istiyorsak, insanların birbirleriyle ortak kavramsal zemin oluşturma biçimlerinden olabildiğince çok şey öğrenerek başlamalıyız” diyor  . “Herkes aynı şekilde konuşmaz veya çizmez, ancak yine de anlaşılmayı beklerler.”

Yaratıcıları anlayan yapay zeka araçları geliştirmek

İkinci olarak, ekip insan yaratıcı iletişimine dair öğrenilen dersleri uygulamak için açık kaynaklı yapay zeka araçları geliştiriyor. Örneğin,  ControlNet , metinden görüntüye dönüştürme modellerine, sanatçıların kaba bir eskizle başlayıp ardından çizimin detaylarını tamamlamasını yansıtmak için bloklama ve detaylandırma olmak üzere iki ayrı özellik kullanarak mekansal kompozisyonu öğretiyor. Günümüz modelleri bir poz fikrini veya nesnelerin bir sahnede nasıl düzenlenmesi gerektiğini yakalamakta zorlanıyor. Bu araçla, yaratıcılar modelleri kendi vizyonlarına uyan bir düzene yönlendirebilirler.

İnsanlar ve yapay zeka arasında paylaşılan kavramsal temelin etkisi, çeşitli alanlarda yeni uygulamalar ortaya çıkarmayı vaat ediyor. / Maneesh Agrawala / Bilgisayar BilimleriProfesörü

FramePack adı verilen başka bir araç,  içerik oluşturucuların çok sahneli hikaye anlatımı için metin komutlarından 3 boyutlu videolar üretmelerini sağlar. Bu araç, modellere, tıpkı bir insanın proje üzerinde çalışacağı gibi, sahneleri genel hikaye için önemlerine göre önceliklendirmeyi öğretir.

Üçüncü bir yenilik ise, şeffaflığı artırmak ve “kara kutu” yapay zekanın sınırlamalarının üstesinden gelmek için sinir ağlarını akıl yürütme yetenekleriyle birleştiren nöro-sembolik yapay zekanın gücünü araştırıyor. Bu prensipleri kullanarak, ekip doğal dil metin isteminden kod satırları üreten ve bu kodlar yürütülerek 3 boyutlu bir sahne oluşturmak için işlenen görsel bir sahne kodlama dili geliştirdi. İnsan yaratıcılar, kodu incelemek veya düzenlemek ve yapay zekanın programını güncellemesi için istedikleri zaman komut vermek üzere süreçte kalabilirler.

Eğitim içeriğini yeniden tasarlamak

Agrawala’ya göre, insanlar ve yapay zeka arasında paylaşılan kavramsal bir temelin etkisi, tasarım, simülasyon, animasyon, robotik ve eğitim de dahil olmak üzere çeşitli alanlarda yeni uygulamalar ortaya çıkaracak. Araştırma ekibi şu anda oyun platformu Roblox ile birlikte çalışarak oyuncuların metin komutlarından benzersiz 3 boyutlu nesneler oluşturmasını sağlarken oyun kısıtlamaları da getiriyor (örneğin, oyuncular şiddet içermeyen bir oyunda silah oluşturamayacak).

 

Daha genel olarak, bilim insanları bir gün her beceri seviyesinden insan yaratıcısının –hobi sahiplerinden küçük işletme sahiplerine ve görsel uzmanlara kadar– doğal dil, örnek içerik, kod parçacıkları ve diğer yöntemlerin bir kombinasyonunu kullanarak fikirlerini sorunsuz bir şekilde ifade edebilecekleri bir yola sahip olacaklarını umuyorlar.

 

Fan, “Daha geniş yaratıcı topluluğu yapay zekayla etkili bir şekilde iletişim kurmak için ihtiyaç duydukları araçlarla donatma konusunda ciddiyiz,” diyor.

 

https://news.stanford.edu/stories/2026/03/generative-ai-creative-collaboration-visual-artists

 

Scroll to Top