Google Whisk "Aklımdaki görseli tarif etmeye çalışıyorum ama prompt yazmayı bilmiyorum ya da biliyorum ama saat gibi kelime seçmek, sıfat iyileştirmek, birden fazla kere deneyip yorulmak istemiyorum" sorununu çözüyor.
Metin-görsel AI araçlarının temel sorunu şu: Yaratıcılığın dili görsel, ama arayüzün dili metin. "Kuzey ışıklarının altında, pastel renkli, suluboya tarzında bir ayı" cümlesini doğru çıktıya dönüştürmek için prompt mühendisliği bilmek, modelin nasıl "düşündüğünü" öngörmek ve onlarca deneme yanılma döngüsünden geçmek gerekiyordu.
Whisk bu denklemi tersine çeviriyor. Görsel oluşturmak için metin değil, görsel kullanmanızı sağlayan yeni bir üretken AI aracıdır. Konuya ait bir görsel, sahneye ait bir görsel ve stile ait bir görsel sürükleyip bırakarak bunları remix'leyebilir ve kendinize özgü bir şey yaratabilirsiniz. Google Research
Whisk'in arkasındaki çığır açıcı fikir şu: Whisk, Gemini'yi görsellerinizin ayrıntılı bir altyazısını otomatik olarak yazmak için kullanır, ardından bu açıklamalar nihai görseli üretmek için Imagen'e beslenir. Bu süreç, konunun tam bir kopyasını değil özünü yakalar ve böylece konularınızı, sahnelerinizi ve stillerinizi yeni yollarla kolayca remix'leyebilirsiniz. Google Research
Nasıl Çalışır? — Gemini + Imagen 4 Pipeline'ı
Whisk'i rakiplerinden ayıran şey yalnızca arayüzü değil, arkasında çalışan iki aşamalı AI altyapısı. Bu pipeline çoğu görsel AI aracında mevcut olmayan bir zekanın ürünü:
1. Aşama — Gemini ile Görsel Anlama (I2T: Image to Text): Bir görsel yüklediğinizde Whisk, bu görseli görsel olarak anlamak ve onun hakkında metin açıklamaları (altyazılar) oluşturmak için Gemini'yi kullanır. Bir başka deyişle, görseli metne çevirir. Bu açıklamalar referanslarınızın orijinalini kopyalamak değil, özünü yakalamak amacıyla tasarlanmıştır; bu da fikirleri remix'lemeyi kolaylaştırır. THE DECODER
Bu adımın önemi dev: Gemini sadece "bu bir kedi fotoğrafı" demekle kalmıyor. Kedinin duruşunu, ışığı, dokusunu, renk tonlarını, sahne bağlamını ve stilistik nitelikleri ayrı ayrı tanımlayan zengin bir metin üretiyor. Bu sürece "öz yakalama" (essence capture) adı veriliyor ve Whisk'in görüntüleri basitçe birbirine dikişlememesini ya da stilleri birebir kopyalamamasını sağlıyor. Bunun yerine temel görsel özellikleri anlıyor ve bunları yaratıcı biçimde yeniden hayal ediyor. The AI Journal
2. Aşama — Imagen 4 ile Görsel Üretim (T2I: Text to Image): Bu açıklamalar daha sonra Google'ın son teknoloji görüntü üretim modeli olan Imagen 3'e iletilir. Imagen 3, konuyu, sahneyi ve stili harmanlayan tamamen yeni bir görüntü oluşturmak için Gemini tarafından oluşturulan bu planı kullanır; gelişmiş parlaklık, rafine kompozisyonlar ve fotogerçekçilikten anime ve soyut sanata kadar son derece doğru sanatsal render'larla sonuçlanır. The AI Journal (Not: Mayıs 2025 güncellemesiyle Imagen 3'ten Imagen 4'e geçildi; bu geçiş daha yüksek kalite, daha iyi tipografi ve zenginleştirilmiş renk doğruluğu sağladı.)
Whisk, bu görsel anlama özelliklerini kullanarak görsellerin ayrıntılı altyazılarını otomatik olarak oluşturur; bunlar daha sonra yeni varyasyonlar oluşturmak için Imagen 3'e beslenir. Google
Temel Özellikler
Üç Katmanlı Görsel Giriş Sistemi — Konu, Sahne, Stil: Whisk, basit ama güçlü üç bileşenli bir çerçeve üzerinde çalışır. Konu (Subject): Görselinizin ana odak noktası — öne çıkmak istediğiniz şey. Bu bir kişi, nesne, karakter veya herhangi bir birincil öğe olabilir. Sahne (Scene): Konunun göründüğü ortam veya ayar — arka planı, bağlamı ve kompozisyonun mekânsal düzenini tanımlar. Stil (Style): Nihai görsele uygulamak istediğiniz sanatsal yaklaşım, estetik kalite veya görsel işlem. theresanaiforthat
Üç girdiden herhangi birini boş bırakabilirsiniz; Whisk o öğe için içerik üretecektir. theresanaiforthat Yani bir konu + sahne kombinasyonu yapıp stili modele bırakabilir ya da sadece bir stil görseli yükleyip konuyu metin promptuyla tanımlayabilirsiniz.
Metin + Görsel Hibrit Kontrol — İkisi Birden: Kullanıcılar çıktıyı ince ayarlamak için "bir gün batımı ekle" veya "pastel renkler kullan" gibi metin talimatları ekleyebilir. Gelişmiş mod, daha fazla kontrol için metin tabanlı kategorilerle sıfırdan başlamaya da olanak tanır. Google
Üretilen her görselin altında Gemini'nin oluşturduğu tam prompt görünür ve düzenlenebilir. Prompt grileşmiş ve sabit görünse de aslında tıklayıp değişiklik yapabilirsiniz. deepmind Örneğin kaplumbağayı orca'ya çevirerek sahneyi ve stili koruyabilirsiniz — bu özellik, hassas kontrol isteyenler için güçlü bir kapı açıyor.
Çoklu Konu Girişi — Birden Fazla Referans: Tek bir konu referansıyla sınırlı değilsiniz. Konu kutusunun üzerindeki "+" ikonu tıklanarak yeni "Konu" kutuları eklenebilir. deepmind Bu özellik, örneğin bir karakter + belirli bir nesne + özel bir renk paleti görseli gibi bileşik konu tanımlamaları yapmayı mümkün kılıyor. Pratik sınır: 4'ten fazla konu referansı sonuçların tutarlılığını azaltıyor.
Şablonlar (Templates) — Hazır Stil Sıçrama Noktaları: Şablonlar temelde sadece stil referans görselleridir. deepmind Whisk, dijital peluş, emaye pin, çıkartma (sticker), karikatür, fotogerçekçi gibi önceden tanımlanmış görsel estetikler sunuyor. Başlangıç noktanız olmadığında rastgele stil kombinasyonlarını keşfetmek için zar (dice) ikonu bir tık uzakta.
Whisk Animate — Statik Görsellerden 8 Saniyelik Video: Whisk Animate, Veo 2 tarafından desteklenen ve görselleri kısa videolara (Google One AI Premium aboneleri için 8 saniyeye kadar) dönüştüren bir özelliktir. Google Bu özellik Whisk'i saf görsel üretim aracından hafif bir görsel → video pipeline'ına dönüştürüyor. Sosyal medya içeriği, ürün tanıtımı ve animasyonlu sticker üretimi için pratik bir köprü.
SynthID Görünmez Filigran — Etik AI Kullanımı: Üretilen görseller, AI tarafından oluşturulmuş içeriği belirlemek için görünmez SynthID filigranları içeriyor ve Whisk, telif hakkı endişelerine saygı göstererek girdi görsellerini doğrudan kopyalamaktan kaçınıyor. Google
Kimler İçin Uygun?
Prompt yazmayı sevmeyenler veya bilmeyenler: Whisk'in tasarım felsefesinin özü bu. Whisk, kullanıcıları "görüntüleri remix etmeye" yönlendirerek görsel oluşturmayı demokratikleştiriyor. İlham ile çıktı arasındaki çizgiyi bulanıklaştırarak AI görsel üretim sürecini çok daha sezgisel ve erişilebilir hale getiriyor. The AI Journal
Dijital sanatçılar ve tasarımcılar: Sanatçılar, derin prompt mühendisliği bilgisine ihtiyaç duymadan farklı görsel stilleri ve kompozisyonları hızla test etmek için Whisk'i kullanabilir. Quantspark Sticker, emaye pin ve dijital peluş gibi ürün tasarımları için özellikle güçlü — bu kategoriler erken kullanıcı testlerinde en yüksek memnuniyeti aldı.
İçerik üreticileri ve yaratıcılar: İçerik üreticileri mevcut fikirleri remix'leyerek storyboard ve moodboard'ları her zamankinden daha hızlı geliştirebilir. Quantspark Bir YouTube videosu için küçük resim konsepti, Instagram gönderisi için estetik test veya blog için başlık görseli — bunların hepsini dakikalar içinde birden fazla versiyonla karşılaştırmak mümkün.
Pazarlamacılar ve marka ekipleri: Pazarlamacılar, belirli tema veya estetiklere göre uyarlanmış kampanya görselleri üretebilir; yaratıcı yön üzerinde benzeri görülmemiş bir kontrol sağlayabilir. Quantspark Farklı marka estetiğini test etmek, sezon kampanyası konseptlerini görselleştirmek veya müşteriye fikir sunmak için hız açısından benzersiz.
Filmciler ve ön-görselleştirme ihtiyacı olanlar: Filmciler, gerçek dünya fotoğraflarını ve konsept referanslarını harmanlayarak ortamları, kostümleri veya aydınlatma atmosferlerini hızla görselleştirebilir. Whisk, ön-görselleştirme ile nihai sanat yönetimi arasında köprü kuruyor. Quantspark
Önemli sınırlamalar: Whisk yalnızca birkaç temel özelliği görselinizden çıkardığından, beklentilerinizden farklı görseller üretebilir. Örneğin üretilen konu farklı bir boy, ağırlık, saç stili veya cilt tonuna sahip olabilir. Google Research Piksel mükemmelliği gerektiren projeler için Whisk yanlış araç — bu bilinçli bir tasarım kararı. Google, "hızlı görsel keşif için inşa ettik, piksel mükemmelliğinde düzenlemeler için değil" şeklinde açıklıyor. Google Ayrıca maksimum 4 konu referansından sonra tutarsızlık artıyor ve Whisk yüksek hacimli kurumsal üretim için değil, keşif ve ideation için optimize edilmiş.
Fiyatlandırma (Şubat 2026 Güncel)
Ücretsiz: Google Labs'ın deneysel bir projesi olarak Whisk, şu anda erişebilen kullanıcılara ücretsiz sunuluyor. theresanaiforthat Google hesabıyla labs.google/fx/tools/whisk adresine giderek kayıt olmadan kullanmaya başlanabiliyor. Günlük görsel üretim limiti var; bireysel ve keşif kullanımı için yeterli.
Google One AI Premium ($19.99/ay): Whisk Animate özelliğine (Veo 2 ile 8 saniyelik animasyon), daha yüksek günlük üretim limitlerine ve Imagen 4 modeline öncelikli erişime bu plan kapsamında ulaşılabiliyor. Google Labs'taki erken aşama deneylerin çoğu ücretsiz iken, en son Veo 3 modeline sahip Flow gibi önemli bilgi işlem gücü gerektiren araçlar genellikle Google AI Pro veya Google AI Ultra gibi premium bir plana abonelik gerektiriyor. labs
Nasıl Kullanılır?
1. labs.google/fx/tools/whisk adresine git ve Google hesabınla giriş yap. Arayüzü iki ana bölüme ayrılmış göreceksin: sol tarafta görsel referans yükleme kutuları (konu, sahne, stil), altta klasik metin prompt kutusu. 2. Konu görselini yükle: Oluşturmak istediğin görselin ana öğesini temsil eden bir fotoğraf veya görsel sürükle bırak. Belirli bir karakter, nesne veya varlık olabilir. Birden fazla konu referansı için "+" ikonunu kullanabilirsin. 3. Sahne görselini yükle (isteğe bağlı): Konunun içinde yer alacağı ortamı tanımlayan bir görsel ekle. Tropikal plaj, kentsel sokak, fantastik orman — bağlam burada şekilleniyor. 4. Stil görselini yükle (isteğe bağlı): Nihai görselin estetik dilini belirleyen bir referans ekle. Suluboya bir resim, emaye pin örneği, fotogerçekçi bir fotoğraf veya hazır şablonlardan biri olabilir. 5. Metin prompt ekle (isteğe bağlı ama güçlü): Üç referans görselini tutarken kısa bir yönlendirici metin promptu ekle — sahne ve konu referansların görsel çıpalar olarak çalışırken metin promptu yeni detaylar eklemenize olanak tanır. deepmind 6. "Remix" butonuna bas ve sonuçları incele. Gemini görsellerini analiz edip otomatik prompt oluşturur, Imagen 4 bu promptu nihai görsele dönüştürür. Beğenmediğin sonuçlarda görünen promptu tıklayıp düzenleyebilir, tek bir detayı değiştirerek yeni varyasyonlar üretebilirsin. 7. Whisk Animate ile hayata geçir (Premium): Beğendiğin görseli 8 saniyelik kısa bir animasyona dönüştürmek için Veo 2 destekli Whisk Animate özelliğini kullan.
Örnek Kullanımlar
Sticker ve ürün tasarımı: Sevimli bir kedi fotoğrafı (konu) + uzay fotoğrafı (sahne) + çıkartma/sticker örneği (stil) kombinasyonuyla dakikalar içinde "uzay kedi sticker" serisinin onlarca varyasyonunu üretebilirsin. Her birinin altındaki promptu tweakleyerek mükemmel versiyona ulaşırsın.
Moodboard hızlandırma: Bir marka ajansı müşterisi için kampanya yönünü belirlemek amacıyla farklı stil referanslarını aynı konu görseline uygulayarak 10 dakikada 20 farklı estetik karşılaştırması yapabilir, müşteri toplantısına somut seçeneklerle girebilir.
Karakter + ortam kombinasyonu: Film prodüksiyonu için belirli bir kostüm fotoğrafını (konu) + belirli bir mekân fotoğrafını (sahne) + belirli bir sanatsal stil referansını (stil) birleştirerek sanat yönetimine sunum için görsel referanslar üretebilirsin.
Hızlı stil keşfi: Zar ikonuyla rastgele stil kombinasyonları deneyen bir tasarımcı, hiç aklına gelmeyecek estetik keşifler yapabilir. Whisk, daha önce "splattering prompt" ve sonsuz metin tanımlayıcı duvarlarından çok uzakta, fikirleri yeni ve yaratıcı yollarla keşfetmeni sağlıyor. deepmind
Google Whisk, AI görsel üretiminde temelden farklı bir felsefeyi temsil ediyor: prompt mühendisliği bilgisini demokratize etmek yerine onu tamamen ortadan kaldırmak. Erken testlerde sanatçılar ve yaratıcılar Whisk'i yeni bir yaratıcı araç türü olarak tanımlıyor, geleneksel bir görsel editörü değil. Hızlı görsel keşif için inşa edildi; piksel mükemmelliğinde düzenlemeler için değil. Onlarca seçenek üzerinde çalışmanıza ve sevdiklerinizi indirmenize olanak tanıyan, fikirleri yeni ve yaratıcı yollarla keşfetmenizi sağlayan bir araç. Google Research Google Labs'ın "pişirme atölyesi" mantığıyla geliştirilen Whisk, olgunlaştıkça Google Photos, Docs veya kurumsal yaratıcı suite'lere entegre edilme potansiyeline sahip, tıpkı diğer Labs deneyleri gibi. Şu an için ise ücretsiz, hızlı ve metin yazmaktan kaçınan yaratıcılar için görsel düşünmenin en doğal AI karşılığı.
