Yapay zeka bir metni dinamik, gerçekçi bir videoya dönüştürebilir mi? ChatGPT yaratıcısı OpenAI, 15 Şubat Perşembe günü tanıttığı, metinden videoya üretim aracı Sora ile bu soruya bir cevap sunuyor.
Sora, ayrıntılı kullanıcı komutlarına, gerçekçi görselliğe, ve aynı zamanda nesnelerin fiziksel dünyada nasıl var olduğuna da bağlı kalarak bir dakika uzunluğunda karmaşık sahneler oluşturabiliyor. Sora ile oluşturulan bu karmaşık sahneler, canlı duyguları ifade eden birden fazla karakterleri, belirli hareket türlerini ve özne ile arka planın doğru ayrıntılarını içerebiliyor.
Yalnızca metin talimatlarından bir video oluşturabilmenin yanı sıra, model mevcut bir hareketsiz görüntüyü kullanarak video oluşturabiliyor ve görüntünün içeriğini doğrulukla ve küçük ayrıntılara dikkat ederek canlandırabiliyor. Ayrıca Sora, mevcut bir videoyu alıp genişletebilme veya eksik kareleri doldurabilme gibi tamamlayıcı yeteneklere de sahiptir.
Yayınlanan teknik rapor kısa ve genel olmakla birlikte, dil modellerine benzer şekilde, OpenAI’nin Sora’ya ne kadar fazla hesaplama gücü sağlarsa, çıktı kalitesinin de o kadar yüksek olduğunu gösteriyor – Bir yığın kürk parçası, 16 kat daha fazla kaynakla üretildiğinde fotogerçekçi, sevimli bir köpek yavrusu haline geliyor.
Henüz halka açık olmayan Sora’nın yalnızca OpenAI tarafından onaylanan seçkin bir grup güvenlik testçisi, görsel sanatçı, tasarımcı ve film yapımcısı tarafından kullanabildiğini, ve OpenAI ürünlerinde kullanılabilir hale getirilmeden önce yanlış bilgi, nefret dolu içerik ve önyargı gibi önemli konularda alanda uzmanlarla birlikte çalışıldığı biliniyor. Ancak şirketin CEO’su Sam Altman, Sora’ya gelen taleplerin sonuçlarını sosyal medya üzerinden meraklı takipçileri ile paylaşıyor.
kaynak: https://openai.com/sora
Bir yanıt yazın