OpenAI, bugün duyurduğu “Sora” adlı yeni yapay zeka modeli ile metinden video oluşturma yeteneğini tanıttı. Bu model, güvenlik uzmanları tarafından test ediliyor ve oldukça gerçekçi 60 saniyelik videolar üretebiliyor.
Sora, metin komutlarıyla 60 saniyelik gerçekçi videolar oluşturabiliyor
Introducing Sora, our text-to-video model.
Sora can create videos of up to 60 seconds featuring highly detailed scenes, complex camera motion, and multiple characters with vibrant emotions. https://t.co/7j2JN27M3W
Prompt: “Beautiful, snowy… pic.twitter.com/ruTEWn87vf
— OpenAI (@OpenAI) February 15, 2024
Sora şu anda dezenformasyon, nefret içeren içerikler ve ön yargı gibi konularda uzman kişiler tarafından test ediliyor. OpenAI, modeli kullanıma sunmadan önce gerekli güvenlik adımlarını atmayı planlıyor.
Bu yeni model, metin komutlarıyla 60 saniyelik gerçekçi videolar oluşturabiliyor. Örneğin, “Güzel, karlı ve canlı Tokyo şehri. Kamera, kar yağışının tadını çıkaran insanları ve yakınlardaki tezgahlarda alışveriş yapanları takip ederek şehrin kalabalık caddelerinde ilerliyor. Rüzgar, muhteşem sakura yapraklarını kar taneleriyle birlikte uçuruyor.”
Görsellerden de video üretebiliyor
Prompt: “Several giant wooly mammoths approach treading through a snowy meadow, their long wooly fur lightly blows in the wind as they walk, snow covered trees and dramatic snow capped mountains in the distance, mid afternoon light with wispy clouds and a sun high in the distance… pic.twitter.com/Um5CWI18nS
— OpenAI (@OpenAI) February 15, 2024
OpenAI, Sora’nın videoların görsel kalitesini yüksek tutabildiğini, ayrıntılı olduğunu, karmaşık hareketleri içerdiğini ve birden fazla karakteri canlandırabildiğini belirtiyor. Modelin ayrıca, sahneleri doğru şekilde oluşturduğu ve kullanıcının istediği şeylerin fiziksel dünyada nasıl var olduğunu anladığı ifade ediliyor.
Sora’nın henüz test aşamasında olduğu ve bazı zayıf noktaları olduğu da kabul ediliyor. Modelin karmaşık sahnelerin fiziksel simülasyonlarında bazen zorlanabileceği ve neden-sonuç ilişkilerini tam olarak anlayamayabileceği belirtiliyor. Örneğin, bir videoda bir kişinin bir kurabiye ısırdığını ancak sonra kurabiyenin izlerinin ortadan kaybolduğunu görebiliriz.
Ancak, genel olarak, Sora’nın büyük bir potansiyele sahip olduğu ve yapay zeka modellerinde devrim yaratabileceği açıkça görülüyor. Modelin herkesin kullanımına sunulmasıyla neler başarabileceğini göreceğiz.