Çin, OpenAI’ın Sora Modeline Ciddi Rakip Olacak Metinden Video Oluşturabilen Yapay Zekâ Aracı “Vidu”yu Tanıttı [Video]
Üretken yapay zekâ modelleri, artık sadece fotoğraf değil, gerçeğinden ayırt edilemeyen videolar da oluşturabiliyor. Bunun en iyi örneği, OpenAI tarafından geçtiğimiz aylarda tanıtılan “Sora”. Henüz geniş çapta kullanıma sunulmayan bu model, metinlerden çok kısa sürede ultra gerçekçi videolar oluşturabiliyordu.
Şimdi ise OpenAI’ın Sora’sına ciddi rakip olabilecek bir model tanıtıldı. “Vidu” ismini alan bu yapay zekâ aracı, Çin’den geldi.
Tek bir tıkla 16 saniyelik 1080p çözünürlükte videolar oluşturabiliyor!
🚨 China just released SORA’s rival “Vidu”
This is China's first long duration, high consistency, and high dynamics video modelIt can create videos upto 16s with 1080P in single click.
It excels at simulating the real physical world and also showcases a vivid imagination,… pic.twitter.com/6ThjAxrQs2
— Sambhav Gupta (@sambhavgupta6) April 27, 2024
*Videoyu görüntüleyemiyorsanız buradaki bağlantıya tıklayın.
Çin’in ilk metinden görsel oluşturma modeli olarak nitelendirilen Vidu, bugün Pekin’de düzenlenen teknoloji etkinliği Zhongguancun Forum kapsamında tanıtıldı. Modelden paylaşılan örnekler, üretken yapay zekâ yarışının sadece ABD’de değil, tüm dünyada kızışacağını ortaya koydu.
Vidu, Çinli yapay zekâ firması Shengshu Technology ile Tsinghua Üniversitesi iş birliğinde geliştirildi. Yapılan açıklamada, modelin metin komutları yoluyla 16 saniye uzunluğunda 1080p çözünürlükte videolar oluşturabildiği aktarıldı.
Şirketin China Daily’ye yaptığı açıklamaya göre Vidu, hem daha uzun sürelerde videolar oluşturabiliyor hem de yüksek seviyede tutarlılık sunuyor. Ayrıca Sora seviyesine çok yakın olduğu da iddia ediliyor. Paylaşılan örneklere baktığımızda, gerçekten de bunu görebiliyoruz. Gerçek çekimler gibi gözüken videoları en az Sora kadar başarılı bir şekilde oluşturabiliyor.
Shengshu Technology, modelin temel mimarisinin Eylül 2022’den beri geliştirildiğini ifade etti. Bu da Sora’dan daha uzun süredir üzerinde çalışıldığı anlamına geliyor. Ayrıca rakibinin aksine Çin kültürüne özgü panda ve ejderha gibi unsurları anlayabildiği de gelen bilgiler arasında. Modelin ne zaman kullanıcılara sunulacağı konusunda ise henüz bir bilgi yok.