Google, dijital girdileri işleyerek metin, ses ve görüntüleri birleştiren, özellikle video üretimine odaklanan yeni çok modlu yapay zeka modeli “Gemini Omni”yi duyurdu.
New york (SANA) – ABD merkezli teknoloji devi Google, bütünleşik ve çok modlu içerik üretebilen sistemler geliştirme vizyonu doğrultusunda “Gemini Omni” adlı yeni yapay zeka modelini tanıttı.
ABD merkezli teknoloji haber sitesi TechCrunch’ın dün geçtiği habere göre şirket, “Gemini Omni” adıyla çok modlu yeni bir akıllı model ailesini kullanıma sundu. Google Üst Yöneticisi (CEO) Sundar Pichai, modelin metin, görsel veya ses gibi her türlü girdiden içerik oluşturma yeteneğine sahip olduğunu ve özellikle video üretimine odaklandığını belirtti.
Fizik kurallarını ve kültürel verileri analiz edebiliyor
Gemini Omni, yalnızca görsel, ses ve metinleri tek bir video klibinde birleştirmekle kalmıyor; aynı zamanda fizik kuralları, kültür, tarih ve bilimsel verileri analiz ederek tutarlı ve yüksek kaliteli videolar üretiyor.
Model, basit metin komutlarıyla görsellerin düzenlenmesine imkan tanıyor. Gemini Omni, kısa bir ses ve hareket kaydının ardından kullanıcının dijital bir avatarını oluşturarak video üretilmesine olanak sağlarken, bu süreçte derin sahte (deepfake) teknolojilerinin kötüye kullanımını sınırlamaya yönelik önlemler de ön planda tutuluyor.
İçerik kaynağı için dijital filigran dönemi
“Gemini” sisteminin piyasaya sürülmesinden üç yıl sonra gelen bu gelişme, Google tarafından önceki video modeli “Veo”nun bir güncellemesi değil, yapay zeka yeteneklerinin multimedya üretimiyle birleştirilmesinde yeni bir adım olarak değerlendiriliyor. Şirket, üretilen içeriğin kaynağını doğrulamak için dijital bir filigran sistemini de kullanıma sunuyor.
İ.K / Ö.E