«غوغل» تطلق نموذج ذكاء اصطناعي جديد لفهم النصوص والصور والفيديو معاً

واشنطن-سانا

أعلنت شركة غوغل إطلاق نموذج ذكاء اصطناعي جديد يحمل اسم Gemini Embedding 2، وهو نموذج متعدد الوسائط، قادر على تحليل النصوص والصور والصوت والفيديو ضمن نظام موحد، في خطوة تهدف إلى تطوير قدرة الأنظمة الذكية على فهم البيانات بمختلف أشكالها.

وذكر موقع TechCrunch المتخصص بأخبار التكنولوجيا، أن النموذج الجديد يربط أنواع المحتوى المختلفة داخل مساحة تحليل واحدة، ما يتيح للذكاء الاصطناعي فهم المفاهيم سواء ظهرت على شكل نص مكتوب أو صورة أو مقطع فيديو أو ملف صوتي.

وأوضحت غوغل أن النموذج يمثل الجيل الجديد من تقنيات التضمين بعد النموذج السابق الذي كان يركز على تحليل النصوص فقط، حيث أصبح قادراً على فهم المعاني والسياق عبر أكثر من 100 لغة، كما أصبح متاحاً في مرحلة المعاينة العامة عبر منصة Gemini API ومنصة الذكاء الاصطناعي السحابية Vertex AI.

وترى الشركة أن هذه التقنية، ستسهم في تطوير تطبيقات الذكاء الاصطناعي المتقدمة مثل البحث الدلالي وتحليل البيانات وتنظيمها، إضافة إلى دعم أنظمة توليد الإجابات المعززة بالمصادر الخارجية، ما يعزز قدرة النماذج الذكية على معالجة المعلومات المعقدة بطريقة أكثر تكاملاً.

