بكين-سانا
أعلنت شركة DeepSeek الصينية الناشئة في مجال الذكاء الاصطناعي عن إطلاق نموذجها الجديد متعدد الوسائط DeepSeek-OCR، القادر على معالجة مستندات كبيرة ومعقدة باستخدام عدد أقل بكثير من الرموز النصية.
وأوضحت الشركة في بيانٍ لها على مدونتها أن النموذج يعتمد على الإدراك البصري كآلية لضغط المعلومات، ويضم مكونين رئيسيين هما: DeepEncoder الذي يعمل كمحرك أساسي لضغط النصوص مع الحفاظ على كفاءة الأداء، وDeepSeek3B-MoE-A570M الذي يقوم بفك التشفير اعتماداً على بنية “مزيج الخبراء” (MoE) لتوزيع المهام بين شبكات فرعية متخصصة.
وأشارت الشركة إلى أن النموذج لا يقتصر على معالجة النصوص فحسب، بل يمتلك القدرة على تحليل المحتوى المرئي عالي البنية مثل الجداول والصيغ الرياضية والمخططات الهندسية، الأمر الذي يفتح آفاقاً واسعة لاستخدامه في مجالات التمويل والبحث العلمي والهندسة.
وبيّنت نتائج الاختبارات المعيارية أن النموذج حقق دقة بلغت 97 بالمئة عند ضغط النصوص حتى عشرة أضعاف، فيما سجل نحو 60 بالمئة عند ضغط يصل إلى عشرين ضعفاً، ما يعكس كفاءته في الحفاظ على المعلومات رغم الضغط العالي.
وتتيح هذه البنية استعادة النصوص الأصلية بكفاءة عالية حتى بعد ضغطها بشكل كبير.