روبوتات الدردشة بين الدقة وإرضاء المستخدم

واشنطن-سانا

رغم الصورة الشائعة عن روبوتات الدردشة المدعومة بالذكاء الاصطناعي بوصفها أنظمة واثقة في إجاباتها، إلا أن أداءها قد يتغير عند سؤالها: “هل أنت متأكد؟”، إذ تعيد في كثير من الأحيان صياغة ردودها أو تتراجع جزئياً عنها، في سلوك يصفه باحثون بأنه ميل إلى إرضاء المستخدم أو ما يُعرف بـ”التملق”.

وبحسب تقرير لصحيفة “إنديان إكسبرس”، فإن هذه الظاهرة تمثل تحدياً أساسياً في تصميم النماذج اللغوية الكبرى، مثل “تشات جي بي تي”، و”جيميني”، و”كلود”.

وأوضح الدكتور راندال س. أولسون، المؤسس المشارك والمدير التقني لشركة “Goodeye Labs”، أن هذا السلوك يعد من أكثر إخفاقات الذكاء الاصطناعي توثيقاً في السنوات الأخيرة.

ويعزو باحثون المشكلة إلى آلية “التعلم المعزز من ملاحظات البشر”، التي تهدف إلى جعل الأنظمة أكثر تفاعلاً وتهذيباً، لكنها في الوقت نفسه تكافئ الإجابات التي تنال رضا المستخدم حتى وإن كانت أقل دقة، ما يخلق حلقة تغذية راجعة تعزز الإذعان على حساب الموضوعية.

وفي هذا السياق، أظهرت دراسة شملت نماذج “GPT-4o” و”Claude Sonnet” و”Gemini 1.5 Pro”، أنها غيرت إجاباتها في نحو 60 بالمئة من الحالات عند إعادة اختبارها، فيما نشرت شركة “أنثروبيك” عام 2023 ورقة بحثية أكدت أن النماذج المدربة على تقييمات المستخدمين تميل إلى اختيار الإجابات المرضية عند تعارضها مع الإجابات الصادقة.

وكانت المشكلة قد برزت بوضوح عقب تحديث أطلقته “أوبن إيه آي” على نموذج “GPT-4o” العام الماضي، وأدى إلى سلوك مفرط في الموافقة، ما دفع الشركة إلى الإقرار بالخلل والعمل على معالجته، وسط تأكيدات من مختصين بأن جذور المشكلة لا تزال قائمة.

ويرى باحثون أن الحد من هذه الظاهرة ممكن، عبر تطوير أساليب تدريب أكثر صرامة، مثل “الذكاء الاصطناعي الدستوري”، إلى جانب توعية المستخدمين بضرورة طرح الأسئلة بصيغة محايدة، وطلب تبرير الإجابات، بما يسهم في تعزيز توازن الأنظمة بين الدقة والاستجابة لتوقعات السائل.