أوبن إيه آي تواجه تحديات “الهلوسة” في تطوير GPT-5 الحديث
أكدت شركة أوبن إيه آي أن أحدث نماذجها للذكاء الاصطناعي، وهو GPT-5، ما زال يعاني من مشكلة معروفة باسم “الهلوسة” وهي حدوث أخطاء تنتج عنها إجابات تبدو مقنعة لكنها لا تعكس الحقيقة ورغم التقدم الملاحظ في تقنيات هذا النموذج إلا أن الشركة تعتبر تلك المشكلة عميقة ومتجذرة في كيفية عمل هذه النماذج اللغوية وهي بحاجة لمزيد من البحث والتطوير لإيجاد حلول فعالة لها.
المشكلة تتعلق بأساليب تعليم الأنظمة وطرق تدريبها، حيث يتم تدريب النموذج على توقع الكلمة التالية في النصوص، وعلى الرغم من فعالية هذا النظام في الجوانب اللغوية فإنه يواجه صعوبة عند العمل على الحقائق الدقيقة والموضوعية مما يؤدي إلى إنتاج إجابات موثوقة ظاهريًا لكنها غير دقيقة في الواقع مما يستدعي تطوير استراتيجيات أفضل لتقليل هذه الأخطاء.
تشير نتائج الاختبارات التي أجرتها الشركة إلى أن تحسين الدقة لا يعني بالضرورة تقليل النسبة الإجمالية للأخطاء، فبينما كان لدى النماذج السابقة معدلات أعلى من الإجابات الصحيحة كانت هناك مستويات مرتفعة أيضًا من الأخطاء أما GPT-5 فقد قدم مستوى أدنى في الدقة الكلية لكنه برز بقدرته على تجنب التخمين في الحالات التي تكون فيها المعرفة غائبة مما يجعله أكثر تحفظًا وأقل عرضة للهلوسة.
تعتقد أوبن إيه آي أن جزءًا من المشكلة يتعلق بأساليب تقييم الأداء المعتمدة في المجال، إذ تركز معظم المؤشرات على النسبة المئوية للإجابات الصحيحة متجاهلة خطورة عرض الإجابات الخاطئة على أنها حقائق مؤكدة ودعت الشركة إلى إعادة النظر في معايير التقييم بحيث توفر للنماذج مجالًا للاعتراف بعدم المعرفة بدلاً من إجبارها على تقديم إجابات خاطئة بثقة عالية.
بالنسبة للمستخدمين، تكمن الرسالة الأساسية في أن GPT-5 يمثل تطورًا ملحوظًا نحو تقليص ظاهرة “الهلوسة” لكنه لا يزال يتطلب تطويرًا إضافيًا فالتحدي الحقيقي يبقى في كيفية تحسين مناهج التدريب وأساليب التقييم لضمان إنشاء نماذج تصل إلى مستوى أعلى من الموثوقية مما يسهم في تقليل الفجوة بين ما يبدو صحيحًا وما هو صحيح بالفعل.
تعليقات