تحولات نموذج اللغة الجديد من آبل في إبداع النصوص الطويلة بكفاءة عالية
طور فريق الباحثين لدى شركة أبل نموذج لغة متقدم يمكنه كتابة نصوص طويلة بسرعة تفوق 128 مرة مقارنة بنماذج اللغة الأخرى، حيث يعتمد هذا النموذج على تقنية الانتشار التي تتيح له توليد رموز متعددة بشكل متزامن وبشكل منظم عبر خطوات تكرارية حتى يتم الوصول إلى الاستجابة الكاملة، ويختلف ذلك عن نماذج مثل ChatGPT التي تعمل بتوليد النصوص بشكل تسلسلي رمزًا تلو الآخر مع مراعاة المدخلات السابقة ومتطلبات المستخدم، وهذا يحقق كفاءة أعلى في معالجة النصوص.
بحسب تقرير موقع “9to5mac”، يتضمن هذا النموذج الجديد شكلًا من نماذج مطابقة التدفق التي تتجاوز العملية التكرارية المستخدمة في نماذج الانتشار التقليدية، حيث تتميز هذه النماذج بقدرتها على تعلم إنتاج النتيجة النهائية دفعة واحدة، وهذا ما يميز نموذج أبل الجديد الذي تم تقديمه في دراسة معنونة “FS-DFM: توليد سريع ودقيق للنصوص الطويلة باستخدام نماذج لغة الانتشار قليلة الخطوات”، حيث يقترح الباحثون طرقًا مبتكرة لتحسين كفاءة النماذج.
لقد أثبتت الأبحاث أن نموذج FS-DFM يستطيع إنتاج نصوص كاملة الطول خلال ثماني جولات تحسين فقط، مما يجعله متفوقًا على نماذج الانتشار التقليدية التي تتطلب أكثر من ألف خطوة للحصول على جودة مشابهة، وقد اتبع الباحثون أسلوبًا متميزًا من ثلاث خطوات للتمكن من تحقيق النتائج المرجوة، حيث يقومون بتدريب النموذج على تنويعات مختلفة من تكرارات التحسين.
لتحقيق النتائج المحددة، قام الباحثون باستخدام نموذج “معلم” من أجل إرشاد النموذج في إجراء تحسينات أكبر وأدق خلال كل تكرار، كما تم تعديل آلية العمل في كل تكرار لضمان الوصول للناتج النهائي بعدد أقل من الخطوات وباستقرار أكبر، مما يعكس تقدمًا واضحًا في مجال تطوير نماذج اللغة.
نظرًا للنتائج المذهلة التي حققتها هذه الدراسة والآفاق الواعدة التي تفتحها، أعلن الباحثون عن خطط لإصدار نقاط تحقق تتعلق بالرموز والنماذج لتسهيل إمكانية إعادة إنتاجها وإجراء مزيد من الأبحاث، مما يشير إلى أهمية وضرورة استمرار البحث في هذا المجال لتعزيز الفهم والتطبيقات المستقبلية مثل ذلك النموذج، وهذه الخطوة قد تعزز من فعالية استخدام الذكاء الاصطناعي في مجالات عدة.
تعليقات