تصميم نظام هجين لتصنيف المنتجات من نصوص الشكاوى باستخدام DistilBERT وLinear SVC
الكلمات المفتاحية:
تصنيف النصوص، DistilBERT، LinearSVCالملخص
يُعتبر تصنيف نصوص الشكاوى من المهام الأساسية لتحسين جودة الخدمات وتعزيز رضا العملاء من خلال فهم طبيعة المشكلات المطروحة وتحليل شكاوي العملاء تجاه الخدمات المقدمة. تهدف هذه الدراسة إلى تصميم نظام هجين لتصنيف المنتجات من نصوص الشكاوى ضمن مجموعة بيانات شكاوى المستهلكين المقدمة إلى مكتب الحماية المالية للمستهلك في الولايات المتحدة الأمريكية CFPB (Consumer Financial Protection Bureau)، مؤلف من DistilBERT للتمثيل وLinear SVC للتنبؤ، ثم مقارنة أداء النموذج مع أداء نموذج التقليدي TF-IDF. تم استخراج التمثيلات العددية للنصوص باستخدام DistilBERT، وتم تدريب نموذج LinearSVC مع ضبط معلمات النموذج عبر تقنية Grid Search لتحسين الأداء.
أظهرت النتائج التجريبية أن نموذج DistilBERT مع LinearSVC قدم أداءً قوياً في دقة التصنيف ومقاييس الدقة النوعية والاستدعاء ومقياس F1 بمتوسط قيم بلغ 78%، مما يعكس قدرة النموذج على التقاط السمات الدلالية العميقة من النصوص. تؤكد الدراسة أهمية اختيار النموذج الأمثل اعتماداً على خصائص البيانات، طبيعة المهمة، والموارد الحسابية المتاحة، كما تُبرز الدراسة فعالية الدمج بين التمثيلات السياقية لنموذج DistilBERT والخوارزميات الخطية في مهام التصنيف، وتؤكد أهمية استخدام النماذج الهجينة التي تجمع بين القوة التعبيرية للنماذج العميقة وكفاءة نماذج التعلّم التقليدية لتحقيق أداء متوازن وموثوق في تطبيقات معالجة اللغة الطبيعية.