تحليل المشاعر

الفكرة:

يقوم هذا النموذج بتحليل المشاعر باستخدام خوارزمية إحصائية تعتمد على حساب لوغاريتمات نسبة الأرجحية القائمة على نظرية الأصل الثنائي للجذور العربية.

البيانات:

تم تدريب النموذج باستخدام مئة ألف من المراجعات والتقييمات العربية لفنادق وأفلام وكتب ومنتجات منشورة على Kaggle

التجربة:

أدخل جملة معينة (تقييم على سبيل المثال):

الأداء:

بحجم لا يتجاوز 30 كيلوبايت للنموذج (الشيفرة البرمجية متاحة هنا)، استطعنا تحقيق نسبة إجابات صحيحة تبلغ %75 على بيانات التدريب، وكذلك %84 على مجموعة بيانات التقييمات العربية للفنادق (87% Precision و 80% Recall) بإجمالي 105698 تقييما لم يرها النموذج من قبل! لمزيد من المعلومات التقنية يمكنكم الإطلاع على النقاش التالي مع فريق ARBML والمشاركة فيه.