الثلاثاء، 11 أبريل 2017

طبيعة النموذج اللوجستي

طبيعة النموذج اللوجستي Logistic Model 
        يستخدم النموذج اللوجستي بشكل واسع في الأبحاث الحياتية وذلك لتمثيل العلاقة بين متغير نسبة الاستجابات (P) حيث الاستجابة ثنائية Binary Response في مثل هذه الأبحاث – ومقياس الجرعة (X) الذي يمثل المتغيرات التوضيحية Explanatory variables إذ يعتقد بوجود تأثير كبير لهذه المتغيرات في احتمال الاستجابة P . وهو نموذج انحدار لا خطي يلاءم البيانات الثنائية Binary Data التي يكون فيها المتغير المعتمد هو متغير وهمي يمثل الاستجابة التي أما أن تكون موجودة (إيجابية) وتأخذ القيمة (1) أو غير موجودة (سلبية) وتأخذ القيمة (5) ، ولكون الباحث الإحصائي يهتم بوجود (تحقق) الاستجابات عند كل مستوى من مستويات المتغير التوضيحي الذي يعتقد بعلاقته بها ، لذلك فان متغير نسبة الاستجابة المشاهدة هو نسبة الاستجابات المتحققة (الايجابية) عند كل مستوى من مستويات المتغير التوضيحي ، وهي نسبة متغيره من مستوى إلى آخر ويقترب توزيعها كثيرا من التوزيع الطبيعي عندما يكون حجم العينة كبيرا وذلك استناداً الى خاصية توزيع ذي الحدين الذي يؤول إلى التوزيع الطبيعي بزيادة حجم العينة ، وهذه الخاصية تعرف بأنها (الاتجاه نحو الاعتدال بزيادة حجم العينة) .
Tendency towards Normality as a sample size increases [14]



فلو فرضنا ان
xi  : المستوى i للتغير التوضيحي X
ni  : حجم الاستجابات الكلية (الايجابية والسلبية) المشاهدة عند المستوى i
ri  : عدد الاستجابات الموجودة (الايجابية) المشاهدة عند المستوى i
فأن :

هو نسبة الاستجابة المتحققة (الايجابية) المشاهدة
وان :

هو نسبة (احتمال) الاستجابة السلبية المشاهدة
وحيث ان 1- pi , pi  هما دالة الى X فيمكن كتابتهما بدلالة X وفق النموذج الاتي المسمى (النموذج اللوجستي Logistic Modle) :





2-2 التحويل الخطي للنموذج اللوجستي وأسبابه The linear Transformation 
        يصنف النموذج اللوجستي ضمن النماذج اللاخطية التي يمكن تحويلها إلى نماذج خطية وتسمى هذه النماذج بالنماذج الخطية ضمنيا (جوهريا) Intrinsically linear Model [15]. ويميل الاحصائيون عادة إلى التحويل الخطي لهذه النماذج لإزالة إنحناءات معلماتها وذلك لتأثير هذه الانحناءات السلبي في حالة وجودها على خصائص مقدرات المربعات الصغرى لها L.S estimators  ومن ثم قيم الاستجابة التي يتم التنبؤ بها ، حيث تكون هذه المقدرات في الغالب متحيزة ولا تتوزع توزيعا طبيعيا وتبايناتها لا تكون أصغر ما يمكن مما يجعل نتائج الاختبارات مضللة[16] .    
        وقد قام الباحث Berkson منذ العام 1944 بتحويل علاقة الانحدار اللاخطية بين المتغير التوضيحي X ومتغير نسبة الاستجابة P في النموذج اللوجستي إلى علاقة إنحدار خطية ، برسم لوغاريتم النسبة   مقابل قياسات المتغير التوضيحي X ، كما هو واضح في الشكل (3) .
حيث :
  متغير الاستجابة الخطية
X : المتغير التوضيحي

شكل (3)
العلاقة الخطية بين المتغير التوضيحي X
ونسبة الاستجابة المحولة Z
ولبيان ذلك رياضيا نعود إلى الدالتين(2-1) و(2-2)فبقسمة الأولى على الثانية : 

وبأخذ لوغاريتم الطرفين يكون :

وهذه دالة انحدار خطي لـ Z على X . 
2-3 متوسط وتباين متغير الاستجابة Z :
        سبق وأن أشار الباحث إلى أن توزيع P في النموذج اللوجستي هو قريب من التوزيع الطبيعي – لاحظ الشكل 2-2 وبعد تحويل P إلى Z بالتحويل اللوغاريتمي لإزالة تأثير انحناءات معلمات النموذج اللوجستي في تقدير قيم الاستجابة المتوقعة ، لابد من تحديد القيمة المتوقعة لـ Z وتباينه في التوزيع الطبيعي .بالرجوع إلى الدالتين (2-1) و (2-2) فأن :

نلاحظ ان  p =g (x) ، أي ان p هي دالة الى x
ولكن    z = f(p) ،  أي ان z هو دالة لـ P

(قاعدة السلسلة) chain Rule         





وبتعويض (2-4) و (2-5)  في الطرف الايمن من قاعدة السلسلة يكون :
       ،         
وهذا يعني أن انحدار Z على X1 هو انحدار خطي بمعامل خطي ثابت مقداره (B1) وبذلك تكون القيمة المتوقعة لـ Z وتباين Z هي كما يلي :

2-4 طريقة المربعات الصغرى الموزونة (wIs) يتضح من توزيع z ان متوسطه دالة الى (Bi, x) كما ان تباين Z هو دالة الى متوسطه لذلك فأنه لن يكون ثابتاً بتغير المتوسط أو تغير X وهذا يعني عدم تجانس تباين الخطأ العشوائي أي ان :

ان عدم تجانس تباين الخطأ هو خرق لواحد من الفرضيات القياسية لنظرية المربعات الصغرى والتي غالباً ما يشار إليها بفرضية التجانس assumption of homoscedasticity   وهي تعني ان تباين الخطأ  لا يكون ثابتاً عند جميع المشاهدات وعند ذاك يسمى ذلك الخطأ بأنه غير متجانس hetreoscedastrcity وان من شأن ذلك الحصول على مقدرات غير دقيقة ولا تكون تبايناتها اقل ما يمكن مما يجعل نتائج جميع الاختبارات مضللة [17] .
        ولمعالجة هذه المشكلة هناك طريقتان : أحداهما باستخدام تحويل مناسب لدالة النموذج الخطي ولاسيما التي تكون تبايناتها دوالاً الى متوساطتها كما أوردها بالتفصيل [18] Stuart & Kendal  ، والأخرى باستخدام طريقة المربعات الصغرى الموزونة وهي التي اتبعها الباحث ، وذلك كما يلي :
يتم اختيار الاوزان بحيث تتناسب عكسيا مع التباين أي اختيار :

حيث Wi هي الأوزان المختارة
        فيكون تقدير المعلمات B1 , B0 حسب طريقة المربعات الصغرى تعني إيجاد قيمتيهما اللتين تجعلان الفارق بين الاستجابة المشاهدة والاستجابة المقدرة (المتوقعة) اقل ما يمكن ، أي التي تصغر مجموع مربعات البواقي (الخطأ) sse ، فيكون [19] .

وباستخدام التفاضل الجزئي لهذه المعادلة بالنسبة الى B1 , B0 ثم جعل الناتج يساوي صفر يكون

وباستخدام المصفوفات يمكن كتابة هاتين المعادلتين الطبيعيتين كما يلي :

وهذا يعني ان :

حيث ان
             ,         = 


وبذلك تكون :


كما يمكن تقدير قيم معلمات نموذج الانحدار اللوجستي باستخدام التباينات ، كما يلي :  من المعادلة الطبيعية الاولى           
وبقسمة الطرفين على   يكون

وبتعويض (2-9) في المعادلة الطبيعية الثانية :




كما ويمكن إيجاد قانون حساب قيمة مجموع مربع الانحرافات في المشاهدات العائدة لانحدار Z على X1 والذي نرمز له   كما يلي :

 





Where :
 معادلتان طبيعيتان      






                           Sx1z



حيث :
Szz هو مجموع مربع الانحرافات الكلية في الاستجابات المشاهدة .
SSE هو مجموع مربع الانحرافات المتبقية بعد طرح مجموع مربع الانحرافات العائدة للانحدار من مجموع الانحرفات الكلية .
2-5 اختبار معنوية B1 , B0 : ان توزيع المعاينة لـ B1 , B0 في الانحدار الخطي هو التوزيع الطبيعي بوسط حسابي وقدره على التوالي :

وبتباين وقدره على التوالي :

حيث C00 ، C11 هي عناصر قطر معكوس المصفوفة :

ولكون MSE =  =1 عند استخدام مقلوب تباين استجابة ثنائية باعتباره الوزن للازم لتحقيق تجانس تباين حد الخطأ العشوائي في نموذج الانحدار ولذلك يكون :

كما يمكن استخدام التباينات بدل المصفوفات لحساب       كما يلي:

ولاختبار معنوية  B1 , B0فانه يجري عادة اختبار الفرضية القائلة بأن Bi تساوي صفر ، وتكتب مع الفرضية البديلة كالاتي :
H0 : Bi = 0
V.s H1 : Bi   0                                 where i = 0   ,   1
ونستخدم احصاءة الاختبار

اذ ان احصاءة الاختبار تتوزع توزيع t-student بدرجة حرية قدرها (n-2) عندما تكون فرضية العدم [H0:Bi=0] صحيحة ، أي عندما تكون احصاءة الاختبار   وتقارن مع قيمة t- الجدولية بنفس درجة الحرية وبمستوى معنوية معينة =  فاذا كانت :
 نرفض فرضية العدم

  لا نرفض فرضية العدم
2-6 تحليل الانحرافات ومؤشرات ملاءمة النموذج :
        ان تحليل الانحرافات في الاستجابات المشاهدة وفقاً لخاصية الانحدار يعني تقسيم هذه الانحرافات الى قسمين احدهما يعود لخاصية الانحدار (انحدار الاستجابات على المتغير التوضيحي – الفارق في عمر الزوجين) والآخر يعود لعوامل أخرى لم يدخلها الباحث في نموذجه وهي ما تبقى من الانحرافات الكلية ولذلك تسمى انحرافات(البواقي) ويمكن الإشارة إلى هذا التحليل بالرموز الآتية:
Szz : مجموع مربع الانحرافات الكلية في الاستجابات المشاهدة ويحسب وفق العلاقة :

 : مجموع مربع الانحرافات في الاستجابات المشاهدة العائدة للانحدار ويحسب وفق العلاقة (2-11) أو (2-12) التي سبق اشتقاقها .
  : مجموع مربع الانحرافات المتبقية (البواقي) بعد طرح مجموع مربع الانحرافات العائدة للانحدار من مجموع مربع الانحرافات الكلية وبحسب وفق العلاقة (2-13) التي سبق اشتقاقها ومن خلال هذا التحليل للانحرافات الكلية في الاستجابات المشاهدة يمكن تحديد ملاءمة نموذج الانحدار المستخدم للبيانات موضوع البحث والدراسة وذلك بعدة مؤشرات منها ما يلي :
2-6-1 النسبة R2 ومجموع مربعات الانحدار  S
ان R2 هو نسبة الاختلافات في متغير الاستجابة المشاهدة Z التي تعود لعلاقة الانحدار الخطية، أو هو النسبة التي يفسرها المتغير التوضيحي X1 .
        ويسمى ايضاً (معامل التحديد coefficient of determination) ويحسب وفق العلاقة :

        ويلاحظ ان هذا المؤشر يعتمد على قيمة مجموع مربعات الانحرافات العائدة للانحدار إذ كلما اقتربت من مجموع مربعات الانحرافات الكلية كلما اقترب هذا المؤشر من الرقم 1 أو 100% إذا استخدم كنسبة مئوية ، مما يعني قوة علاقة الانحدار الخطي وملاءمة النموذج للبيانات .ومن زاوية أخرى للنظر فأن كبر قيمة مجموع مربعات الانحرافات العائدة للانحدار تعني صغر قيمة مجموع مربعات الانحرافات المتبقية (SSE) واذا حسب متوسط هذه الانحرافات (MSE) بدرجات حرية كافية فان قيمته ستكون صغيرة جداً وهي مؤشر على معنوية علاقة الانحدار وملاءمة النموذج للبيانات .
2-6-2 تحليل البواقي Residuals – Analysis
        لكون البواقي حسب نظرية المربعات الصغرى تتوزع توزيعاً طبيعياً بوسط حسابي يساوي صفر وتباين يساوي  فان قيم البواقي المقدرة بواسطة نموذج الانحدار الملائم للبيانات سوف تتمحور حول لوسط الحسابي لها أي حول (الصفر) أي انها لا تأخذ شكلاً معيناً وتنحصر عادة بين ( ) اذا ما رسمت كنقاط ازاء القيم المتوقعة لمتغير الاستجابة أو ازاء المتغير المستقل (لتوضيحي) في حالة نموذج الانحدار الخطي البسيط ، حيث تكون على شكل خطين متوازيين فاذا تبين وجود علاقة محددة بين قيم البواقي وقيم متغير الاستجابة المتوقعة أو قيم المتغير التوضيحي  فمعنى ذلك ان هناك في الاقل خرقاً لواحد من فرضيات نظرية المربعات الصغرى ، وان النموذج المستخدم غير ملائم للبيانات ، هذا فضلاً عن ان رسم نقاط انتشار البواقي يكشف عن النقاط المتطرفة التي قد يكون لها أهمية في التحليل الإحصائي للبيانات اكبر من أهمية بقية البيانات .
3 - الجانب التطبيقي
3-1 أسلوب جمع البيانات وتصنيفها :
        تم جمع البيانات عن حالات الزواج المسجلة في محاكم الاحوال الشخصية لرئاسة استئناف بغداد/الكرخ والرصافة لعام 2004 والبالغ عددها 8008 حالة زواج بأسلوب العينة العشوائية النظامية Systematic Random Sample وذلك لسهولة تطبيقه وشموليته حيث اختيرت عينة عشوائية بحجم 200 حالة زواج وتم حساب المدى المنتظم بين كل حالة زواج مختارة واخرى ضمن العينة باستخدام العلاقة :
واختيرت البداية العشوائية (حالة الزواج الاول في العينة) من بين تسلسلات حالات الزواج المرقمة من 1 الى 40 فكانت البداية هي التسلسل 37 ، وبذلك يكون تصميم العينة العشوائية النظامية بإضافة المدى 40 بصورة متتالية بدءاً من التسلسل رقم  37 وكما يلي :
397   357   317   277   237   197   157    117   77  37))...7997)) ثم جرى تتبع حالات الزواج هذه (الواردة تسلسلاتها في العينة) على مدى خمس سنوات [من 2004 – 2008] في سجلات هذه المحاكم ، فتبين ان (45) حالة زواج منها انتهت بالطلاق بينما استمرت 155 حالة زواج . وبتصنيف حالات الزواج في العينة حسب الفارق العمري بين الزوجين ، حصل الباحث على البيانات الاتية كما هي موضحة في الجدول (1) .





وبحساب نسبة الحالات التي تأثرت الفارق العمري عند كل مستوى من مستوياته (نسبة الاستجابة المشاهدة) من العلاقة:

وحساب نسبة الحالات التي لم تتأثر بالفارق العمري وعند كل مستوى من مستوياته ((نسبة عدم الاستجابة المشاهدة)) من العلاقة :

حصل الباحث على البيانات الآتية كما هي موضحة في الجدول (2)


الاستنتاجات
1.     يلاحظ ان     الذي يمثل متوسط الاستجابة (للانفصال) في بداية الحياة الزوجية ذو قيمة سالبة ومعنوية جدا ، مما يدفع للاستنتاج أن تأثير الفارق في عمر الزوجين والعوامل الاخرى لا يظهر قطعاً عند بداية الحياة الزوجية ، إذ عندها لا يفكر الزوجان إلا في استمراريتها ورسوخها ، وإنما يظهر بتقادم الحياة الزوجيةمما يجعل ضرره أكبر .
2.     يلاحظ ان قيم الاستجابات الخطية المتوقعة هي قيم سالبة حتى عند مستوى الفارق العمري "15 سنة" بين الزوجين ، مما يدفع إلى الأسستنتاج انه حتى عند هذا الفارق العمري الكبير فان الحياة الزوجية لن تكون مهددة اذا كان هو العامل الوحيد المؤثر في الحياة الزوجية ، وهذا يعني ان من شروط اشتغال (فعالية) هذا العامل هو وجوب مرافقته لعامل أو أكثر من العوامل الأخرى المؤثرة سلبا في الحياة الزوجية والتي هي عادة ما يكون بعضها موجودا في أية حياة زوجية .
3.     يلاحظ من رسم البواقي أنها جميعا تنتشر قريبة من الصفر عدا نقطتين فهما متطرفتان Extreme وهما اللذان يمثلان الفارق في عمر الزوجين المؤثر بصورة معنوية على مستقبل حياتهما الزوجية وهو الفارق العمري (أكبر أو يساوي 15 سنة) ، والفارق العمري (أقل أو يساوي سنة واحدة) لصالح الزوج ، وحيث أنه لم يكن هناك خطأ في قياسهما لذلك نستنتج أهمية هاتين النقطتين ، وبذلك يكون المدى المقبول (غير المعنوي) للفارق العمري بين الزوجين هو [ ] .
4.     يلاحظ أن قيمة معامل التحديد  R2  يساوي 43% وهي نسبة الاختلاف في الاستجابة التي يفسرها الفارق في عمر الزوجين في معادلة الانحدار الخطي المستخدمة في هذا البحث ، وهذا يعني ان 57% من الاستجابات المختلفة تعود اسباب اختلافها لعوامل أخرى لم تتضمنها معادلة الانحدار ، مما يدفع إلى الاستنتاج أن اختيار نموذج الانحدار اللوجستي (المتعدد) لدراسة مستقبل الحياة الزوجية هو الاختيار الأفضل .

4-2 التوصيات
1.     يوصي الباحث بوضع نتائج البحث في متناول ايدي وحدات البحث الاجتماعي في محاكم الأحوال الشخصية لغرض التعرف على المدى المقبول (غير المعنوي) لتأثير الفارق العمري بين الزوجين [ ] وشروط فعاليته والعمل على تسجيل الفارق العمري بين الزوجين عند مراجعتهما لغرض عقد القران وليس عند رفع دعوى الطلاق ، لكي يتسنى لهذه الوحدات توجيه الزوجين اللذين يتجاوز الفارق العمري بينهما المدى المقبول بمخاطره المستقبلية .
2.     يوصي الباحث باستخدام وسائل الاعلام وبخاصة "التلفيزيون" لتثقيف الاباء والامهات وتوعيتهم بمخاطر الزواج عندما يكون الفارق العمري بين الزوجين خارج المدى المقبول (غير المعنوي) .
3.     يوصي الباحث باستخدام النموذج اللوجستي في البحوث الاجتماعية التي تكون بياناتها ثنائية ، وليس فقط في البحوث الحياتية .
4.     يوصي الباحث باستخدام النموذج اللوجستي متعدد المتغيرات في مثل هذه البحوث الاجتماعية لكونه أكثر ملاءمة لوصف البيانات ، ومن ثم الحصول على استجابات متوقعة قريبة جدا من الاستجابات المشاهدة .

مواضيع ذات صلة 
طبيعة النموذج اللوجستي
شرح تحليل الانحدار اللوجستي
كتاب الانحدار اللوجستي
الانحدار اللوجستي spss
تفسير نتائج الانحدار اللوجستي
الانحدار اللوجستي
الانحدار اللوجستي
بحوث في الانحدار اللوجستي
الانحدار اللوجستي المتعدد
 

ليست هناك تعليقات:

إرسال تعليق