الاثنين، 25 مايو، 2015

بعض المقاييس لوصف البيانات



بعض المقاييس الأخرى لوصف البيانات
عند تمثيل بيانات الظاهرة في شكل منحني تكراري ، فإن هذا المنحني يأخذ أشكالا مختلفة ، فقد
يكون هذا المنحنى متماثل بمعنى أن له قمة في المنتصف ، ولو أسقطنا عمودا من قمته على المحور الأفقي
لشطره نصفين متماثلين ، مثل منحنى التوزيع الطبيعي ، كما هو مبين بالشكل التالي .
منحنى التوزيع الطبيعي (منحنى متماثل )
وعندما يكون الشكل متماثل ، فإن الوسط والوسيط والمنوال كلهم يقعون على نقطة واحدة ،
ولكن في كثير من الحالات يكون هناك قيم كبيرة في البيانات تجذب إليها الوسط الحسابي ، وهذا معناه
أن المنحنى التكراري سوف يكون له ذيل جهة اليمين ، مشيرا بوجود التواء جهة اليمين ، وكذلك
العكس لو أن البيانات ا قيم صغيرة ، فإا تجذب الوسط إليها، ويدل المنحني التكراري على وجود
التواء جهة اليسار، كما يمكن من خلال الشكل البياني معرفة ما إذا كان توزيع البيانات منبسط، أو
مدبب، وهذا من الناحية البيانية، إلا أن هناك مقاييس كثيرة لوصف البيانات تعتمد في حساا على
مقاييس الترعة المركزية والتشتت معا، ومنها مقاييس الالتواء، والتفرطح، وبعض المقاييس الأخرى
سوف يتم عرضها فيما بعد.
Skewness 2/5 مقاييس الالتواء
هناك طرق كثيرة لقياس الالتواء ومنها ما يلي:
في قياس الالتواء "Person 1/2/5 طريقة "بيرسون
تأخذ هذه الطريقة في الاعتبار العلاقة بين الوسط والوسيط والمنوال، في حالة ما إذا كان
(1 - التوزيع قريب من التماثل وليس شديد الالتواء ، وهذه العلاقة هي: ( 5
ومن ثم فإن طريقة "بيرسون" في قياس الالتواء ، تتحدد بالمعادلة التالية.
69
S ، هو الوسيط Med ، الوسط الحسابي x ،" (ألفا) هو معامل الالتواء "لبيرسون a حيث أن
هو الانحراف المعياري، ويمكن من خلال الإشارة التي يأخذها هذا المعامل الحكم على شكل الالتواء، كما
يلي :
) ، ويدل ذلك على أن منحنى a إذا كان (الوسط الحسابي = الوسيط ) كان قيمة المعامل ( 0
التوزيع التكراري متماثل.
) ، ويدل ذلك على أن منحنى a إذا كان (الوسط الحسابي > الوسيط ) كان قيمة المعامل ( 0
التوزيع التكراري ملتوي جهة اليمين .
) ، ويدل ذلك على أن منحنى a إذا كان (الوسط الحسابي < الوسيط ) كان قيمة المعامل ( 0
التوزيع التكراري ملتوي جهة اليسار.
(1 - شكل ( 5
أشكال التواء البيانات
2/2/5 طريقة "المئين" في قياس الالتواء
المئين ينتج من ترتيب البيانات تصاعديا، ثم تقسيمها البيانات إلى 100 جزء، يفصل بينها قيم
على أنه القيمة التي يقل عنها ( v تسمى المئين، وعلى سبيل المثال يعرف المئين 15 ويرمز له بالرمز ( 15
يتبع نفس الفكرة المستخدمة في ، (vp ) ونرمز له بالرمز ، p 15% من القيم، ولحساب قيمة المئين
حساب الربيع كما يلي:
x(1) x(2) ...x(n) : ترتب القيم تصاعديا
: رتبة المئين 


100
. R (n 1) p
.( v15 x(R) ) عدد صحيح فإن R إذا كانت الرتبة
تحسب بالمعادلة التالية: (vp ) عدد كسري فإن قيمة المئين R أما إذا كانت الرتبة
، v من المئين 50 ، v100p والمئين ، vp وتعتمد فكرة المئين في قياس الالتواء على مدى قرب المئين
وكمثال على ذلك ، عند قياس الالتواء باستخدام المئين 20 ، والمئين 80 ، يلاحظ على الرسم التالي
70
حالات الالتواء :
(2 - شكل ( 5
ومن الشكل أعلاه يلاحظ الآتي :
كان (v عن المئين ( 50 (v يساوي بعد المئين ( 20 (v عن المئين ( 50 (v إذا كان بعد المئين ( 80
التوزيع متماثلا .
كان (v عن المئين ( 50 (v أكبر من بعد المئين ( 20 (v عن المئين ( 50 (v إذا كان بعد المئين ( 80
التوزيع موجب الالتواء .
كان (v عن المئين ( 50 (v أقل من بعد المئين ( 20 (v عن المئين ( 50 (v إذا كان بعد المئين ( 80
التوزيع سالب الالتواء .
وبشكل عام يمكن الحكم على شكل التوزيع باستخدام معامل الالتواء المئيني، ويأخذ المعادلة التالية.
ويفضل استخدام هذا المعامل في حالة البيانات التي تحتوي على vp v50 v100p : حيث أن
،( v25 Q1) قيم شاذة ، وأيضا البيانات التي لا نعرف لها توزيع محدد، وعندما نستخدم المئين 25
نحصل على معامل الالتواء الربيعي ، وهو : ( v75 Q3 ) المئين 75
(1 - مثال ( 5
كانت درجات 8 طلاب في الاختبار النهائي في مقرر 122 إحص ، كالتالي.
66 85 52 78 80 91 74 58
والمطلوب : 1- حساب معامل الالتواء بطريقة " بيرسون " .
-2 حساب معامل الالتواء الربيعي .
الحل
-1 حساب معامل الالتواء بطريقة "بيرسون" .
71
2) كما يلي: - في هذه الحالة يتم تطبيق المعادلة رقم ( 5
حساب الوسط الحسابي ، والانحراف المعياري : •
x2
حساب الوسيط : •
(n+ 1)/2= (8+ 1)/2= موقع الوسيط : 4.5
52 58 66 74 78 80 85 91
1 2 3 4 5 6 7 8
2.25 4.5 6.75
Med 74 0.5(78 74) 76
معامل الالتواء "بيرسون" •
0.67
13.406
. 3( ) 3(73 76) 

S
s c x Med
إذا منحنى توزيع درجات الطلاب ملتوي جهة اليسار .
-2 معامل الالتواء الربيعي .
.(5 - لحساب معامل الالتواء الربيعي ، يتم تطبيق المعادلة رقم ( 5
حساب الربيع الأدنى . •
(n+ 1)/4= (8+ 1)(1/4)= موقع الرباعي : 2.25
إذا
72
1 58 (2.25 2)(66 58) 60 Q 
حساب الرباعي الأعلى. •
(n+ 1)/(3/4)= (8+ 1) (3/4)= موقع الرباعي : 6.75
إذا
3 80 (6.75 6)(85 80) 83.75 Q 
الوسيط (الربيع الثاني) •
( ) 76 2 Med Q 
إذا معامل الالتواء الربيعي هو :
0.35
إذا توزيع درجات الطلاب ملتوي جهة اليسار.
Kurtosis 3/5 التفرطح
عند تمثيل التوزيع التكراري في شكل منحنى تكراري ، قد يكون هذا المنحنى منبسط ، أو
مدبب ، فعندما يتركز عدد أكبر من القيم بالقرب من منتصف المنحنى، ويقل في طرفيه، يكون المنحنى
مدببا ، وعندما يتركز عدد أكبر على طرفي المنحنى ، ويقل بالقرب من المنتصف يكون المنحنى مفرطحا ،
أو منبسطا، ويظهر ذلك من الشكل التالي :
منحنى مدبب منحنى مفرطح
ويمكن قياس التفرطح باستخدام عدد من الطرق، ومنها طريقة العزوم ، حيث يحسب معامل
بتطبيق المعادلة التالية : (K) التفرطح
73
هو الانحراف s ، هو العزم الرابع حول الوسط (xx)4 n حيث أن المقدار
المعياري . ومعامل التفرطح في التوزيع الطبيعي يساوي 3 ، ومن ثم يمكن وصف منحنى التوزيع من
حيث التفرطح ، والتدبب كما يلي :
كان منحنى التوزيع معتدلا . k= إذا كان 3
كان منحنى التوزيع مدببا . k> إذا كان 3
كان منحنى التوزيع منبسطا (مفرطحا) . k< إذا كان 3
x 1) نجد أن: 73 - وبالتطبيق على بيانات المثال رقم ( 5
x 66 85 52 78 80 91 74 58 584
(xx) -7 12 -21 5 7 18 1 -15 0
49 144 441 25 49 324 1 225 1258
(xx)2
2401 20736 194481 625 2401 104976 1 50625 376246
(xx)
إذا شكل توزيع بيانات الدرجات مفرطح.
4/5 مقاييس أخرى لوصف البيانات
هناك مقاييس أخرى يمكن استخدامها في وصف البيانات ، من حيث درجة تشتت البيانات،
ومدى انتشارها، ومن هذه المقاييس ، ما يلي :
Variation Coefficient 1/4/5 معامل الاختلاف
أحد مقاييس المستخدمة لقياس درجة التشتت، وفيه يحسب قيمة التشتت كنسبة مئوية من قيمة
مقياس الترعة المركزية ، ومن ثم يفضل استخدام معامل الاختلاف عند مقارنة درجة تشتت بيانات
مجموعتين أو أكثر مختلفة لها وحدات قياس مختلفة، بدلا من الانحراف المعياري ، أو الانحراف الربيعي ،
74
لأن معامل الاختلاف يعتمد على التغيرات النسبية في القيم عن مقياس الترعة المركزية، بينما يعتمد
الانحراف المعياري أو الانحراف الربيعي على التغيرات المطلقة للقيم، فعند مقارنة درجة تشتت بيانات
الأطوال بالسنتمتر، وببيانات الأوزان بالكيلوجرام، لا يمكن الاعتماد على الانحراف المعياري في هذه
المقارنة، وإنما يستخدم معامل الاختلاف، ومن ثم يطلق عليه بمعامل الاختلاف النسبي، وفيما يلي بعض
هذه المعاملات.
معامل الاختلاف النسبي
ويحسب معامل الاختلاف النسبي بتطبيق المعادلة التالية:
معامل الاختلاف الربيعي
ويحسب هذا المعامل بتطبيق المعادلة التالية:
(2 - مثال ( 5
تم اختيار مجموعتين من الأغنام النامية في أحد المزارع، وتم استخدام عليقة معينة لتسمين
اموعة الأولى، بينما تم استخدام عليقة أخرى لتسمين اموعة الثانية ، وبعد فترة زمنية تم جمع بيانات
عن أوزان اموعتين بالكيلوجرام ، وتم الحصول على المقاييس التالية .
اموعة الثانية اموعة الأولى المقاييس
x 173 198
s 23 25
والمطلوب مقارنة درجة تشتت اموعتين:
الحل:
معامل الاختلاف النسبي للمجموعة الأولى: •
173 100 13.3%
100 23 1 . x
s vc
معامل الاختلاف النسبي للمجموعة الثانية: •
195 100 12.8%
100 25 2 . x
s vc
75
يلاحظ أن درجة تشتت أوزان اموعة الثانية أقل من درجة تشتت أوزان اموعة الأولى.
2/4/5 تقدير مدى الانحراف المعياري
يمكن قياس درجة تشتت البيانات من خلال تقدير المدى الذي يقع داخله الانحراف المعياري
وهو:
وإذا كان المدى الذي يقع فيه الانحراف المعياري صغير دل ذلك على أن تشتت البيانات صغير،
أما إذا كان المدى كبير دل ذلك على وجود تشتت كبير في البيانات، وإذا وقع الانحراف المعياري خارج
المدى دل ذلك على وجود قيم شاذة.
Standardized degree 3/4/5 الدرجة المعيارية
تقيس الدرجة المعيارية لقيمة معينة عدد وحدات الانحراف المعياري التي تزيد ا تقل ا هذه
هو x وكان ،n هي قيم المشاهدات، وعددها ، x1,x2 ,...,xn القيمة عن الوسط الحسابي، فإذا كان
ويرمز لها ، x هو الانحراف المعياري، فإن الدرجة المعيارية للقيمة s ، الوسط الحسابي لهذه القيم
تحسب باستخدام المعادلة التالية: ، z بالرمز
ويمكن استخدام هذه الدرجة في مقارنة قيمتين أو أكثر مختلفة من حيث وحدات القياس.
(3 - مثال( 5
2) السابق إذا تم اختيار أحد الأغنام من اموعة الأولى بعد تطبيق البرنامج ، - في المثال ( 5
ووجد أن وزنه 178 كيلوجرام، وبالمثل أحد الأغنام من اموعة الثانية، ووجد أن وزنه 180
كيلوجرام ، قارن بين هذين القيمتين من حيث أهمية كل منها في اموعة التي تنتمي إليها.
الحل
البيانات المتاحة عن كل من اموعتين هي:
اموعة الثانية اموعة الأولى
x 173 198
s 23 25
76
178 180 القيمة.
للمقارنة بين الوحدتين من حيث أهمية وزن كل منها في اموعة التي تنتمي إليها، يتم حساب
.(10 - الدرجة المعيارية لوزن كل منها، بتطبيق المعادلة ( 5
178 ) هي: Kg.) الدرجة المعيارية لوزن الوحدة المسحوبة من اموعة الأولى
0 .22
23
178 173 
s
z x x
180 ) هي: Kg.) الدرجة المعيارية لوزن الوحدة المسحوبة من اموعة الثانية
0 .75
25
180 198 
s
z x x
نجد أن الوزن 178 كيلوجرام يزيد عن الوسط الحسابي ب 0.22 انحراف معياري ، بينما نجد أن
الوزن 180 كيلوجرام يقل عن الوسط الحسابي ب 0.75 انحراف معياري . ومن ثم الوزن الأول
أهميته النسبية أعلى من الوزن الثاني.
4/4/5 القاعدة العملية
هو الوسط الحسابي لهذه x وكان ، x1,x2 ,...,xn : إذا كان لدينا المشاهدات التالية
هو الانحراف المعياري لها ، يكون منحنى توزيع هذه المشاهدات متماثل، إذا تحقق الآتي: s ، المشاهدات
. x s 68% تقريبا من قيم هذه المشاهدات تتراوح بين
. x 2s 95% تقريبا من قيم هذه المشاهدات تتراوح بين
. x 3s 99% تقريبا من قيم هذه المشاهدات تتراوح بين
ويمكن بيان ذلك من الشكل التالي:
(3 - شكل ( 5
شكل توزيع القيم طبقا للقاعدة العملية
5/4/4 القاعدة النظرية
تسمى هذه القاعدة بقاعدة "تشيبشيف" ، وفكرة هذه القاعدة: في أى توزيع من التوزيعات
. k 1 ، x ks من قيم المشاهدات تقع في المدى 11 k2 النظرية ، فإنه على الأقل %
على ، x 2s وطبقا لهذه القاعدة، فإنه على الأقل % 75 من قيم المشاهدات تقع في المدى
. x 3s الأقل % 89 من قيم المشاهدات تقع في المدى
77
Box Plot " 6/4/5 شكل "بوكس
Q شكل "بوكس" البياني هو صندوق يشبه المستطيل، بداية حافته اليسرى هو الربيع الأول 1
المستطيل إلى جزأين، Med ( ويقسم الربيع الثاني (الوسيط ، Q واية حافته اليمنى هو الربيع الثالث 3
ويخرج من كل حافة من حافتيه شعيرة، والشكل التالي يبين رسمة "بوكس" البياني:
(4 - شكل ( 5
رسمة بوكس البياني
ويمكن استخدام شكل "بوكس" البياني، أعلاه في وصف البيانات من حيث الآتي:
Q يقع في المنتصف على بعد متساوي من الرباعيين , 3 Med -1 من حيث التماثل: إذا كان الوسيط
من الرباعي Q أقرب إلى الرباعي الأول 1 Med كان التوزيع متماثلا ، وإذا كان الوسيط Q1
أقرب إلى الرباعي الثالث Med كان التوزيع موجب الالتواء ، وأما إذا كان الوسيط Q الثالث 3
كان التوزيع سالب الالتواء . ويظهر ذالك كما في الشكل التالي : Q من الرباعي الأول 1 Q3
(5 - شكل ( 5
وصف شكل الالتواء باستخدام رسمة بوكس البياني
ضيق دل ذلك على تركز نسبة كبيرة من Box -2 من حيث تركز البيانات: إذا كان الصندوق
البيانات حول الوسيط، وإذا كان الصندوق واسع دل ذلك على انخفاض نسبة تركز البيانات حول
الوسيط، والشكل التالي يبين ذلك.
(6 - شكل ( 5
وصف درجة تركز البيانات باستخدام رسمة بوكس البياني
-3 من حيث وجود قيم شاذة: إذا وقعت قيم بعض المشاهدات خارج الحدين الأدنى والأعلى الشاذ ،
78
كانت هذه القيم شاذة ، وتظهر هذه القيم على الرسم في شكل نجوم (*) ، والشكل التالي يبين
طريقة عرض القيم الشاذة الدنيا والعليا على الرسم .
(7 - شكل ( 5
تحديد القيم الشاذة باستخدام رسمة بوكس البياني
طريقة حساب حدي القيم الشاذة
لحساب الحدين الأعلى والأدنى للقيم الشاذة، يتبع الخطوات التالية:
Q = (Q3-Q1 )/ حساب الانحراف الرباعي: 2
Low = Q1-3Q : وهو ،(Low) حساب الحد الأدنى للقيم الشاذة
UPP = Q3+ 3Q : وهو ، (Upp) حساب الحد الأعلى للقيم الشاذة
وإذا وقعت قيم خارج الحدين تعتبر هذه القيم من القيم الشاذة.
(4 - مثال( 5
فيما يلي الإنفاق الاستهلاكي بالألف ريال خلال الشهر لعينة حجمها 12 أسرة:
6 10 18 3 9 10 5 6 11 8 2 7
والمطلوب:
-1 رسم شكل "بوكس" البياني
-2 اكتب تحليل وصفي لهذه البيانات.
الحل
-1 رسم شكل " بوكس البياني "
ترتيب القيم تصاعديا . •
2 3 5 6 6 7 8 9 10 10 11 18
تحديد أقل وأعلى إنفاق استهلاكي، وحساب الرباعيات: •
Min = 2 Max = 18
: Q الرباعي الأدنى 1
(n+ 1)(1/4)= (13/4)= موقع الرباعي 3.25
Q1 50.25(6 5) هي: 5.25 Q إذا قيمة 1
:Med الوسيط
79
(n+ 1)(1/2)= (13/2)= موقع الوسيط 6.5
Med 7 0.5(8 7) هي: 7.5 Med إذا قيمة
:Q الرباعي الأعلى 3
(n+1)(3/4)=(13)(3/4)= موقع الرباعي 9.75
Q3 10 0.75(10 10) هي: 10 Q إذا قيمة 3
حساب الحدين الأعلى والأدنى الشاذ . •
Q (10 5.25) / 2 الانحراف الربيعي: 2.375
الحد الأدنى للقيم الشاذة:
3 5.25 3(2.375) 1.875 1 LowQ Q 
الحد الأعلى للقيم الشاذة :
3 10 3(2.375) 17.125 3 Upp Q Q 
رسم شكل "بوكس" •
-2 تحليل وصفي من خلال الشكل أعلاه:
درجة التماثل : التوزيع قريب جدا من التماثل لوقوع الوسيط في المنتصف . •
تركز البيانات: حوالي % 60 من القيم تتركز حول الوسيط. •
. القيم الشاذة: توجد قيمة شاذة عليا هي القيمة 18
ويمكن استخدام شكل "بوكس" البياني لمقارنة مجموعتين أو أكثر .
80

ليست هناك تعليقات:

إرسال تعليق