السبت، 14 يناير، 2017

مقاييس النزعة المركزية والتشتت

مقاييس النزعة المركزية والتشتت
        
التمركز أو بالنـزعة المركزية ، ونسمي القيم التي تتمركز حولها القيم الأخرى مقاييس النـزعة المركزية Measures of Central location ولهذه المقاييس أهمية كبيرة في علم الإحصاء فهي تعطينا فكرة عامة عن قيم الظاهرة المدروسة وبالتالي مقارنة مجموعتين أو أكثر . هناك عدة مقاييس لهذا الغرض منها الوسط الحسابي أو المتوسط (المعدل ) Mean الوسيط Median  والمنوال Mode .
1-3 الوسط الحسابي أو المتوسط: Mean 
 إن الوسط الحسابي( المعدل ) لمجموعة البيانات   هو مجموع هذه البيانات مقسوماً على عددها ويرمز لذلك بالرمز    ويعطى بالعلاقة التالية :
                                              (1-3) 

أما إذا كانت البيانات معطاة بجدول توزيع تكراري ذو k فئة فإن الوسط الحسابي يعطي بالعلاقة :
        (2-3)                                         
حيث رمزنا بــ   ،   لتكرار الفئة i  ومركزها على الترتيب وكذلك   
أمثلة :
a ) عدد الرسائل اليومية التي تلقاها مكتب تجاري خلال ثمانية أيام عمل هي كالآتى  :
2 , 0 , 3 , 15 , 4 , 13 , 5 , 6 
إن متوسط عدد الرسائل اليومية في هذه الحالة هو :
  
b ) إن الوسط الحسابي أو المتوسط للبيانات الواردة في جدول التوزيع التكراري ، الجدول 7-2 يحسب كالتالي :
 تجدر الإشارة هنا إلى أن الوسط الحسابي يتمتع بعدة خواص منها أن مجموع انحرافات قيم مجموعة بيانات عن وسطها الحسابي يساوي الصفر أي :

وذلك بالنسبة للقيم الافرادية. أما بالنسبة للقيم المعطاة في جدول توزيع تكراري فهي :


2-3  الوسيط: Median
عند ترتيبنا لقيم ظاهرة إحصائية ما تصاعدياً أو تنازلياً يمكننا أن نعين وضعية إحدى هذه القيم ولتكن
 , وقولنا أن ربع قيم المجتمع هي أعلى من هذه القيمة وثلاثة أرباع القيم أقل منها أو أن ثلثها أقل من هذه القيمة   وثلثيها أكبر منها . نسمي مثل هذه المقاييس مقاييس وضعية ، حيث يعتبر الوسيط أحد أهم هذه المقاييس . وبالتعريف :  الوسيط هو القيمة التي يتساوى على طرفيها عدد القيم بعد ترتيبها تصاعدياً بحيث تكون كل قيمة من القيم التي تسبقه أصغر منه وكل قيمة من القيم التي تليه أكبر منه. أما إذا كانت القيم مرتبة تنازلياً فتكون القيم التي تسبقه أكبر والتي تليه أصغر. فإذا كان عدد هذه القيم فردياً  عددها n  (حيث  n عدد فردي)  فالوسيط هو القيمة النصفية التي تقسم هذه القيم ,أما إذا كان عدد القيم زوجياً فالوسيط هو الوسط الحسابي لمجموع القيمتين الوسيطيتين ويرمز للوسيط بالرمز   وهو القراءة التي ترتيبها      في حالة n عدد فردي.
 أما إذا كان n عدداً زوجياً فالوسيط هو متوسط القراءتين      و+1 
أمثلة :
a ) القيم 3,-2,5,6,1,2,10  والتي تصبح بعد ترتيبها تصاعدياً -2,1,2,3,5,6,10 أوجد الوسيط لهذه البيانات .
الحل :   بما أن n = 7 والوسيط هو القيمة النصفية وبالتالي : 
أي أن القيمة المطلوبة هي الرابعة وبالتالي فإن 
b ) لتكن القيم 4,-5,6,-1,3,8,10,11 والتي تصبح بعد ترتيبها تصاعدياً -5,-1,3,4,6,810,11 أوجد وسيط هذه البيانات .
الحل :
بما أن n = 8 وعددها زوجياً فإن الوسيط هو متوسط القيمتين الوسيطيتين,  أي   وبالتالي فهو الوسط الحسابي للقيمتين الرابعة والخامسة

و تستخدم هذه الطريقة إذا كان عدد البيانات صغيرا . أما إذا كان عدد البيانات كبيرا و غير مرتب في جدول  تكراري فان هناك طريقة عامة سنذكرها في الفقرة القادمة.
أما إذا كانت القيم معطاة في جدول توزيع تكراري وموزعة توزيعاً عادلاً ضمن فئات متساوية الطول فإن الفئة الوسيطية هي أول فئة يزيد تكرارها المتجمع الصاعد عن    أو يساويه حيث n مجموع التكرارات ويعطى الوسيط   في هذه الحالة بالعلاقة التالية :
                                                                                              ( 3-3 )
حيث نرمز بـ a للحد الأدنى الفعلي للفئة الوسيطية ، طول الفئة ، k مجموع تكرارات الفئات التي تسبق  a أما   jفهو تكرار الفئة الوسيطية وأخيراً  . لاحظ هنا أن العلاقة السابقة هي علاقة عامة حيث الوسيط انما هو   وبالتالي فيمكن حساب أي مئوي بنفس الطريقة.
c ) أوجد الوسيط لمجموعة القيم المعطاة بالجدول 1-3 التالي :
التكرار التجميعي الصاعد   مركز الفئات xi  التكرار fi         حدود الفئات     الفئات
3       10     3       5-14  1
8       20     5       15-24         2
20     30     12     25-34         3
45     40     25     35-44         4
80     50     35     45-54         5
93     60     13     55-64         6
100   70     7       65-75         7
جدول 1-3
لاحظ عمود التكرار التجميعي الصاعد تجد أن :


وبالتالي فالفئة الخامسة تحتوي على الوسيط وحدها الأدنى 45  وبالتالي فان حدها الادنى الفعلي هو 44.5. فبتطبيق العلاقة السابقة (3-3) نجد أن وسيط البيانات هو

3-3 الربيعي وبعض المقاييس الأخرى: Quartiles   
لاحظ هنا أنه يمكن تعريف مقاييس وضعية أخرى مشابهة تماماً لطريقة تعريف الوسيط . من هذه المقاييس الربيعي الأدنى Lower Quartile والذي يرمز له بـ Q1 والربيعي الأعلى والذي يرمز له بـ Q3  Upper Quartile”"  والعشري Decile  و المئوي Percentile .
فالربيعي الأول أو الأدنى هو القيمة التي ترتيبها يكون   إذا كان الناتج صحيحاً وإذا لم يكن ناتج هذه النسبة عدداً  صحيحاً فيحسب متوسط العدد الذي يقع على طرفي هذه النسبة  وذلك بعد ترتيب البيانات تصاعدياً . أو أنه 25% من  هذه البيانات المرتبة تصاعدياً .
الربيعي الثاني هو الوسيط نفسه Q2  وقد تحدثنا عنه سابقاً وهو القيمة التي يكون ترتيبها   إذا كان العدد n فردياً وهو متوسط القيمتين الوسيطيتين اذا كان n عددا زوجيا  وهو بالتالي  50% من البيانات. أما الربيعي الثالث فهو القيمة التي ترتيبها   إذا كان ناتج هذه النسبة عدداً صحيحاً، أما إذا لم يكن ناتج النسبة عدداً صحيحاً فيحسب متوسط العدد الذي يقع على طرفي هذه النسبة وذلك بعد ترتيب البيانات تصاعدياً وأنه يحدد 75% من هذه البيانات . كما يمكن اعتبار الربيعي الأعلى أنه الربيعي الأدنى ولكن يحسب من الاتجاه المعاكس أي نبدأ من اليمين .
و يسمى الفرق بين الربيعي الأعلى والربيعي الأدنى "مدى ما بين الربيعيين" Interquartile range)) ويحسب بالشكل : I = Q3¬ - Q1 .
لاحظ أن الربيعي الأول تسبقه ربع القيم وتليه ثلاثة أرباع القيم الأخرى أما الربيعي الثالث فهي القيمة التي تسبقها ثلاثة أرباع القيم وتليها ربع القيم الأخرى .
لاحظ أيضا أنه يمكن وبنفس الطريقة تقسيم البيانات إلى عشرة أجزاء متساوية ويسمى الجزء الأول العشري الأول والذي ترتيبه   والعشري الثاني والذي ترتيبه   ... وأخيراً العشري التاسع  والذي ترتيبه   .
 كما و يمكن أيضاً  تقسيم البيانات ( إذا كانت كبيرة طبعاً ) إلى مائة قسم متساو وذلك بعد ترتيبها تصاعدياً بحيث يكون القسم الأول ، المئوي الأول والذي ترتيبه   والمئوي الثاني  والذي ترتيبه   وهكذا حتى المئوي الأخير والذي ترتيبه   أو أن المئوي الأول يحصر 1% من البيانات والثاني  يحصر 2% من البيانات . أما المئوي الأخير فيحصر 99% من البيانات .
نرى من المفيد هنا أن نذكر طريقة عامة لإيجاد بعض المقاييس الوضعية مثل ربيعي و عشري ومئوي مع العلم أنه إذا كان عدد البيانات كبيرا و كانت البيانات مرتبة ترتيبا تصاعديا (أو تنازليا) فيمكن عندها استخدام الطريقة العامة التالية:

لحساب المئوي رقم P  وهي القيمة التي عندها 100 P% على الأقل من المشاهدات (البيانات) أصغر من هذه القيمة و 100(1-P)%   على الأقل من هذه المشاهدات (البيانات) أكبر من هذه القيمة. فعلى سبيل المثال لإيجاد الوسيط حيث فيه P=50%   نجد أن 50%   من البيانات أصغر من الوسيط و50%   من البيانات أكبر من الوسيط. ولإيجاد الربيعي الأدنى P=25%   نجد أن 25%   من البيانات أقل من الربيعي و 100(1-0.25)%  أي 75%  من البيانات أكبر من هذه القيمة. وإليك دليلا مبسطا لحساب مئويات عينة حجمها n (n كبيرة)
(1) رتب البيانات تصاعديا ( من الأصغر للأكبر)
(2) أوجد قيمة الجداء (حاصل الضرب)n.P    حيث P المئوي المطلوب ثم أجر الخطوات التالية:
        إذا لم يكن nP عددا صحيحا قربه للأعلى للرقم الصحيح التالي وليس لأقرب عدد وأوجد القيمة المرتبة الموافقة.
        إذا  كان nP عددا صحيحا وليكن k  مثلا ,احسب متوسط المشاهدتين kth  و (k+1)-st  الموافقتين.
ومعلوم أن الربيعي الأدنى يوافق المئوي الخامس و العشرين و الربيعي الأعلى يوافق  المئوي الخامس و السبعين .. وهكذا
مثال:
احسب الربيعي الأدنى و المئوي الثمانون (80%)  للبيانات المرتبة التالية:

18.0 18.1  18.1  18.4  18.5  18.7  19.0  19.1  19.2  19.3
19.4  19.4  20.0  20.1  20.1  20.4  20.5  20.8  20.9  21.4
21.6  21.9  22.2  22.4  22.6  22.7  22.8  22.9  23.0  23.5
الحل:
 الربيعي الأدنى يوافق P=25%     و لدينا n=30   أي
8   (0.25)(30)=7.5
   و الربيعي الأدنى هو القراءة الثامنة و هو Q1= 19.1  .
أما المئوي الثمانون فهو (0.80)(30)=24    و بأخذ متوسط القراءتين 24   و25  نجد 
أمثلة :
a ) البيانات التالية توضح عدد المشتركين الجدد في خدمة الهاتف النقال في 23 يوم وهي كالتالي :
84 , 52 , 41 , 57 , 61 , 65 , 77 , 64 , 62 , 32 ,
 82 , 58 , 50 ,78 , 105 , 71 , 75 , 41 , 60 , 96 ,
53 , 49 , 89
أوجد وسيط هذه البيانات ثم أوجد الربيعي الأدنى Q1 والربيعي الأعلى Q3 .
الحل :
نرتيب أولاً هذه البيانات تصاعدياً . إن مخطط (stem-and -leaf-display) الساق والأوراق يوفر لنا عرضاً جيداً لهذه البيانات من ناحية ، ومن ناحية أخرى يرتب البيانات تصاعدياً كما هو مطلوب أي:
3       2                                   
4       1       1       9                
5       0      
3       7       8
6       0       1       2       4       5
7       1       5       7      

8       2       4       9                
9       6                                   
10     5                                   

وبما أن الوسيط هو القيمة التي يكون ترتيبها   فإن الوسيط هو 62 . فالربيعي الأدنى هو   أي أنه 52  وأخيراً يكون الربيعي الأعلى القيمة السادسة من الأخير وهي 78 أو القيمة التي ترتيبها 18 وهو نفسها 78. انظر الشكل 1-3 التالي :





b ) البيانات التالية تمثل الزمن ( بالدقيقة) الذي يقضيه شخص بانتظار الحافلة يومياً قبل الذهاب للعمل خلال مدة 14 يوم عمل :10 , 2 , 17 , 3 , 8 , 6 , 10 , 2 , 9 , 5 , 9 , 13 , 1 , 10.
أوجد الوسيط والربيعي الأدنى و الربيعي الأعلى .

الحل :
بعد ترتيب هذه البيانات تصاعدياً تصبح 1 , 2 , 2 , 3 , 5 , 6 , 8 , 9 , 9 , 10 , 10 , 10 , 13 , 17    
وحيث  n = 14 في هذه الحالة وبالتالي فإن  موقع الوسيط يحسب كالتالي   أي بين القراءة السابعة و القراءة الثامنة. بأخذ متوسط هاتين القراءتين  نجد أنه   . وكذلك فإن ترتيب الربيعي الأول   وبالتالي فالربيعي الأول هو )/2=2.5 (2+3 دقائق وبنفس الطريقة يكون الربيعي الأعلى العدد الذي يكون ترتيبه متوسط العددين العاشر والحادي عشر وهذه القيمة 11.25 أي أن قيمة الربيعي الثالث 10 دقائق .

c ) في دراسة إحصائية سئل 200 شخص عن أجرهم الأسبوعي وكانت النتيجة موضحة في المنحني التكراري التجميعي الصاعد ogive الموضح أدناه والمطلوب :












         I - كم شخص كان دخله الأسبوعي أقل أو يساوي 350 ديناراً .
         II - كم شخص كان دخله الأسبوعي أكثر أو يساوي 200 ديناراً .
         III - أوجد الوسيط لهذه البيانات.
         IV - أوجد الربيعي الأدنى والربيعي الأعلى ومدى ما بين الربيعيين Inter quartile range


الحل:
 I  - واضح من الشكل أنه عند رسم خط عمودي من نقطة 350 ديناراً ومن ثم وعند نقطة التلاقي مع المنحني نرسم خط أفقي فيقطع محور التكرار ، الرقم الناتج هو المطلوب وهو 170 و المطلوب هو 170 شخص .
II - هناك 40 شخصاً في الإحصائية الدخل الاسبوعي لكل منهم أقل من 200 ديناراً وبما أن 200 شخص في الإحصائية فيكون عدد الأشخاص المطلوب 200-40=160 شخصاً دخلهم الأسبوعي أكثر من 200 ديناراً .
III - إن الوسيط يحدد 50% من البيانات أي 100 شخص وبرسم خط أفقي من التكرار عند الرقم 100 وإسقاط عمود عند نقطة التلاقي نجد أن الوسيط هو 300  ديناراً .
IV - أما الربيعي الأدنى فهو 225 والربيعي الأعلى فهو 325 ، فيكون المدى المطلوب (I Q R):
 I = 325-225 = 100

4-3  المنوال Mode :
يعرف المنوال على أنه هو القيمة الأكثر تردداً أو الأكثر شيوعاً أو تكراراً ونرمز له بالرمز x فمثلاً للقيم 1,1,2,3,3,4,5,5,5,6,7 منوالا  واحدا وهو x = 5
قد لا يكون لمجموعة من القيم منوال كما هو الحال في القيم 1,2,3,4,5,6,7 وقد يكون لمجموعة من القيم أكثر من منوال واحد كما هو الحال في القيم 1,1,1,2,2,2,3,4,5,5,6 .
و إذا  كانت البيانات غير عددية (أي نوعية ) كأن نسأل مثلا ستة أشخاص عن أي الألوان المحببة لهم ، قد تكون إجاباتهم كالتالي:
أزرق, أصفر, أبيض,  أزرق, أبيض أو أزرق   فسيكون المنوال في هذه الحالة هو اللون "الأزرق" .
أما إذا كانت البيانات مبوبة في جدول توزيع تكراري فنحسب المنوال كما يلي : نعين الفئة المنوالية وهي الفئة التي تقابل أكبر قيمة للتكرارات ثم نحسب الفرق بين تكرار الفئة المنوالية وتكرار الفئة التي قبلها 1 ثم نحسب الفرق بين تكرار الفئة المنوالية وتكرار الفئة التي بعدها وليكن 2 نرمز للحد الأدنى الفعلي للفئة المنوالية بالرمز a ولطول الفئة بالرمز فنحصل على المنوال كما يلي :


وكتطبيق مباشر على ذلك ، المنوال للقيم المعطاة بالجدول 1-3 أعلاه هو

لاحظ أنه يمكن حساب المنوال بيانياً ( هندسياً ) وذلك بعد رسم المدرج التكراري للبيانات المبوبة وعلى سبيل المثال لنحسب المنوال للبيانات المعطاة بالجدول  1-3 .










شكل 2-3
وذلك وفقاً لما يلي :
1- نرسم المدرج التكراري موضحاً الفئة المنوالية والفئة التي قبلها والفئة التي تليها.
2- نوصل بين رأس الفئة المنوالية والزاويتين المجاورتين للفئة المنوالية أي AC  ,  BD .
3- نسقط من نقطة الالتقاء M عموداً على محور السينات تمثل قيمة المنوال وهنا يمكن تعيين النقطة x بشكل تقريبي وبصورة هندسية.
هناك علاقة تقريبية بين المنوال x والوسط   والوسيط   من أجل التوزيعات المتناظرة نسبيا بحيث تؤمن معرفتنا لنقطتين النقطة الثالثة وذلك من العلاقة التالية :


لنحسب مثلاً منوال البيانات الواردة في الجدول 1-3، حيث وجدنا أن   .
أما الوسط الحسابي فمن العلاقة ( 2-3 ) نجد أن                            
وبتطبيق العلاقة السابقة نجد                  
لاحظ الفرق بين المنوال هنا والمنوال في العلاقة  ( 5-3 ) .


5-3  مقاييس التشتت (التباين): Measure of Variation
درسنا في الفقرة السابقة مقاييس النـزعة المركزية ، ولكن غالباً ما تكون هذه المقاييس غير كافية لتمثل الواقع بشكل كامل أو لمقارنة مجموعتين من المشاهدات أو أكثر . إذا اعتبرنا المجموعتين  التاليتين من القيم :
المجموعة الأولى :   5 , 6 , 8 , 10 , 12 , 14 , 15                                                                     
المجموعة الثانية : 1 , 2 , 5 , 10 , 15 , 18 , 19                                                                        
لوجدنا أن الوسط الحسابي لكل مجموعة هو 10 كما أن الوسيط هو نفسه للمجموعتين ويساوي 10 أيضاً ومع ذلك فهناك فرق بين المجموعتين حيث تختلف مفردات المجموعة الأولى عن مفردات المجموعة الثانية ، كما أن قيم المجموعة الثانية موزعة على مدى أوسع من المجموعة الأولى ويمكن أن نقول إن تشتت المجموعة الثانية أكبر منه في المجموعة الأولى . و يمكن قياس درجة التشتت بعدة مقاييس منها : المدى ، الانحراف عن المتوسط، التباين، والانحراف المعياري .
6-3  المدى : Range
المدى هو الفرق بين أكبر قيمة وأصغر قيمة في مجموعة ما، فمدى المجموعة الأولى 15 - 5 = 10 .
بينما مدى المجموعة الثانية  19-1 = 18 لاحظ أن المجموعة الثانية أكثر تشتتاً من المجموعة الأولى .أما المدى لقيم معطاة في جدول توزيع تكراري فيحسب من الفرق بين الحد الأعلى للفئة العليا والحد الأدنى للفئة الدنيا . ففي الجدول ( 5-3 ) المدى هو 75 - 5 = 70 .
7-3   الانحراف المتوسط:  Mean  deviation
         يعتبر الانحراف عن المتوسط أو ( الانحراف المتوسط ) أحد مقاييس التشتت .
ويعرف الانحراف المتوسط بأنه متوسط الفروق للبيانات عن وسطها الحسابي بقيمها المطلقة فإذا كانت لدينا مجموعة البيانات

وسطها الحسابي   فإنه يمكن حساب الانحراف المتوسط بالعلاقة التالية :
                  ( 6-3 )                      

أما من أجل قيم معطاة في جدول توزيع تكراري فإن الإنحراف المتوسط يعطى بالعلاقة التالية:

حيث :
fi تكرار الفئة ، و   
لنوجد على سبيل المثال الانحراف المتوسط لمجموعة البيانات التالية :
5 , 6 , 8 , 10 , 12 , 14 , 15                                                      
إن المتوسط لهذه القيم   فيكون الانحراف المتوسط

وبنفس الطريقة نجد أن الانحراف المتوسط للمجموعة الأخرى
1,2,5,10,15,18,19  هو 44/7
لاحظ من هذين المثالين أنه كلما كان الانحراف المتوسط كبيراً كلما كان التباعد بين القيم كبيراً وكلما كان صغيراً كانت القيم متقاربة .
8-3  التباين ( التشتت ): Variance
يعرف التباين بأنه الوسط الحسابي لمربعات فروقات البيانات عن وسطها الحسابي . ففي مجتمع ما إذا كان هذا المجتمع يتألف من n عنصر وكان وسطه الحسابي معطى وهو يساوي    فإن التباين
( التشتت )  2 ( ويقرأ  2 سكما مربع ) للمجتمع يعطى بالشكل التالي :
(7-3 )                            
إذا كانت القيم معطاة بشكل مفرد ( غير مجدول ) . أما إذا كانت القيم مبوّبة وسطها الحسابي    أي معطاة في جدول توزيع تكراري ذو k  فئة ولدينا    معلومة فإن   يعطى بالشكل :
(8-3)                             
حيث رمزنا بـ xi ، fi لمركز وتكرار الفئة  iعلى الترتيب وكذلك  
أما تباين العينة فإنه يعطى وبصورة مشابهة تماماً للطريقة أعلاه بالشكل التالي :
إذا كانت لدينا عينة حجمها n مسحوبة من مجتمع ما بحيث أن متوسط العينة   معطى فإن تباين العينة الذي يرمز له بالرمز s2 يعطى بالشكل :
(9-3 )                                     
إذا كانت القيم xi معطاة بشكل غير مجدول ( مفرد ) . أما إذا كانت القيم  معطاة بشكل مجدول فإنها تعطى بشكل مشابه لـ ( 8-3 ) بعد التقسيم على n1 عوضاً عن n أي :
( 10-3 )                      
حيث xi ، fi هما مركز الفئة وتكرارها على الترتيب .
مثال :
أوجد تباين العينة الممثلة بالبيانات  5,8,4,7,4,2
الحل : إن الوسط الحسابي لهذه البيانات هو    ويكون التباين :

9-3   الإنحراف المعياري:  Standard Deviation
نعرف الانحراف المعياري لعينة حجمها n مسحوبة من مجتمع ما بأنه الجذر التربيعي لتباين هذه البيانات وبالتالي فإن الانحراف المعياري للبيانات x1 , x2 , ... xn والتي وسطها الحسابي   هو :
              (11-3 )                
أما في حال القيم المبوبة في جدول توزيع تكراري ذو k  فئة فإن الإنحراف المعياري s يعطى بالشكل:
              (12-3)                    
وبشكل عام فإن الانحراف المعياري هو الجذر التربيعي للتباين إن كان للعينة أو المجتمع . وعلى سبيل المثال فالإنحراف المعياري للبيانات المعطاة في المثال السابق,5,8,2,4,7,4   هو  ويجب أن نذكر هنا أن الانحراف المعياري للمجتمع يرمز له بالرمز وتقرأ
( سكما ـ segma ) أما الإنحراف المعياري للعينة فهوs .
ملاحظات هامة :
1))-إن السبب في القسمة  على ( n-1 ) عوضاً عن n لأن هناك n-1) ) إنحرافاً مستقلاً من الشكل  .  ولأن مجموع هذه الانحرافات يساوي الصفر دوماً فإن أيا منها يساوي  مجموع كل البقية بإشارة سالبة و أي منها يعطى بدلالة مجموع القيم الأخرى وبإشارة معاكسة . ولتوضيح هذه الفكرة تصور أن لدينا ثلاث بيانات x1 , x2 , x3  ولدينا    .
نعلم أن                                                                   
وبالتالي يمكن التعبير عن أي منهم وليكن الأول بـ        
                            أو                                  
                            أو                                 

أي يمكن تمثيل أي انحراف بدلالة الاثنين الآخرين وحيث لدينا n = 3 فسنقسم على 3-1=2 .

 (2)-عندما تكون البيانات كبيرة وغالباً ما تكون كذلك, يمكن استخدام علاقة بديلة عن علاقتي التباين (10-3) , (9-3) وتسمى العلاقتان البديلتان بالعلاقتين الحسابيتين حيث يمكن حساب التباين   ( التشتت) منهما بسهولة .
  13-3))                                         
(14-3)                               
وبالطبع العلاقة الأولى للقيم المفردة أما العلاقة الثانية فهي للبيانات المبوبة في جداول توزيع تكرارية ذو k فئة .
يقيس  الانحراف المعياري والتباين كمية التباعد الحاصلة في مجموعة بيانات وهذا التباعد يعتمد في الدرجة الأولى على وحدة القياس .
فلمقارنة التباين في عدة مجموعات من البيانات غالباً مايستخدم التباين النسبي relative variation
لهذا الغرض أو معامل التباين coefficient of variation الذي يعطي الإنحراف المعياري كنسبة مئوية
للمتوسط أي :
 (15 -3)                          %                                           
حيث  ،   , s هما المتوسط و الإنحراف المعياري على الترتيب لمجموعة من البيانات المراد دراستها .
مثال :
حُسب متوسط قياسات أطول مجموعة من المسامير أنتجت في مصنع معين باستخدام قياس معين فكان هذا المتوسط 3. 92mm و بإنحراف معياري 0.015mm .
وحسبت أطول مجموعة أخرى من البراغي أنتجت في مصنع آخر وذلك باستخدام مقياس مختلف فكان المتوسط والإنحراف المعياري لهذه المجموعة 0.008cm,1.54cm والمطلوب:
 أي من المقياسين أكثر دقة نسبياً ؟ .
الحل :
بالنسبة للمقياس الأول v = ( 0.015 / 3.92) .100% =  0.38 %        
بالنسبة للمقياس الأخر v =  ( 0.008 / 1.54 )  .100% =  0.52 %        
إذن القياسات التي أجريت بالنسبة للمقياس الأول أكثر دقة نسبياً .

 أمثلة عامة:
a ) لتكن لدينا المجموعة التالية من القراءات والتي تمثل أطوال عينة من 48 سمكة مقدرة بالملم  أجريت في أحد المختبرات :
215   223   221   210   216   214   234   231
216   203   205   204   206   207   209   210
222   226   221   216   212   217   219   218
235   215   225   230   209   203   206   210
313   211   201   195   208   190   240   230
210   250   220   270   190   205   210   213
                                                                 
1- رتب هذه البيانات في جدول توزيع تكراري.
2- احسب متوسط طول السمكة الواحدة ثم احسب التشتت والانحراف المعياري .
الحل :
لاحظ أن أكبر قيمة وأصغر قيمة هما 190  , 313 على الترتيب ويكون المدى :
R = 313-190 = 123
لنقسم هذه القراءات إلى 6 فئات متساوية فيكون طول الفئة الواحدة
123/6 = 20.5 ~ 21 .
ويصبح جدول التوزيع التكراري من الشكل :

التكرار fi         مراكز الفئات xi حدود الفئات     رقم الفئة
20     200   190-210     1
21     221   211-231     2
4       242   232-252     3
1       263   253-273     4
1       284   274-294     5
1       305   295-315     6
48                       
أما المتوسط فمن (2-3) نجد :

لاحظ أنه لو حسبنا المتوسط من العلاقة (1-3) لوجدناه يختلف قليلاً عن هذا الرقم بحيث يمكن إهمال هذا الفرق .
أما التباين فمن ( 14-3 ) نجد

ويكون الانحراف المعياري والذي هو الجذر التربيعي للتباين :


b ) أوجد الوسط الحسابي والانحراف المعياري للبيانات التالية :
19.1  22.5  19.9  21.9  22.8  22.0  23.0  23.2  20.5  4.6
21.4  21.1  20.9  20.8  19.8  22.2  22.6  21.7  19.4  21.3
الحل :
يمكن إيجاد النتائج باستخدام الآلة الحاسبة وبالتالي :

أما التباين فهو ومن العلاقة ( 13-3 )

ويكون الانحراف المعياري     s = 1.19
c ) أوجد معامل التباين للبيانات الواردة في المثال (b) السابق
الحل :

d ) أوجد المتوسط ( الوسط الحسابي ) والانحراف المعياري ومعامل التشتت للبيانات الواردة في جدول التوزيع التكراري التالي :

التكرار Frequency    الفئات Classes
3       5.0-12.9
10     9.0-12.9
14     13.0-16.9
25     17.0-20.9
17     21.0-24.9
9       25.0-28.9
2       29.0-32.9

الحل :
يمكن الاستعانة بجدول آخر يسهل عملية الحسابات مع العلم أنه يمكن إيجاد الناتج دون اللجوء إلى هذا الجدول .
xi      fi      
 
6.95  3       20.85 145.0
10.95 10     109.50        1119.5
14.95 14     209.30        3129.0
18.95 25     473.75        8977.6
22.95 17     390.15        8953.9
26.95 9       242.55        6536.7
30.95 2       61.90 1915.8
المجموع  80     1508 30857
وبالتالي نحصل على المتوسط وهو


أما التباين فهو ومن العلاقة الحسابية (14-3)


    والذي يعطي بدوره الانحراف المعياري  s = 5.55
وبالتالي:




تمارين :
1- البيانات التالية تمثل أعمار 15 شخص من الذين التحقوا بدورة تمريض:
33, 24, 19, 39, 48, 45, 26, 35, 38, 23, 34, 29, 37, 25, 33
I - أوجد متوسط أعمار هؤلاء الأشخاص ، ما هو مدى هذه الأعمار
II - أوجد الوسيط لهذه البيانات والربيعي الأدنى والربيعي الأعلى .
III - احسب التباين والانحراف المعياري لهذه المجموعة .

2 - البيانات التالية تمثل عدد الساعات التي قضاها عشرة أشخاص في مراجعة مادة الإحصاء استعدادا 
للإمتحان 7 , 14 , 22 , 20 , 19 , 25 , 11 , 20 , 13 , 24    
a- أوجد متوسط عدد الساعات ثم أوجد الوسيط لهذه البيانات
b- أوجد الإنحراف المعياري ثم إستنتج معامل التشتت
-3 يتألف صف من 35  طالب وطالبة كانت درجاتهم في اختبار الإحصاء مرتبة تصاعدياً كالتالي :
                  
                                       28       35       41        47        51         54        56
                                       58       58       60        61        62         62        64
                                       64       66       67        68        69         70        70
                                       70       72       73        74        75         76        77
                                       78       80       81        83        88         90        94
a- أوجد الوسيط لهذه الدرجات ومداها.
b- أوجد الربيعي الأدنى والربيعي الأعلى والمدى بين الربيعيين بيانياً ثم بتطبيق العلاقة (3-3).
- 4 أخذت أطوال 100 جندي لا قرب سم ووزعت هذه الأطوال في جدول بالشكل التالي :
التكرار التجميعي الصاعد   التكرار   الطول لأقرب سم
3       3       1.61m أو أقل
10     7       1.63m أو أقل
23     13     1.65m أو أقل
43     20     1.67m أو أقل
68     25     1.69m أو أقل
84     16     1.71m أو أقل
93     9       1.73m أو أقل
97     4       1.75m أو أقل
98     1       1.77m أو أقل
100   2       1.79m أو أقل
والمطلوب :
a- اشر إلى الفئة المنوالية وعين حداها الفعليين ثم أوجد المنوال لهذه البيانات .
b- اشر إلى الفئة الوسيطة (الفئة التي تحوي الوسيط) ثم احسب وسيط هذه البيانات والربيعي الأعلى والأدنى.
cـ- كم جندى من هذه المجموعة أطول من 161cm  .
d- احسب الإنحراف المتوسط و الإنحراف المعياري لهذه البيانات .

-5 الجدول التالي يحتوي على عدد الأهداف التي سجلت في الدوري الكروي في الموسم الماضي:

7       6       5       4       3       2       1       0       عدد الأهداف
2       9       18     13     2       5       1       2       التكرار
المطلوب :
a - أوجد التكرار التجميعي الصاعد و مثله بيانياً ثم استنتج الوسيط والربيعي الأعلى والأدنى .
b - أوجد متوسط عدد الأهداف ثم أوجد الإنحراف المعياري .

-6البيانات التالية تمثل الزمن بالدقيقة الذي يقضيه 13  طالباً بانتظار حافلة الجامعة   
 
10 15 , 10 , 2 , 17 , 6 , 8 , 3 , 10 , 2 , 9 , 13 , 1
                       
 a- أوجد الوسط الحسابي والوسيط و الربيعي الأدنى و الربيعي الأعلى.
b - أوجد التباين لهذه البيانات ثم أستنتج الإنحراف المعياري .
c - احسب مجموع إنحرافات لهذه البيانات عن  المتوسط وأستنتج أن
 

-7 أحسب المتوسط والإنحراف المعياري للبيانات التالية إذا أمكن مع ذكر السبب
A-                                                                     
التكرار   الفئات
6       30 - 39
8       40 - 49
14     50 - 59
7       60 - 69
2       70 - 79

-B
التكرار   الفئات
4       أقل من 60
10     60 - 69
12     70 - 74
7       أكثر من 79

- C
التكرار   الفئات
50     أقل أو يساوي 50
40     51-60
21     61-70
10     71-80

 8 -لدينا البيانات التالية:
18 12, 29, 31, 27,30, 39, 18, 27, 48, , 24
I - ارسم مخطط نقطي لهذه البيانات وحدد عليه الوسيط والوسط الحسابي
II - أوجد الانحراف المعياري .

9 - بلغ متوسط الدخل الشهري لـ 140 من موظفي أحد البنوك الوطنية 1200 ديناراً بينما بلغ متوسط الدخل الشهري لـ 260 موظفاً آخر  450 ديناراً . ما هو متوسط الدخل الشهري لهؤلاء الـ 400 موظف .
10 – الجدول التالي يبين الأخطاء المطبعية على الصفحة الأولى لـ 150 إصدار من جريدة الحقيقة.
التكرار   عدد الأخطاء
5       14-16
10     17-19
49     20-22
39     23-25
24     26-28
17     29-31
6       32-34
والمطلوب :
I  - مثل هذه البيانات بيانياً بالطريقة التي تختارها مناسبة لاستنتاج المنوال بيانياً .
II - أوجد التكرار التجميعي الصاعد ثم مثله بيانياً لاستنتاج الربيعي الأدنى والأعلى والوسيط .
III - أوجد المتوسط والانحراف المعياري لهذه الأخطاء .

ليست هناك تعليقات:

إرسال تعليق