السبت، 14 يناير، 2017

الإحصاء الوصفي

الإحصاء الوصفي

1 التوزيعات التكرارية
        عادة يكون من المفيد تنظيم مجموعة البيانات على شكل توزيع تكراري . ويكون ذلك بتقسيم البيانات آلي مجموعات آو فئات وتحديد عدد المشاهدات في كل فئة . ويكون عدد الفئات عادة بين 5 ، 15 . ويمكن إيجاد التوزيع التكراري النسبي بقسمة عدد المشاهدات في كل فئة على العدد الإجمالي للمشاهدات . وذلك فإن مجموع التكرارات النسبية يساوى 1 . ويمثل التوزيع التكراري بيانياً باستخدام " المدرج التكراري" حيث تمثل الفئات على المحور الأفقي وتمثل التكرارات على المحور الرأسي . آما المضلع التكراري فهو تمثيل بياني خطى للتوزيع التكراري ناتج عن توصيل النقاط آلتي إحداثياتها منتصف الفئة والتكرار ببعضها البعض . ويوضح التوزيع التكراري المتجمع بالنسبة لكل فئة إجمالي عدد المشاهدات لجميع الفئات آلتي تسبق وتشمل هذه الفئة . وبرسم التوزيع التكراري المتجمع نحصل على المنحنى التكراري المتجمع .
مثال 1- حصل طالب على الدرجات آلاتية (النهاية العظمى 10  ) في عشرة اختبارات آداها أثناء الفصل الدراسي: .  6 , 10 , 9 , 6 , 7 , 5 , 8 , 6 , 7 , 6   هذه الدرجات يمكن ترتيبها في شكل توزيع تكراري كما في جدول 2-1 ، كما يمكن عرضها بيانياً كما في شكل 2-1 .

مثال 2- تحتوى عينة مكونة من 20  علبة من معلبات الفواكه المحفوظة على وزن صاف يتراوح من 19.3  آلي 20.9 أوقية كما في جدول 2-2 فإذا أردنا تجميع هذه البيانات في 6  فئات فإن طول الفئة يكون 0.3  أوقية(19.2-21.0)/6=0.3 أوقية) . ويمكن ترتيب جدول 2-2 في شكل جدول تكراري كما في جدول 2-3 وبيانياً كما في شكل 2-2 .

Table 2.2 Net Weight in Ounces of Fruits
2-2 مقاييس النزعة المركزية
        تشير النزعة المركزية إلى موقع التوزيع . وأهم مقاييس النزعة المركزية هي: (1) الوسيط الحسابي (2) الوسيط ، (3) المنوال . وسوف نقوم بقياس هذه المقاييس بالنسبة للمجتمعات ( بمعنى مجموعات تشمل جميع العناصر موضع الدراسة) وبالنسبة لعينات مسحوبة من المجتمعات وكذلك بالنسبة للبيانات المبوبة والبيانات غير المبوبة.

1-     الوسط الحسابي آو المتوسط ، لمجتمع ما يرمز µ (الحروف اليوناني ميو) ، أما الوسط الحسابي للمعينة فيرمز له بالرمز (وتقرأ bar X) . وتحسبµ ،X في حالة البيانات غير المبوبة باستخدام المعادلات آلاتية:



حيث X ∑ هي مجموع قيم المشاهدات بينما N ، n تشير آلي عدد المشاهدات في المجتمع والعينة على الترتيب . أما في خالة البيانات المبوبة فإن µ ،X  نحسب كآلاتي :


حيث X ∑ƒ تشير آلي مجموع حاصل ضرب تكرار كل فئةƒ  في مركز الفئة  X .
2-     الوسيط لبيانات غير مبوبة يشير آلي قيمه المفردة آلتي تقع في منتصف المفردات ، بعد ترتيب هذه المفردات تصاعدياً أو تنازلياً . آي أن

حيث N  عدد المفردات في المجتمع (ويستخدم n  بدلا منها في حالة العينة) . وتحسب قيمة الوسيط من بيانات مبوبة كآلاتي :

حيث    L = الحد الأدنى للفئة الوسيطية ( آي الفئة آلتي تضم المفردة الوسطى للتوزيع) .
        n = عدد المفردات في مجموعة البيانات.
        F = مجموع التكرارات في الفئات السابقة على الفئة الوسيطية.
        Ƒm= تكرار الفئة الوسيطية.
        C = طول الفئة.
3-     المنوال هو القيمة الأكثر تكراراً في مجموعة البيانات . أما بالنسبة للبيانات المبوبة فإن المنوال يحسب كآلاتي:

حيث    L = الحد الأدنى للفئة المنوالية ( آي الفئة ذات أكبر تكرار) .
        d1 = الفرق بين تكرار الفئة المنوالية وتكرار الفئة السابقة عليها.
        d2 = الفرق بين تكرار الفئة المنوالية والفئة اللاحقة عليها.
        C = طول الفئة.
يعتبر الوسط الحسابي اكثر مقاييس النزعة المركزية شيوعاً في الاستخدام ، غير آن الوسط الحسابي يتأثر بالقيمة المتطرفة ، بينما لا يتأثر الوسيط آو المنوال بها .  وهناك أيضاً كمقاييس للنزعة المركزية ، الوسط الحسابي المرجح ، الوسط الهندسي ، والوسط التوافقي ، (انظر مسائل 2-7 إلى 2-9) .
        مثال 3- الوسط الحسابي لدرجات 10  امتحانات المعطاة في مثال 1 يحسب باستخدام معادلة الوسط الحسابي لبيانات غير مبوبة كآلاتي :

ولا يجاد الوسيـط لهذه البيانات غير المبوبة فأننا نرتب أولا القيم العشر للدرجات تصاعدياً : . 5 , 6 , 6 , 6 , 6, 7 , 7 , 8 , 9 , 10 ثم نحدد الدرجة آلتي ترتبها(N+1)/2  أو (10+1)/2=5.5 . آي أن الوسيط هو متوسط قيمتي المفردة الخامسة و المفردة السادسة أو  (6+7)/2=6.5 . آما المنوال لهذه المجموعة غير المبوبة من البيانات فهو 6 ( القيمة آلتي تكررت أكثر من غيرها في مجموعة البيانات) .
مثال 4- يمكن تقدير الوسط الحسابي للبيانات المبوبة المعطاة في جدول 2-3 بمساعدة جدول 2-4 .
أوقية 
ويمكن تبسيط الحسابات باستخدام الترميز (أنظر مسألة 2-6) .
ويمكن تقدير الوسيط لنفس البيانات المبوبة كآلاتي :

حيث 19.8 =L = الحد الأدنى للفئة الوسيطية ( آي الفئة 19.8-20.0  وآلتي تحتوى على               المشاهدات العاشرة والحادية عشرة) .
             20 ==n   عدد المشاهدات أو العناصر.
            3= F = مجموع التكرارات في الفئات السابقة على الفئة الوسيطية.
          8= Ƒm= تكرار الفئة الوسيطية.
           0.3 = C = طول الفئة.
و بالمثل ،

وكما ذكر في المسألة 2-4 فإن الوسط الحسابي والوسيط و المنوال للبيانات المبوبة تعتبر تقديرات تستخدم فقط عندما تكون البيانات المبوبة متاحة أو عندما يراد اختصار الحسابات لمجموعة كبيرة من البيانات غير المبوبة.

2-3 مقاييس التشتت
        يشير التشتت آلي اختلاف آو انتشار البيانات . وأهم مقاييس التشتت هي (1) الانحراف المتوسط ، (2) التباين ، (3) الانحراف المعياري ،و سنقوم بقياس هذه المقاييس بالنسبة للمجتمعات والعينات وكذلك بالنسبة للبيانات المبوبة والبيانات غير المبوبة .
1.     الانحراف المتوسط  (AD)  للبيانات غير المبوبة يحسب كآلاتي :

(2-6  أ)             للمجتمعات
(2-6  أ)             للعينات

حيث يشير الخطان الرأسيان إلى استخدام القيمة المطلقة للانحراف ، آي القيمة الموجبة للانحراف ، مع بقاء باقي الرموز بنفس المعنى المستخدم في قسم 2-2 . وبالنسبة للبيانات المبوبة.

(2-6  أ)             للمجتمعات
(2-6  أ)             للعينات
حيث ترمز إلى تكرار الفئة و     ترمز إلى مركز الفئة.
2.     التباين. تباين المجتمع  ( الحرف اليوناني سيجما تربيع) وتباين العينة S2
للبيانات غير المبوبة تحسب كآلاتي:

وللبيانات المبوبة ,

3.     الانحراف المعياري. الانحراف المعياري للمجتمع   للعينة S هما الجذر التربيعي الموجب للتباين المناظر لكل منهما.
فبالنسبة للبيانات غير المبوبة،

و بالنسبة للبيانات المبوبة،

 ويعتبر الانحراف المعياري أكثر مقاييس التشتت المطلق شيوعاً في الاستخدام . وهناك مقاييس أخرى
(بجانب التباين والانحراف المتوسط) وهى المدى ، المدى الربيعي ، والانحراف الربيعي (أنظر مسائل 2-11 و 2-12).
4.     معامل الاختلاف   يقيس التشتت النسبي:

(2-12أ)             للمجتمعات
(2-12ب)              للعينات
مثال 5- يمكن إيجاد الانحراف المتوسط والتباين والانحراف المعياري ومعامل الاختلاف للبيانات غير المبوبة في مثال1 بالاستعانة بجدول 2-5 (   ، انظر مثال 3):

مثال 6- يمكن حساب الانحراف المتوسط والتباين ، والانحراف المعياري ، ومعامل الاختلاف للتوزيع التكراري للأوزان (بيانات مبوبة) الواردة بجدول 2-3 بالاستعانة بجدول 2-6 (أوقية x=20.08 ، انظر مثال 4):


لاحظ أنه في معادلة تقدير كل من S2 و S ، ونستخدم n-1  وليس n في المقام (أنظر مسألة 2-16 للتعليل)  . ويمكن من المعادلات المستخدمة لتقدير  ،   S2 و S ، اشتقاق معادلات أخرى لتبسيط الحسابات إذا كان حجم البيانات كبيراً (أنظر مسائل 2-17 إلى 2-19 لمعرفة كيفية اشتقاق وتطبيق هذه المعادلات).
2-4 أشكال التوزيعات التكرارية
يشير شكل التوزيع إلى (1) تمثال التوزيع من عدمه (التواء التوزيع) (2) تدريب التوزيع (تفرطح).
1.     الالتواء .يكون التواء التوزيع صفراً إذا كان التوزيع متماثلاً حول الوسط الحسابي . وفى حالة التوزيع المتماثل (ذى المنوال الواحد) فإن الوسط الحسابي يساوى الوسيط يساوى المنوال . والتوزيع موجب الالتواء هو التوزيع الذي يكون طرفه الأيمن أطول . وعندئذ يكون الوسط الحسابي< الوسيط< المنوال . ويكون التوزيع سالب الالتواء هو التوزيع الذي يكون طرفة الأيسر أطول . وعندئذ يكون المنوال < الوسيط < الوسط الحسابي (أنظر شكل 2-3).



و يمكن  قياس الالتواء باستخدام معامل بيرسون للالتواء:

(2-13أ)             للمجتمعات
(2-13ب)              للعينات
والالتواء أيضاً يمكن قياسه بالعزم الثالث (بسط المعادلة 2-14 أ،ب) مقسوماً على مكعب الانحراف التكراري:

(2-14أ)             للمجتمعات
(2-14ب)              للعينات
2.     التفرطح . التوزيع ذو القمة العالية يسمى مدبباً ، وعلى العكس يسمى التوزيع ذو القمة المنبسطة مفرطحاً  وذلك بالقياس إلى المعتدل أو متوسط التفرطح  . ويكمن لقياس التفرطح استخدام العزم الرابع (البسط فى المعادلة (2-15 أ،ب)) مقسوماً على الانحراف التكراري مرفوعاً للقوة الرابعة . علماً بأن معامل التفرطح للتوزيع المعتدل = 3




(2-15أ)             للمجتمعات
(2-15ب)              للعينات
مثال 7 –يمكن تقدير معامل بيرسون للأتواء للدرجات المعياري مثال 1 باستخدام  ، med=605   (أنظر مثال 3)، و  (أنظر مثال 5):
(أنظر شكل 2-1)

وبالمثال ، باستخدام oz   ، oz =20.06 الوسيط (أنظر مثال 4 ) ، و s=0.39oz (أنظر مثال 6) ، يمكن تقدير معامل بيرسون للالتواء التوزيع إلى للأوزان المعياري جدول 2-3 كما يأتي:

(أنظر شكل 2-2 ج)
بالنسبة للتفرطح ، انظر مسألة 2-23 .

مسائل محلوله
التوزيع إلى:
2-1 جدول 2-7 يبين درجات اختبار ما لفصل من 40 طالباً . (أ) رتب هذه الدرجات (مجموعة البيانات الخام) المعياري جدول يبدأ بأصغر الدرجات وينتهي بأكبرها . (ب) كون جدولا موضحاً أطوال الفئات ومراكز الفئات والتكرار المطلق والنسبي والمجتمع لكل درجة (ج) اعرض البيانات المعياري شكل مدرج تكراري ، مدرج تكراري نسبى ، مضلع تكراري ، ومنحنى متجمع صاعد.
(ب) أنظر جدول 2-9 لاحظ أنه طالما أننا نتعامل مع بيانات منفصلة (أي معبراً عنها باستخدام أعداد صحيحة) ، فقد استخدمنا الدرجات الفعلية كمراكز للفئات.
2-2 إذا كان أجر الساعة لعينة مكونة من 25 عاملاً بأحد المصانع هو كما المعياري جدول 2-10.
(أ‌)     رتب هذه البيانات الخام المعياري جدول تبدأ بالأجر الأصغر وتنتهي بالأجر الأعلى.
(ب‌)   جمع هذه البيانات المعياري فئات.
(ج) أعرض البيانات المعياري شكل مجمع تكراري ، مدرج تكراري نسبى ، مضلع تكراري ، ومنحنى متجمع صاعد .

(ب) مـن جـدول 2-10 يـلاحـظ أن أقـل أجـر للساعة$3.55  وأعلـى أجـر $4.26  . ويمـكـن تقسيـم هـذا المدى إلـى  8فئات متسـاوية طول كل منها ($4.30-$3.50)/8=$0.80/8=$0.10 لاحظ أنه قد تم توسيع المدى إلى " من$3.50  إلى $4.30  " وذلك حتى يقع أقل أجر $3.55  داخل الفئة الأولى ، ويقع أعلى أجر $4.30 داخل الفئة الاخيره .  ومن الملائم أيضاً إيجاد مركز كل فئة ( وسوف نحتاج هذا لرسم المضلع إلى) . وتوضح هذه المعياري الجدول 2-12 .

(ج) أنظر شكل 2-6 .

 ويمكن الحصول على المنحنى المتجمع الصاعد برسم التكرار المتجمع عند القيم $3.595 ، $3.695 ، $3.795  إلى أخره . لاحظ أن مركز الفئة يتم الحصول علية بإضافة الحد الأدنى والحد الأعلى للفئة والقسمة على 2  . فمثلاً ، مركز الفئة الثانية يساوى (3.595+3.695)/2=7.290/2=3.65 (أنظر جدول 2-12)
مقاييس النزعة المركزية:
2-3 أوجد الوسط الحسابي و الوسيط و المنوال (أ) لدرجات اختبار الفصل المكون من 40 طالباً المعطاة المعياري جدول 2-7 (بيانات غير مبوبة) ، (ب) للبيانات المبوبة لهذه الدرجات المعطاة المعياري جدول 2-9 .
(أ‌)     حيث أننا نتعامل هنا مع كل الدرجات ، فنحن نريد حساب الوسيط الحسابي للمجتمع:
أي أن   يمكن الحصول عليها بجمع كل الدرجات الأربعين المعطاة المعياري جدول 2-7 والقسمة على 40  (وضعت النقاط الثلاث المعياري وسط الأرقام المعياري معادلة حساب الوسط الحسابي بعالية لتجنب سرد كل الأربعين مفردة الواردة المعياري جدول 2-7) .

الوسيط هو قيمة العنصر الذي ترتيبه ((N+1)/2)  المعياري البيانات الواردة المعياري جدول 2-8 . ومن ثم ، فإن الوسيط هو قيمة العنصر الذي ترتيبه (40+1)/2=20.5 ، أي متوسط قيمة المفردتين اللتين تقعان عند ترتيب20، 21  وحيث أن كلا منهما تساوى 6  ، أما المنوال فقيمته 7  ( القيمة الأكثر تكراراً المعياري مجموعة البيانات).

(ب‌)   يمكن إيجاد الوسط الحسابي للمجتمع مع البيانات المبوبة المعياري جدول 2-9 مع الاستعانة بجدول 2-13:
وهو نفس الوسط الحسابي السابق الحصول عله من البيانات غير المبوبة . لاحظ أن مجموعة التكرارات  يساوى عدد المشاهدات المعياري المجتمع N وأن . أما الوسيط من البيانات المبوبة المعياري جدول 2-13 فيكون

حيث =L=55 الحد الأدنى للفئة الوسيطية ( أي الفئة من 5.5 إلى 6.4 ، والتي تحتوى على المشاهدات التي ترتيبها 21,20)).
=N=40 عدد المشاهدات.
=F=16 مجموع المشاهدات المعياري الفئات السابقة على الفئة الوسيطية.
= =6تكرار الفئة الوسيطية.
=c=1طول الفئة.
ويحسب المنوال للبيانات المبوبة المعياري جدول 2-13 كما يلي:


حيث =L=6.5 الحد الأدنى للفئة المنوالية (أى الفئة من 6.5 إلى 7.4 والتى يقابلها أعلى تكرار 8) .
= =2 تكرار الفئة المنوالية 8 ، مطروحاً منة تكرار الفئة قبل المنوالية 6 .
= =4 تكرار الفئة المنوالية 8 ، مطروحاً منة تكرار الفئة قبل المنوالية 4 .
=c=1 طول الفئة.
لاحظ أنه بينما يتطابق الوسط الحسابي المحسوب من بيانات مبوبة مع الوسط الحسابي المحسوب من بيانات غير  مبوبة فإن كلاً من الوسيط والمنوال يعطى فقط تقديراً تقريبياً.
2-4 أوجد الوسط الحسابي و الوسيط والمنوال (أ) لعينة الأجور لعدد 25 عاملاً الواردة المعياري جدول 2-10 ( البيانات غير مبوبة) (ب) البيانات المبوبة لهذه الأجور المعطاة المعياري جدول 2-12.
(أ)


الوسيط =$3.95 (قيمة المفردة التى ترتيبها (n+1)/2=(25+1)/2=13 المعياري مجموعة البيانات المعياري جدول (2-11).
المنوال = $4.05,$3.95 ، حيث هناك 3  مفردات تقابل كل قيمة منهما . أى أن التوزيع ذو منوالين.
(ت‌)   يمكن إيجاد الوسط الحسابي للعينة للبيانات المبوبة الواردة المعياري جدول 2-12 مع الاستعانة بجدول 2-14:

لاحظ أنة المعياري هذه الحالة                                           (كما المعياري أ) حيث أن متوسط المشاهدات المعياري كل فئة لا يساوى مركز الفئة لكل الفئات (كما المعياري مسألة 2-3(ب)). وعلية فإن X المحسوبة للبيانات المبوبة تعتبر فقط تقريبياً لقيمة X الحقيقية المحسوبة من البيانات غير المبوبة . وكثيرا ما تتوافر لدينا البيانات فقط المعياري صورة مبوبة ، أو قد تتوفر البيانات غير مبوبة المعياري مجموعة كبيرة جداً بحيث أن تقرير الوسط الحسابي بعد تجميع البيانات المعياري فئات يوفر كثيراً المعياري العمل الحسابي.


بالمقارنة مع قيمة الوسيط الحقيقية $3.95 للبيانات غير المبوبة (أنظر أ)


بالمقارنة مع القيم الحقيقية للمنوال $3.95 , $4.05 للبيانات غير المبوبة (أنظر أ) . وأحياناً يستخدم مركز الفئة المنوالية كتقريب للمنوال.

2-5  أذكر مزايا وعيوب (أ) الوسط الحسابي(ب) الوسيط ، (ج) المنوال كمقاييس للنزعة المركزية .
(أ‌)     مزايا الوسط الحسابي هي (1) أنة مقياس مألوف وسهل الفهم (2) أنه يأخذ جميع مفردات المجموعة المعياري الاعتبار (3)أنه يستخدم المعياري حساب كثير من المقاييس والاختبارات الإحصائية الأخرى . عيوب الوسط الحسابي هي (1) أنه يتأثر بالقيم المتطرفة (2)أنه يستغرق وقتاً طويلاً للحساب من مجموعة كبيرة من البيانات غير المبوبة (3) لا يمكن حسابه إذا كان الجدول المعياري حالة البيانات المبوبة مفتوحاً من أحد طرفيه.
(ب‌)   مزايا الوسيط هي (1) لا يتأثر بالقيم المتطرفة (2) يمكن فهمة بسهولة (نصف البيانات أصغر من الوسيط والنصف الثاني أكبر منه) (3) يمكن حسابه المعياري جداول مفتوحة وأيضاً إذا كانت البيانات كيفية وليس فقط للبيانات الكمية . عيوب الوسيط هي (أ) لا يستخدم الكثير من البيانات المتاحة (ب) نحتاج معه إلى ترتيب المفردات تصاعدياً مما يستغرق وقتاً طويلاً إذا كانت مجموعة البيانات كبيرة.
(ث‌)   مزايا المنوال هي نفس مزايا الوسيط . عيوب المنوال هي (1) كما المعياري حالة الوسيط ، لا يستخدم المنوال الكثير مكن البيانات المتاحة ز (2) المعياري بعض الأحيان لا يوجد منوال حيث لا يتكرر أى من القيم أكثر من مرة ، وفى أحيان أخرى يكون هناك أكثر من منوال . وبصفة عامة فإن  الوسط الحسابي يعتبر أكثر مقاييس النزعة المركزية استخداماً كما يعتبر المنوال أقلها استخداماً.
(ج‌)    2-6 أوجد الوسط الحسابي للبيانات المبوبة المعياري جدول 2-12 باستخدام الترميز (الطريقة المختصرة ، وذلك بتعيين القيمة   للفئة  الرابعة أو الخامسة والقيم   ،   وهكذا للفئات السابقة عليها والقيم   ،   وهكذا للفئات اللاحقة ثم استخدام الصيغة.

حيث   هي مركز الفئة التى عين لها القيم   ، c هي طول الفئات ) . انظر جدول 2-15 .
ويلاحظ أن الوسط الحسابي X المحسوب باستخدام الترميز يتطابق مع ذلك المحسوب بدون استخدامه المعياري مسألة 2-4ب بينما يتخلص الترميز من مشاكل التعامل مع القيم الكبيرة لمراكز الفئات ، ومن ثم فإنه يساهم المعياري تبسيط العمليات الحسابية.
2-7 شركة تدفع أجراً قدرة$4 المعياري الساعة لعمالها غير المهرة وعددهم 25 و $6 المعياري الساعة للعمال شبة المهرة وعددهم15 و $8 للعمال المهرة وعددهم 10 .  ما هو المتوسط المرجح أو الوسط الحسابي المرجح للأجور التى تدفعها الشركة ؟
لإيجاد الوسط الحسابي المرجح ، أو المتوسط المرجح ، للمجتمع  أو للعينة   ، فإن الأوزان w لها نفس وضع التكرار عند إيجاد الوسط الحسابي ممن بيانات مبوبة . أى أن 


وبالنسبة لهذه المسألة فإن الأوزان هي عدد العمال المقابلة لكل أجر ، ومجموع الأوزان   يساوى مجموع العمال:



بينما أن المتوسط البسيط $6[($4+$6+$8)/3=$6] . يمكن القول أن المتوسط المرجح هو مقياس أفضل لمتوسط الأجور.

2-8 إذا كان معدل التضخم لشعب ما هو 2% المعياري السنة الأولى ، 5% المعياري السنة الثانية ، 12.5% المعياري السنة الثالثة ، أوجد الوسط الهندسي لمعدلات التضخم (الوسط الهندسي  أو   لمجموعة موجبة من الأرقام n هو الجذر التوفي لحاصل ضرب هذه الأرقام ويستخدم أساساً لإيجاد متوسط لمعدلات التغير وللأرقام القياسية ) . أى

بينما أن الوسط الحسابي البسيط   وإذا تساوت قيم
جميـع المفردات فإن  تساوى   ، وفى غير ذلك فإن   تكون أصغر من  .

وعادة يتم حساب  باستخدام اللوغاريتمات:

ويستخدم الوسط الهندسي أساساً المعياري رياضيات التمويل والإدارة المالية.
2-9 تقطع مسافرة مسافة قدرها 10mi على الطريق خارج المدينة بسرعة قدرها 60mi/h ومسافة قدرها 10mi على طرق داخل المدينة بسرعة قدرها15mi/h أوجد الوسط التوافقي . يستخدم الوسط التوافقي   أساساً لإيجاد متوسط المعدلات:


بينما أن الوسط الحسابي   لاحظ أنه إذا كان متوسط سرعة المسافرة 37.5mi/h فإنه يلزمها =32min(20m/37.5mi)60min لقطع مسافة 20mi . ولكنها تستغرق 10min على الطريق خارج المدينة 10mi)بمعدل (60mi/h  و 40min على الطريق داخل المدينة 10mi)بمعدل (15mi/h فيكون مجموع الزمن 50min ، والإجابة الصحيحة نحصل عليها باستخدام  =24min/h أى (20min/24min/h)x60min=50min
2-10(أ) بالنسبة للبيانات غير المبوبة الواردة المعياري جدول (2-7) ، أوجد الربيع الأول والثاني والثالث ، أوجد كذلك العشير الثالث والمئين الستين (ب) أوجد نفس المقاييس للبيانات المبوبة المعياري جدول(2-12) . (وتقسم الربيعات البيانات إلى أربعة أجزاء ، وتقسمها العشيرات إلى عشرة أجزاء ، بينما المئينات تقسمها إلى مائة جزء) .
(أ)  = 4   (الربيع الأول)           (متوسط قيمتي المفردتين العاشرة والحادية عشرة المعياري جدول 2-8)
 =     6 (الربيع الثاني) =  قيمة العنصر الذي ترتيبه 20.5 = الوسيط
 = 7.5 (الربيع الثالث) =   قيمة العنصر الذي ترتيبه 30.5
 = 5 (العشير الثالث) =     قيمة العنصر الذي ترتيبه 12.5
 = 7 (المئين الستون) =     قيمة العنصر الذي ترتيبه 24.5
(ب) 

 

مقاييس التشتت:
2-11 (أ) أوجد المدى للبيانات غير المبوبة المعياري جدول (2-7) .
        (ب)أوجد المدى للبيانات غير المبوبة المعياري جدول (2-10) وللبيانات المبوبة المعياري جدول 2-122.
(ح‌)    ما هي مزايا وعيوب المدى.

(أ‌)     المدى لبيانات غير مبوبة يساوى أكبر قيمة للمشاهدات مطروحاً منها أصغر قيمة للمشاهدات المعياري مجموعة البيانات . مدى البيانات غير المبوبة المعياري جدول (2-7) هو من 2 إلى 10 أى 8  درجات .
(ب‌)   المدى للبيانات غير المبوبة المعياري جدول (2-10) هو من $3.55 إلى $4.26 أى $0.71 . ويمتد المدى للبيانات المبوبة من الحد الأدنى للفئة الصغرى إلى الحد الأعلى للفئة الكبرى .  المدى للبيانات المبوبة المعياري جدول (2-12) يمتد من $3.50 إلى $4.29  .
(ج) مزايا المدى أنة سهل الحساب و الفهم . أما عيوبه أنه يأخذ المعياري الاعتبار فقط أصغر وأكبر قيمة للتوزيع ، ومن ثم فإنه يتأثر كثيراً بالقيم المتطرفة ، كذلك لا يمكن حسابه للتوزيعات المفتوحة , هذه العيوب للمدى تجعل فائدته محدودة (باستثناء استخدامه المعياري مراقبة الجودة) .
2-13 أوجد المدى الربيعي والانحراف الربيعي (نصف المدى الربيعي)
(أ‌)     للبيانات غير المبوبة المعياري جـدول (2-7) ، (ب) للبيانات المبوبـة المعياري جدول (2-12) .
(أ‌)     المدى الربيعي هو الفرق بين الربيع الثالث والربيع الأول أى

IR = Q3 – Q1                                             (2.26)

المدى الربيعي للبيانات غير المبوبة المعياري جدول (2-7) ، IR=7.5-4=3.5 )باستخدام قيمة   و   السابق إيجادها المعياري مسألة (2-10(أ)) لاحظ أن المدى الربيعي لا يتأثر بالقيم المتطرفة لأنها تستخدم فقط النصف الأوسط للبيانات . ومن هنا فإنه أفضل من المدى ، ولكن استخدمه ليس بدرجة شيوع استخدام المقاييس الأخرى للتشتت . أما الانحراف الربيعي .

ومن ثم فإن الانحراف الربيعي QD=(7.5-4)/2=3.5/7=1.75  ويقيس الانحراف الربيعي المدى المتوسط لربع البيانات .
(ب)المدى الربيعي IR=  - =$4.08-$3.83=$0.25  (باستخدام قيم   و     السابق إيجادها المعياري مسألة (2-10)(ب)):

2-13 أوجد الانحراف المتوسط (أ) للبيانات غير المبوبة المعياري جدول (2-7) . (ب) للبيانات المبوبة المعياري جدول (2-9).
(أ‌)     حيث   (أنظر مسألة 2-3 (أ)) ، فإن


لاحظ أن الانحراف المتوسط يأخذ جميع المشاهدات المعياري الاعتبار . أى انه يقيس متوسط الانحراف المطلق لكل مشاهدة عن الوسط الحسابي . ونأخذ القيمة المطلقة (المشار إليها باستخدام خطين رأسيين)
إذ أن   (أنظر مثال 5)
(ب‌)   يمكن إيجـاد الانحراف المتوسط لنفس البيانات المبوبة بالاستعانة بجدول

ويعطى نفس القيمة السابق الحصول عليها من البيانات غير المبوبة .
2-14 أوجد الانحراف  المتوسط للبيانات المبوبة المعياري جدول 2-12.
        يمكن إيجاد متوسط الانحراف للبيانات المبوبة عن الأجر بالساعة الواردة في جدول (2-12) بالاستعانة بجدول [X=$3.95]  (أنظر مسألة 2-4(ب)):


لاحظ أن الانحراف المتوسط المحسوب للبيانات المبوبة هو تقدير للانحراف المتوسط "الحقيقى" والذى يمكن إيجاد من البيانات غير المبوبة . وعادة ما يختلف قليلاً عن الانحراف المتوسط الحقيقى لأننا نستخدم تقدير الوسط الحسابى من البيانات المبوبة فى حساباتنا (قارن قيمتى X السابق إيجادهما فى مسألتى (2-4)(أ) ، (ب)) .

جدول (2-17) حسابات الانحراف المتوسط للبيانات المبوبة فى جدول (2-12)

2-15 أوجد التباين والانحراف المعيارى (أ) للبيانات المبوبة فى جدول(2-7) (ب) للبيانات المبوبة فى جدول (2-9) (ج) بماذا يمتاز الانحراف المعيارى عن التباين ؟


(ب) يمكن إيجاد التباين والانحراف المعيارى للبيانات المبوبة للدرجات بالاستعانة بجدول (2-18).

هى نفس القيم السابق إيجادها من البيانات غير المبوبة.

جدول (2-18) حسابات التباين والانحراف المعيارى للبيانات جدول (2-9)
(ج‌)    يمتاز الانحراف المعيارى عن التباين بأنه يعبر عنه باستخدام نفس وحدات القياس كما فى البيانات بينما يكون تمييز التباين " وحدات القياس مربعة" ويعتبر الانحراف المعيارى أكثر مقاييس التشتت (المطلق) شيوعاً.
2-16 أوجد التباين والانحراف المعيارى للبيانات المبوبة فى جدول (2-10) .
يمكن إيجاد التباين والانحراف المعيارى للبيانات المبوبة لأجر الساعة بالاستعانة بجدول (2-19)X=$3.95) انظر مسألة (2-4) (ب)) :

جدول (2-19) حسابات التباين والانحراف المعيارى للبيانات جدول (2-12)

لاحظ أنه فى معادلتى حساب   ، يتم استخدام n-1 . ويرجع ذلك إلى أنه إذا أخذنا عدداً كبيراً من العينات من المجتمع ، فإن متوسط تباين العينات لن يتجه لأن يكون مساوياً لتباين المجتمع  إلا إذا استخدمنا n-1 فى المقام عند حساب   (سوف نناقش ذلك ثانية فى الفصل الخامس) . هذا بالإضافة إلى أن   للبيانات المبوبة هى تقديرات للقيم الحقيقية   التى يمكن إيجادها من البيانات غير المبوبة لأننا نستخدم فى حساباتنا تقدير    من البيانات المبوبة .
2-17 بدءاً بمعادلات   و  المعطاة فى قسم (2-3) أثبت أن
(أ‌)    
(ب) 

(أ‌)    
(ب‌)    
ويمكن الحصول على   بنفس الطريقة كما فى (أ) . وتستخدم الصيغ السابقة لتبسيط الحسابات اللازمة لإيجاد  و  لمجموعة كبيرة من البيانات . ويمكن التبسيط أيضاً باستخدام الترميز (انظر مسألة (2-6)).

ليست هناك تعليقات:

إرسال تعليق