متوسط ​​قيمة الإحصائية. المتوسط ​​المرجح - ما هو وكيفية حسابه؟ المتوسطات: المعنى والاختلافات

وفي معظم الحالات، تتركز البيانات حول نقطة مركزية ما. وبالتالي، لوصف أي مجموعة من البيانات، يكفي الإشارة إلى القيمة المتوسطة. دعونا نفكر في ثلاثة على التوالي الخصائص العدديةوالتي تستخدم لتقدير متوسط ​​التوزيع: الوسط الحسابي والوسيط والمنوال.

متوسط

المتوسط ​​الحسابي (غالبًا ما يسمى ببساطة المتوسط) هو التقدير الأكثر شيوعًا لمتوسط ​​التوزيع. وهي نتيجة قسمة مجموع جميع القيم العددية المرصودة على عددها. لعينة تتكون من أرقام × 1، × 2، …، ×ن، متوسط ​​​​العينة (يشار إليه بـ ) يساوي = (X 1 + X 2 + … + Xن) / ن, أو

أين هو متوسط ​​العينة ن- حجم العينة، Xأناالعنصر الأولعينات.

قم بتنزيل المذكرة بالتنسيق أو بالأمثلة بالتنسيق

فكر في حساب المتوسط القيمة الحسابيةمتوسط ​​​​العائدات السنوية لمدة خمس سنوات لـ 15 صندوقًا مشتركًا بقيمة كبيرة جدًا مستوى عالخطر (الشكل 1).

أرز. 1. متوسط ​​العائد السنوي لـ 15 صندوق استثمار مشترك عالي المخاطر

يتم حساب متوسط ​​العينة على النحو التالي:

يعد هذا عائدًا جيدًا، خاصة بالمقارنة مع العائد الذي يتراوح بين 3 و4% الذي حصل عليه المودعون في البنوك أو الاتحادات الائتمانية خلال نفس الفترة الزمنية. إذا قمنا بفرز العائدات، فمن السهل أن نرى أن ثمانية صناديق لديها عوائد أعلى من المتوسط، وسبعة - أقل من المتوسط. ويعمل المتوسط ​​الحسابي كنقطة توازن، بحيث توازن الأموال ذات العائدات المنخفضة مع الأموال ذات العائدات المرتفعة. وتشارك جميع عناصر العينة في حساب المتوسط. ولا تمتلك أي من التقديرات الأخرى لمتوسط ​​التوزيع هذه الخاصية.

متى يجب عليك حساب الوسط الحسابي؟وبما أن الوسط الحسابي يعتمد على جميع العناصر الموجودة في العينة، فإن وجود القيم المتطرفة يؤثر بشكل كبير على النتيجة. في مثل هذه الحالات، يمكن للوسط الحسابي أن يشوه معنى البيانات الرقمية. لذلك، عند وصف مجموعة بيانات تحتوي على قيم متطرفة، من الضروري الإشارة إلى الوسيط أو الوسط الحسابي والوسيط. على سبيل المثال، إذا قمنا بإزالة عوائد صندوق RS Emerging Growth من العينة، فإن متوسط ​​عينة عوائد الصناديق الأربعة عشر ينخفض ​​بنسبة 1٪ تقريبًا إلى 5.19٪.

الوسيط

يمثل الوسيط القيمة الوسطى لمجموعة مرتبة من الأرقام. إذا كانت المصفوفة لا تحتوي على أرقام متكررة، فإن نصف عناصرها سيكون أقل من الوسيط، والنصف الآخر سيكون أكبر منه. إذا كانت العينة تحتوي على قيم متطرفة، فمن الأفضل استخدام الوسيط بدلاً من الوسط الحسابي لتقدير المتوسط. لحساب الوسيط لعينة ما، يجب أن يتم طلبه أولاً.

هذه الصيغة غامضة. وتعتمد نتيجته على ما إذا كان الرقم زوجيًا أم فرديًا ن:

  • إذا كانت العينة تحتوي على عدد فردي من العناصر، فإن الوسيط هو (ن+1)/2-العنصر.
  • إذا كانت العينة تحتوي على عدد زوجي من العناصر، فإن الوسيط يقع بين العنصرين الأوسطين في العينة ويساوي الوسط الحسابي المحسوب على هذين العنصرين.

لحساب متوسط ​​عينة تحتوي على عوائد 15 صندوق استثمار مشترك عالي المخاطر، تحتاج أولاً إلى فرز البيانات الأولية (الشكل 2). عندها سيكون الوسيط مقابل رقم العنصر الأوسط في العينة؛ في مثالنا رقم 8. يحتوي Excel على وظيفة خاصة =MEDIAN() تعمل مع المصفوفات غير المرتبة أيضًا.

أرز. 2. متوسط ​​15 صندوقا

وبالتالي فإن الوسيط هو 6.5. وهذا يعني أن العائد على نصف الأموال شديدة المخاطرة لا يتجاوز 6.5، والعائد على النصف الآخر يتجاوزه. لاحظ أن الوسيط 6.5 ليس أكبر بكثير من المتوسط ​​6.08.

إذا قمنا بإزالة عائد صندوق RS Emerging Growth من العينة، فإن متوسط ​​الصناديق الـ 14 المتبقية سينخفض ​​إلى 6.2٪، أي ليس بنفس أهمية المتوسط ​​الحسابي (الشكل 3).

أرز. 3. متوسط ​​14 صندوقا

موضة

تمت صياغة هذا المصطلح لأول مرة من قبل بيرسون في عام 1894. الموضة هي الرقم الذي يحدث غالبًا في العينة (الأكثر عصرية). تصف الموضة جيدًا، على سبيل المثال، رد الفعل النموذجي للسائقين عند إشارة المرور للتوقف عن الحركة. من الأمثلة الكلاسيكية لاستخدام الموضة اختيار حجم الحذاء أو لون ورق الحائط. إذا كان للتوزيع عدة أوضاع، فيقال أنه متعدد الوسائط أو متعدد الوسائط (له "قمتان" أو أكثر). التوزيع المتعدد الوسائط يعطي معلومات مهمةحول طبيعة المتغير محل الدراسة. على سبيل المثال، في الدراسات الاستقصائية الاجتماعية، إذا كان المتغير يمثل تفضيلًا أو موقفًا تجاه شيء ما، فإن تعدد الوسائط قد يعني أن هناك عدة آراء مختلفة بشكل واضح. كما تعمل تعدد الأساليب أيضًا كمؤشر على أن العينة ليست متجانسة وأن الملاحظات قد تنشأ عن توزيعين "متداخلين" أو أكثر. على عكس الوسط الحسابي، القيم المتطرفة لا تؤثر على الوضع. بالنسبة للمتغيرات العشوائية الموزعة بشكل مستمر، مثل متوسط ​​العائد السنوي لصناديق الاستثمار المشتركة، فإن الوضع في بعض الأحيان لا يوجد (أو لا معنى له) على الإطلاق. وبما أن هذه المؤشرات يمكن أن تأخذ قيمًا مختلفة جدًا، فإن تكرار القيم نادر للغاية.

الربعيات

الربعيات هي المقاييس المستخدمة غالبًا لتقييم توزيع البيانات عند وصف خصائص العينات الرقمية الكبيرة. في حين أن الوسيط يقسم المصفوفة المرتبة إلى النصف (50% من عناصر المصفوفة أقل من الوسيط و50% أكبر)، فإن الأرباع تقسم مجموعة البيانات المرتبة إلى أربعة أجزاء. قيم Q 1 و الوسيط و Q 3 هي النسب المئوية 25 و 50 و 75 على التوالي. الربع الأول Q 1 هو رقم يقسم العينة إلى قسمين: 25% من العناصر أقل من و 75% أكبر من الربع الأول.

الربع الثالث Q 3 هو رقم يقسم العينة أيضًا إلى قسمين: 75% من العناصر أقل من و25% أكبر من الربع الثالث.

لحساب الربعيات في إصدارات Excel قبل عام 2007، استخدم الدالة =QUARTILE(array,part). بدءاً من Excel 2010، يتم استخدام وظيفتين:

  • =QUARTILE.ON(صفيف، جزء)
  • =QUARTILE.EXC(صفيف، جزء)

هاتان الوظيفتان تعطيان القليل معان مختلفة(الشكل 4). على سبيل المثال، عند حساب الأرباع الربعية لعينة تحتوي على متوسط ​​العائدات السنوية لـ 15 صندوق استثمار مشترك عالي المخاطر، Q 1 = 1.8 أو -0.7 لـ QUARTILE.IN وQUARTILE.EX، على التوالي. بالمناسبة، الدالة QUARTILE، المستخدمة سابقًا، تتوافق مع الدالة QUARTILE.ON الحديثة. لحساب الربعيات في Excel باستخدام الصيغ المذكورة أعلاه، لا يلزم ترتيب مصفوفة البيانات.

أرز. 4. حساب الربعيات في Excel

دعونا نؤكد مرة أخرى. يمكن لـ Excel حساب الربعيات لمتغير أحادي سلسلة منفصلة ، تحتوي على القيم متغير عشوائي. ويرد أدناه في القسم حساب الربعيات للتوزيع على أساس التردد.

المتوسط ​​الهندسي

على عكس المتوسط ​​الحسابي، يسمح لك المتوسط ​​الهندسي بتقدير درجة التغير في متغير مع مرور الوقت. الوسط الهندسي هو الجذر نالدرجة الرابعة من العمل نالكميات (في Excel يتم استخدام الدالة =SRGEOM):

ز= (X 1 * X 2 * … * X n) 1/n

يتم تحديد معلمة مماثلة - القيمة المتوسطة الهندسية لمعدل الربح - بواسطة الصيغة:

غ = [(1 + ر 1) * (1 + ر 2) * … * (1 + ر ن)] 1/ن - 1،

أين ص ط- معدل الربح ل أناالفترة الزمنية.

على سبيل المثال، لنفترض أن الاستثمار الأولي هو 100000 دولار أمريكي، وبحلول نهاية السنة الأولى، ينخفض ​​إلى 50000 دولار أمريكي، وبحلول نهاية السنة الثانية يتعافى إلى المستوى الأولي البالغ 100000 دولار أمريكي -الفترة السنوية تساوي 0، حيث أن المبالغ الأولية والنهائية للأموال متساوية مع بعضها البعض. إلا أن المتوسط ​​الحسابي لمعدلات الربح السنوية هو = (-0.5 + 1) / 2 = 0.25 أو 25%، حيث أن معدل الربح في السنة الأولى R 1 = (50,000 – 100,000) / 100,000 = –0.5، وفي الثاني R 2 = (100.000 – 50.000) / 50.000 = 1. وفي نفس الوقت فإن القيمة المتوسطة الهندسية لمعدل الربح لمدة سنتين تساوي: G = [(1–0.5) * (1+1 ) ] 1/2 – 1 = ½ – 1 = 1 – 1 = 0. وبالتالي، فإن المتوسط ​​الهندسي يعكس بشكل أكثر دقة التغير (أو بشكل أكثر دقة، عدم وجود تغييرات) في حجم الاستثمار على مدى فترة عامين من المتوسط ​​الحسابي يقصد.

حقائق مثيرة للاهتمام.أولًا، المتوسط ​​الهندسي سيكون دائمًا أقل من المتوسط ​​الحسابي لنفس الأرقام. باستثناء الحالة التي تكون فيها جميع الأرقام المأخوذة متساوية مع بعضها البعض. ثانيًا، من خلال النظر في خصائص المثلث القائم الزاوية، يمكنك أن تفهم سبب تسمية الوسط الهندسي. ارتفاع المثلث الأيمن، الذي تم تخفيضه إلى الوتر، هو المتوسط ​​​​المتناسب بين إسقاطات الأرجل على الوتر، وكل ساق هو المتوسط ​​​​المتناسب بين الوتر وإسقاطه على الوتر (الشكل 5). وهذا يعطي طريقة هندسية لبناء الوسط الهندسي لقطعتين (أطوال): تحتاج إلى بناء دائرة على مجموع هذين القطعين كقطر، ثم يتم استعادة الارتفاع من نقطة اتصالهما بالتقاطع مع الدائرة سيعطي القيمة المطلوبة:

أرز. 5. الطبيعة الهندسية للوسط الهندسي (الشكل من ويكيبيديا)

الخاصية الثانية المهمة للبيانات الرقمية هي تفاوت، وصف درجة تشتت البيانات. قد تختلف عينتان مختلفتان في كل من الوسائل والفروق. ومع ذلك، كما هو مبين في الشكل. في الشكل 6 و7، قد يكون لعينتين نفس الاختلافات ولكن وسائل مختلفة، أو نفس الوسائل واختلافات مختلفة تمامًا. البيانات التي تتوافق مع المضلع B في الشكل. 7، تغير أقل بكثير من البيانات التي تم بناء المضلع A عليها.

أرز. 6. توزيعان متماثلان على شكل جرس لهما نفس السبريد وقيم متوسطة مختلفة

أرز. 7. توزيعان متماثلان على شكل جرس لهما نفس القيم المتوسطة وفروقات مختلفة

هناك خمسة تقديرات لتباين البيانات:

نِطَاق

النطاق هو الفرق بين أكبر وأصغر عناصر العينة:

المدى = سماكس - Xدقيقة

يمكن حساب نطاق العينة التي تحتوي على متوسط ​​العائدات السنوية لـ 15 صندوقًا استثماريًا عالي المخاطر للغاية باستخدام المصفوفة المرتبة (انظر الشكل 4): النطاق = 18.5 - (–6.1) = 24.6. وهذا يعني أن الفرق بين أعلى وأدنى متوسط ​​عوائد سنوية للصناديق عالية المخاطر للغاية هو 24.6%.

يقيس النطاق الانتشار الإجمالي للبيانات. على الرغم من أن نطاق العينة هو تقدير بسيط جدًا للانتشار الإجمالي للبيانات، إلا أن ضعفه هو أنه لا يأخذ في الاعتبار بالضبط كيفية توزيع البيانات بين العناصر الدنيا والقصوى. يظهر هذا التأثير بوضوح في الشكل. 8، وهو ما يوضح العينات التي لها نفس النطاق. يوضح المقياس B أنه إذا كانت العينة تحتوي على قيمة متطرفة واحدة على الأقل، فإن نطاق العينة يكون تقديرًا غير دقيق للغاية لانتشار البيانات.

أرز. 8. مقارنة ثلاث عينات بنفس النطاق؛ ويرمز المثلث إلى دعم المقياس، وموقعه يتوافق مع متوسط ​​العينة

النطاق الربيعي

المدى الربيعي أو المتوسط ​​هو الفرق بين الربعين الثالث والأول للعينة:

المدى الربيعي = س 3 - س 1

تتيح لنا هذه القيمة تقدير تشتت العناصر بنسبة 50% وعدم مراعاة تأثير العناصر المتطرفة. يمكن حساب النطاق الربعي للعينة التي تحتوي على متوسط ​​العائدات السنوية لـ 15 صندوقًا مشتركًا عالي المخاطر باستخدام البيانات الواردة في الشكل 1. 4 (على سبيل المثال، للدالة QUARTILE.EXC): النطاق الربعي = 9.8 – (–0.7) = 10.5. غالبًا ما يُطلق على الفاصل الزمني المحدد بالأرقام 9.8 و -0.7 النصف الأوسط.

وتجدر الإشارة إلى أن قيم Q 1 و Q 3، وبالتالي المدى الربيعي، لا تعتمد على وجود القيم المتطرفة، حيث أن حسابها لا يأخذ في الاعتبار أي قيمة ستكون أقل من Q 1 أو أكبر من س 3 . تسمى المقاييس الموجزة مثل الوسيط والربيعين الأول والثالث والمدى الربيعي التي لا تتأثر بالقيم المتطرفة مقاييس قوية.

على الرغم من أن المدى والمدى الربيعي يقدمان تقديرات للانتشار الإجمالي ومتوسط ​​العينة، على التوالي، فإن أيا من هذه التقديرات لا يأخذ في الاعتبار بالضبط كيفية توزيع البيانات. التباين والانحراف المعياريخالية من هذا العيب. تسمح لك هذه المؤشرات بتقييم درجة تقلب البيانات حول القيمة المتوسطة. تباين العينةهو تقريب للوسط الحسابي المحسوب من مربعات الاختلافات بين كل عنصر من عناصر العينة ومتوسط ​​العينة. بالنسبة للعينة X 1، X 2، ... X n، يتم إعطاء تباين العينة (المشار إليه بالرمز S 2) بالصيغة التالية:

في الحالة العامةتباين العينة هو مجموع مربعات الاختلافات بين عناصر العينة ومتوسط ​​العينة، مقسومًا على قيمة تساوي حجم العينة ناقص واحد:

أين - المتوسط ​​الحسابي، ن- حجم العينة، العاشر ط - أناعنصر الاختيار X. في Excel قبل الإصدار 2007، تم استخدام الدالة =VARIN() لحساب تباين العينة؛ ومنذ الإصدار 2010، تم استخدام الدالة =VARIAN().

التقدير الأكثر عملية والمقبول على نطاق واسع لانتشار البيانات هو الانحراف المعياري للعينة. يُشار إلى هذا المؤشر بالرمز S ويساوي الجذر التربيعيمن تباين العينة :

في Excel قبل الإصدار 2007، تم استخدام الدالة =STDEV.() لحساب انحراف العينة القياسي؛ ومنذ الإصدار 2010، يتم استخدام الدالة =STDEV.V(). لحساب هذه الوظائف، قد تكون مجموعة البيانات غير مرتبة.

لا يمكن أن يكون تباين العينة أو الانحراف المعياري سالبًا. الحالة الوحيدة التي يمكن أن يكون فيها المؤشران S 2 و S صفراً هي إذا كانت جميع عناصر العينة متساوية مع بعضها البعض. هذا على الاطلاق حالة لا تصدقالمدى والمدى الربيعي هما أيضًا صفر.

البيانات الرقمية متغيرة بطبيعتها. أي متغير يمكن أن يستغرق الكثير معان مختلفة. على سبيل المثال، صناديق الاستثمار المختلفة لديها مؤشرات مختلفةالربحية والخسائر. نظرًا لتباين البيانات الرقمية، من المهم جدًا دراسة ليس فقط تقديرات المتوسط، والتي تكون ملخصة بطبيعتها، ولكن أيضًا تقديرات التباين، التي تميز انتشار البيانات.

يسمح لك التشتت والانحراف المعياري بتقييم انتشار البيانات حول القيمة المتوسطة، وبعبارة أخرى، تحديد عدد عناصر العينة الأقل من المتوسط ​​وعدد العناصر الأكبر. التشتت لديه بعض الخصائص الرياضية القيمة. ومع ذلك، فإن قيمتها هي مربع وحدة القياس - النسبة المئوية المربعة، والدولار المربع، والبوصة المربعة، وما إلى ذلك. لذلك، فإن المقياس الطبيعي للتشتت هو الانحراف المعياري، والذي يتم التعبير عنه بوحدات مشتركة لنسبة الدخل أو الدولارات أو البوصات.

يسمح لك الانحراف المعياري بتقدير مقدار التباين في عناصر العينة حول القيمة المتوسطة. في جميع الحالات تقريبًا، تقع غالبية القيم المرصودة ضمن نطاق زائد أو ناقص انحراف معياري واحد عن المتوسط. وبالتالي، بمعرفة الوسط الحسابي لعناصر العينة والانحراف المعياري للعينة، يمكن تحديد الفترة التي ينتمي إليها الجزء الأكبر من البيانات.

ويبلغ الانحراف المعياري للعائدات لصناديق الاستثمار المشتركة الخمسة عشر عالية المخاطر 6.6 (الشكل 9). وهذا يعني أن ربحية الجزء الأكبر من الأموال تختلف عن متوسط ​​القيمة بما لا يزيد عن 6.6% (أي أنها تتقلب في المدى من = 6.2 - 6.6 = -0.4 إلى = 12.8). وفي الواقع، فإن متوسط ​​العائد السنوي لمدة خمس سنوات البالغ 53.3٪ (8 من أصل 15) من الأموال يقع ضمن هذا النطاق.

أرز. 9. عينة الانحراف المعياري

لاحظ أنه عند جمع الفروق المربعة، يتم إعطاء عناصر العينة الأبعد عن المتوسط ​​وزنًا أكبر من العناصر الأقرب إلى المتوسط. هذه الخاصية هي السبب الرئيسي وراء استخدام المتوسط ​​الحسابي في أغلب الأحيان لتقدير متوسط ​​التوزيع.

معامل الاختلاف

وعلى عكس التقديرات السابقة للتشتت، فإن معامل الاختلاف هو تقدير نسبي. يتم قياسه دائمًا كنسبة مئوية وليس بوحدات البيانات الأصلية. يقيس معامل الاختلاف، المشار إليه بالرموز CV، تشتت البيانات حول المتوسط. معامل الاختلاف يساوي الانحراف المعياري مقسوماً على الوسط الحسابي مضروباً في 100%:

أين س- انحراف العينة المعياري، - متوسط ​​العينة .

يتيح لك معامل الاختلاف مقارنة عينتين تم التعبير عن عناصرهما وحدات مختلفةقياسات. على سبيل المثال، ينوي مدير خدمة توصيل البريد تجديد أسطول الشاحنات الخاص به. عند تحميل الطرود، هناك قيدان يجب مراعاتهما: الوزن (بالجنيه) والحجم (بالقدم المكعبة) لكل طرد. لنفترض أنه في عينة تحتوي على 200 حزمة، معدل الوزنهو 26.0 رطلاً، والانحراف المعياري للوزن 3.9 رطلاً، ومتوسط ​​حجم الكيس 8.8 قدم مكعب، والانحراف المعياري للحجم 2.2 قدم مكعب. كيف يمكن مقارنة التباين في وزن وحجم العبوات؟

وبما أن وحدات قياس الوزن والحجم تختلف عن بعضها البعض، فيجب على المدير مقارنة التوزيع النسبي لهذه الكميات. معامل اختلاف الوزن هو CV W = 3.9 / 26.0 * 100% = 15%، ومعامل اختلاف الحجم هو CV V = 2.2 / 8.8 * 100% = 25%. وبالتالي، فإن التباين النسبي في حجم الرزم أكبر بكثير من التباين النسبي في وزنها.

استمارة التوزيع

الخاصية الثالثة المهمة للعينة هي شكل توزيعها. قد يكون هذا التوزيع متماثلًا أو غير متماثل. لوصف شكل التوزيع، من الضروري حساب متوسطه ووسيطه. إذا كان الاثنان متماثلين، يعتبر المتغير موزعا بشكل متماثل. إذا كانت القيمة المتوسطة للمتغير أكبر من الوسيط، فإن توزيعه يكون له انحراف إيجابي (الشكل 10). إذا كان الوسيط أكبر من المتوسط، يكون توزيع المتغير منحرفًا سلبيًا. يحدث الانحراف الإيجابي عندما يزيد المتوسط ​​إلى قيم عالية بشكل غير عادي. يحدث الانحراف السلبي عندما ينخفض ​​المتوسط ​​إلى قيم صغيرة بشكل غير عادي. يتم توزيع المتغير بشكل متماثل إذا لم يأخذ أي قيم متطرفة في أي من الاتجاهين، بحيث تلغي القيم الكبيرة والصغيرة للمتغير بعضها البعض.

أرز. 10. ثلاثة أنواع من التوزيعات

البيانات المعروضة على المقياس A منحرفة بشكل سلبي. يُظهر هذا الشكل ذيلًا طويلًا وانحرافًا نحو اليسار بسبب وجود قيم صغيرة بشكل غير عادي. تعمل هذه القيم الصغيرة للغاية على تحويل القيمة المتوسطة إلى اليسار، مما يجعلها أقل من الوسيط. يتم توزيع البيانات الموضحة على المقياس B بشكل متماثل. اليسار و النصف الأيمنالتوزيعات هي صور مرآة لأنفسهم. القيم الكبيرة والصغيرة تتوازن مع بعضها البعض، والمتوسط ​​والوسيط متساويان. البيانات المعروضة على المقياس B منحرفة بشكل إيجابي. يُظهر هذا الشكل ذيلًا طويلًا وانحرافًا إلى اليمين بسبب وجود قيم عالية بشكل غير عادي. تعمل هذه القيم الكبيرة جدًا على تحويل الوسط إلى اليمين، مما يجعله أكبر من الوسيط.

في Excel، يمكن الحصول على إحصائيات وصفية باستخدام وظيفة إضافية حزمة التحليل. اذهب من خلال القائمة بياناتتحليل البيانات، في النافذة التي تفتح، حدد السطر الإحصاء الوصفيوانقر نعم. فى الشباك الإحصاء الوصفيتأكد من الإشارة الفاصل الزمني للإدخال(الشكل 11). إذا كنت تريد رؤية إحصائيات وصفية في نفس الورقة التي تحتوي على البيانات الأصلية، فحدد زر الاختيار الفاصل الزمني للإخراجوحدد الخلية التي يجب وضع الركن العلوي الأيسر من الإحصائيات المعروضة فيها (في مثالنا، $C$1). إذا كنت تريد إخراج البيانات إلى صفحة جديدةأو إلى كتاب جديد، ما عليك سوى تحديد زر الاختيار المناسب. حدد المربع المجاور لـ احصائيات ملخصة. إذا رغبت في ذلك، يمكنك أيضا الاختيار مستوى الصعوبة،ك أصغر وك أكبر.

إذا على الودائع بياناتفي المنطقة تحليللا ترى الأيقونة تحليل البيانات، تحتاج إلى تثبيت الوظيفة الإضافية أولاً حزمة التحليل(انظر على سبيل المثال).

أرز. 11. إحصائيات وصفية لمتوسط ​​العائدات السنوية للأموال لمدة خمس سنوات ذات مستويات مخاطرة عالية جدًا، محسوبة باستخدام الوظيفة الإضافية تحليل البياناتبرامج اكسل

يقوم برنامج Excel بحساب عدد من الإحصائيات التي تمت مناقشتها أعلاه: المتوسط ​​والوسيط والوضع والانحراف المعياري والتباين والمدى ( فاصلة) والحد الأدنى والحد الأقصى وحجم العينة ( يفحص). يقوم Excel أيضًا بحساب بعض الإحصائيات الجديدة بالنسبة لنا: الخطأ القياسي، والتفرطح، والانحراف. خطأ تقليدييساوي الانحراف المعياري مقسومًا على الجذر التربيعي لحجم العينة. عدم التماثليميز الانحراف عن تماثل التوزيع وهو دالة تعتمد على مكعب الاختلافات بين عناصر العينة والقيمة المتوسطة. التفرطح هو مقياس للتركيز النسبي للبيانات حول المتوسط ​​مقارنة بذيول التوزيع ويعتمد على الاختلافات بين عناصر العينة والمتوسط ​​مرفوعًا إلى القوة الرابعة.

عملية حسابية الإحصاء الوصفيل سكان

إن متوسط ​​وانتشار وشكل التوزيع الذي تمت مناقشته أعلاه هي خصائص يتم تحديدها من العينة. ومع ذلك، إذا كانت مجموعة البيانات تحتوي على قياسات رقمية لجميع السكان، فيمكن حساب معلماتها. وتشمل هذه المعلمات القيمة المتوقعة والتشتت والانحراف المعياري للسكان.

القيمة المتوقعةيساوي مجموع جميع القيم في السكان مقسومًا على حجم السكان:

أين µ - القيمة المتوقعة، Xأنا- أناالملاحظة العاشرة للمتغير X, ن- حجم عموم السكان. في Excel للحساب توقع رياضييتم استخدام نفس الدالة بالنسبة للوسط الحسابي: =AVERAGE().

تباين المجتمعيساوي مجموع مربعات الفروق بين عناصر عموم السكان والحصيرة. التوقعات مقسومة على حجم السكان:

أين σ 2– تشتت عامة السكان . في Excel قبل الإصدار 2007، يتم استخدام الدالة =VARP() لحساب تباين المحتوى، بدءًا من الإصدار 2010 =VARP().

الانحراف المعياري السكانيساوي الجذر التربيعي لتباين السكان:

في Excel قبل الإصدار 2007، يتم استخدام الدالة =STDEV() لحساب الانحراف المعياري للسكان، بدءًا من الإصدار 2010 =STDEV.Y(). لاحظ أن صيغ تباين السكان والانحراف المعياري تختلف عن صيغ حساب تباين العينة والانحراف المعياري. عند حساب إحصائيات العينة س 2و سمقام الكسر هو ن - 1وعند حساب المعلمات σ 2و σ - حجم عموم السكان ن.

بحكم التجربة

في معظم الحالات، تتركز نسبة كبيرة من الملاحظات حول الوسط، مما يشكل كتلة. في مجموعات البيانات ذات الانحراف الإيجابي، تقع هذه المجموعة على يسار (أي أسفل) التوقع الرياضي، وفي المجموعات ذات الانحراف السلبي، تقع هذه المجموعة على يمين (أي أعلى) التوقع الرياضي. بالنسبة للبيانات المتماثلة، يكون المتوسط ​​والوسيط متماثلين، وتتجمع الملاحظات حول المتوسط، لتشكل توزيعًا على شكل جرس. إذا لم يكن التوزيع منحرفًا بشكل واضح وكانت البيانات مركزة حول مركز الثقل، فإن القاعدة الأساسية التي يمكن استخدامها لتقدير التباين هي أنه إذا كانت البيانات لها توزيع على شكل جرس، فإن ما يقرب من 68٪ من الملاحظات تقع ضمن انحراف معياري واحد للقيمة المتوقعة حوالي 95% من الملاحظات لا تبعد أكثر من انحرافين معياريين عن التوقع الرياضي و99.7% من الملاحظات لا تبعد أكثر من ثلاثة انحرافات معيارية عن التوقع الرياضي.

وبالتالي فإن الانحراف المعياري، وهو تقدير لمتوسط ​​التباين حول القيمة المتوقعة، يساعد على فهم كيفية توزيع الملاحظات وتحديد القيم المتطرفة. والقاعدة الأساسية هي أنه بالنسبة للتوزيعات على شكل جرس، فإن قيمة واحدة فقط من عشرين تختلف عن التوقع الرياضي بأكثر من انحرافين معياريين. ولذلك، القيم خارج الفاصل الزمني ± 2σ، يمكن اعتبارها قيما متطرفة. بالإضافة إلى ذلك، هناك ثلاث ملاحظات فقط من أصل 1000 تختلف عن التوقع الرياضي بأكثر من ثلاثة انحرافات معيارية. وبالتالي القيم خارج الفاصل الزمني μ ± 3σتكون قيمًا متطرفة دائمًا تقريبًا. بالنسبة للتوزيعات شديدة الانحراف أو غير الجرسية، يمكن تطبيق قاعدة بيناماي-تشيبيشيف الأساسية.

منذ أكثر من مائة عام، اكتشف عالما الرياضيات بيناماي وتشيبيشيف، بشكل مستقل، الخاصية المفيدة للانحراف المعياري. ووجدوا أنه بالنسبة لأي مجموعة بيانات، بغض النظر عن شكل التوزيع، فإن النسبة المئوية للملاحظات التي تقع ضمن مسافة كالانحرافات المعيارية عن التوقعات الرياضية، وليس أقل (1 – 1/ ك2)*100%.

على سبيل المثال، إذا ك= 2، تنص قاعدة Bienname-Chebyshev على أنه على الأقل (1 – (1/2) 2) × 100% = 75% من الملاحظات يجب أن تقع في الفترة ± 2σ. هذه القاعدة صحيحة لأي ك، يتجاوز واحد. قاعدة Bienamay-Chebyshev شديدة جدًا الطابع العاموهو صالح للتوزيعات من أي نوع. ويحدد الحد الأدنى لعدد الملاحظات، والمسافة التي منها إلى التوقع الرياضي لا تتجاوز قيمة محددة. ومع ذلك، إذا كان التوزيع على شكل جرس، فإن القاعدة العامة تقدر بشكل أكثر دقة تركيز البيانات حول القيمة المتوقعة.

حساب الإحصائيات الوصفية للتوزيع على أساس التردد

إذا لم تكن البيانات الأصلية متوفرة، يصبح التوزيع التكراري هو المصدر الوحيد للمعلومات. وفي مثل هذه الحالات، من الممكن حساب القيم التقريبية للمؤشرات الكمية للتوزيع، مثل الوسط الحسابي، والانحراف المعياري، والأرباع.

إذا تم تمثيل بيانات العينة كتوزيع تكراري، فيمكن حساب تقريب للوسط الحسابي بافتراض أن جميع القيم داخل كل فئة تتركز عند نقطة منتصف الفئة:

أين - متوسط ​​العينة، ن- عدد الملاحظات، أو حجم العينة، مع- عدد الطبقات في توزيع التردد، م ي- نقطة المنتصف يالصف العاشر, Fي- التردد المقابل ي-الصف.

لحساب الانحراف المعياري عن التوزيع التكراري، يفترض أيضًا أن جميع القيم داخل كل فئة تتركز عند نقطة منتصف الفئة.

لفهم كيفية تحديد شرائح السلسلة على أساس التكرارات، فكر في حساب الربع الأدنى بناءً على بيانات عام 2013 حول توزيع السكان الروس حسب متوسط ​​​​نصيب الفرد من الدخل النقدي (الشكل 12).

أرز. 12. حصة السكان الروس بمتوسط ​​نصيب الفرد من الدخل النقدي شهريا، بالروبل

لحساب الربع الأول من سلسلة تباين الفاصل الزمني، يمكنك استخدام الصيغة:

حيث Q1 هي قيمة الربع الأول، وxQ1 هو الحد الأدنى للفاصل الزمني الذي يحتوي على الربيع الأول (يتم تحديد الفاصل الزمني بواسطة التكرار المتراكم الذي يتجاوز أولاً 25٪)؛ ط - قيمة الفاصل الزمني؛ Σf – مجموع ترددات العينة بأكملها؛ ربما تساوي دائمًا 100%؛ SQ1–1 - التكرار المتراكم للفاصل الزمني الذي يسبق الفاصل الزمني الذي يحتوي على الربيع الأدنى؛ fQ1 – تردد الفترة التي تحتوي على الربيع الأدنى. تختلف صيغة الربع الثالث في أنه في جميع الأماكن تحتاج إلى استخدام Q3 بدلاً من Q1، والاستبدال بـ ¾ بدلاً من ¼.

في مثالنا (الشكل 12)، يقع الربع الأدنى في النطاق 7000.1 - 10000، ويبلغ تردده المتراكم 26.4%. الحد الأدنىمن هذا الفاصل الزمني – 7000 روبل، قيمة الفاصل الزمني – 3000 روبل، التكرار المتراكم للفاصل الزمني الذي يسبق الفاصل الزمني الذي يحتوي على الربيع الأدنى – 13.4%، تردد الفاصل الزمني الذي يحتوي على الربيع الأدنى – 13.0%. وبالتالي: Q1 = 7000 + 3000 * (¼ * 100 – 13.4) / 13 = 9677 فرك.

المزالق المرتبطة بالإحصاء الوصفي

في هذا المنشور، نظرنا في كيفية وصف مجموعة بيانات باستخدام إحصائيات مختلفة تقيم متوسطها وانتشارها وتوزيعها. والخطوة التالية هي تحليل البيانات وتفسيرها. حتى الآن، قمنا بدراسة الخصائص الموضوعية للبيانات، والآن ننتقل إلى تفسيرها الذاتي. يواجه الباحث خطأين: موضوع تحليل تم اختياره بشكل غير صحيح و سوء تفسيرنتائج.

إن تحليل عوائد 15 صندوقًا استثماريًا عالي المخاطر للغاية هو تحليل غير متحيز تمامًا. لقد أدى إلى استنتاجات موضوعية تمامًا: جميع صناديق الاستثمار المشتركة لها عوائد مختلفة، ويتراوح انتشار عوائد الصندوق من -6.1 إلى 18.5، ويبلغ متوسط ​​العائد 6.08. يتم ضمان موضوعية تحليل البيانات الاختيار الصحيحإجمالي المؤشرات الكمية للتوزيع. تم النظر في عدة طرق لتقدير متوسط ​​وتشتت البيانات، وتمت الإشارة إلى مزاياها وعيوبها. كيف تختار الإحصائيات الصحيحة لتقديم تحليل موضوعي ومحايد؟ إذا كان توزيع البيانات منحرفًا قليلاً، فهل يجب عليك اختيار الوسيط بدلاً من المتوسط؟ ما هو المؤشر الذي يصف بشكل أكثر دقة انتشار البيانات: الانحراف المعياري أم النطاق؟ هل يجب أن نشير إلى أن التوزيع منحرف بشكل إيجابي؟

من ناحية أخرى، تفسير البيانات هو عملية ذاتية. أناس مختلفونالتوصل إلى استنتاجات مختلفة عند تفسير نفس النتائج. كل شخص لديه وجهة نظره الخاصة. يعتبر شخص ما أن إجمالي متوسط ​​العائدات السنوية لـ 15 صندوقًا بمستوى عالٍ جدًا من المخاطرة جيد وهو راضٍ تمامًا عن الدخل المستلم. وقد يشعر آخرون أن هذه الأموال لها عوائد منخفضة للغاية. وبالتالي، ينبغي التعويض عن الذاتية بالصدق والحياد ووضوح الاستنتاجات.

قضايا أخلاقية

يرتبط تحليل البيانات ارتباطًا وثيقًا بالقضايا الأخلاقية. يجب أن تنتقد المعلومات التي تنشرها الصحف والإذاعة والتلفزيون والإنترنت. بمرور الوقت، ستتعلم أن تكون متشككًا ليس فقط في النتائج، ولكن أيضًا في أهداف البحث وموضوعه وموضوعيته. قال السياسي البريطاني الشهير بنيامين دزرائيلي عن ذلك على أفضل وجه: "هناك ثلاثة أنواع من الأكاذيب: الأكاذيب، والأكاذيب اللعينة، والإحصائيات".

وكما هو مذكور في المذكرة، تنشأ قضايا أخلاقية عند اختيار النتائج التي ينبغي تقديمها في التقرير. يجب نشر النتائج الإيجابية والسلبية. بالإضافة إلى ذلك، عند تقديم تقرير أو تقرير مكتوب، يجب عرض النتائج بأمانة وحيادية وموضوعية. هناك فرق بين العروض الفاشلة وغير الصادقة. للقيام بذلك، من الضروري تحديد نوايا المتحدث. أحيانًا يغفل المتحدث معلومات مهمة عن جهل، وأحيانًا يكون ذلك متعمدًا (على سبيل المثال، إذا استخدم الوسط الحسابي لتقدير متوسط ​​البيانات المنحرفة بشكل واضح للحصول على النتيجة المرجوة). كما أنه من غير النزيه قمع النتائج التي لا تتوافق مع وجهة نظر الباحث.

يتم استخدام مواد من كتاب Levin et al. إحصائيات المديرين. – م: ويليامز، 2004. – ص. 178-209

تم الاحتفاظ بالدالة QUARTILE للتوافق مع الإصدارات السابقة من Excel.

القيمة المتوسطة هي الأكثر قيمة من وجهة نظر تحليلية وشكل عالمي للتعبير عن المؤشرات الإحصائية. المتوسط ​​الأكثر شيوعًا - الوسط الحسابي - له عدد من الخصائص الرياضيةوالتي يمكن استخدامها في حسابها. وفي الوقت نفسه، عند حساب متوسط ​​معين، يُنصح دائمًا بالاعتماد على صيغته المنطقية، وهي نسبة حجم السمة إلى حجم السكان. يوجد لكل متوسط ​​علاقة أولية حقيقية واحدة فقط، والتي قد يتطلب تنفيذها، اعتمادًا على البيانات المتاحة أشكال متعددةمتوسط. ومع ذلك، في جميع الحالات التي تقتضي طبيعة القيمة التي يتم حساب المتوسط ​​لها وجود أوزان، فإنه من المستحيل استخدام صيغها غير الموزونة بدلاً من صيغ المتوسط ​​المرجح.

القيمة المتوسطة هي القيمة الأكثر تميزًا للسمة بالنسبة للسكان وحجم سمة السكان الموزعة بحصص متساوية بين وحدات السكان.

تسمى الخاصية التي يتم حساب القيمة المتوسطة لها متوسط .

القيمة المتوسطة هي مؤشر يتم حسابه من خلال مقارنة القيم المطلقة أو النسبية. يشار إلى القيمة المتوسطة

وتعكس القيمة المتوسطة تأثير كافة العوامل المؤثرة على الظاهرة محل الدراسة والناتجة عنها. بمعنى آخر، من خلال إلغاء الاختلافات الفردية وإزالة تأثير الحالات، ينعكس المتوسط قياس عاموتكون نتائج هذا الإجراء بمثابة نمط عام للظاهرة قيد الدراسة.

شروط استخدام القيم المتوسطة:

Ø تجانس السكان قيد الدراسة. إذا كانت بعض عناصر المجتمع الخاضع لتأثير عامل عشوائي لها قيم للخاصية محل الدراسة تختلف بشكل كبير عن الباقي، فإن هذه العناصر ستؤثر على حجم المتوسط ​​لهذه المجموعة من السكان. في هذه الحالة، لن يعبر المتوسط ​​عن القيمة الأكثر نموذجية للسمة بالنسبة للمجتمع. وإذا كانت الظاهرة محل الدراسة غير متجانسة فإنها تتطلب تقسيمها إلى مجموعات تحتوي على عناصر متجانسة. في هذه الحالة، يتم حساب متوسطات المجموعة - متوسطات المجموعة، التي تعبر عن القيمة الأكثر تميزًا للظاهرة في كل مجموعة، ثم يتم حساب القيمة المتوسطة الإجمالية لجميع العناصر، التي تميز الظاهرة ككل. ويتم حسابه على أنه متوسط ​​متوسطات المجموعة، مرجحًا بعدد العناصر السكانية المدرجة في كل مجموعة؛

Ø كمية كافيةوحدات في المجموع؛

Ø القيم القصوى والدنيا للصفة في المجتمع محل الدراسة.

متوسط ​​القيمة (المؤشر)- وهذا معمم خاصية كميةمميزة في تركيبة منهجية في ظل ظروف محددة من المكان والزمان.

في الإحصاء، يتم استخدام الأشكال (الأنواع) التالية من المتوسطات، والتي تسمى القوة والهيكلية:

Ø المتوسط ​​الحسابي(بسيطة ومرجحة)؛

بسيط

الانضباط: الإحصاء

الخيار رقم 2

متوسط ​​القيم المستخدمة في الإحصاء

مقدمة ……………………………………………………………………….3

مهمة نظرية

القيمة المتوسطة في الإحصاء وجوهرها وشروط تطبيقها.

1.1. جوهر الحجم المتوسط ​​وشروط الاستخدام……….4

1.2. أنواع المتوسطات…………………………………………………………………………………………………………… 8

مهمة عملية

المهمة 1،2،3 ………………………………………………………………………………………………………………………………… 14

الخلاصة …………………………………………………………………….21

قائمة المراجع …………………………………………….23

مقدمة

هذا امتحانيتكون من جزأين – النظري والعملي. في الجزء النظري، سيتم دراسة فئة إحصائية مهمة مثل القيمة المتوسطة بالتفصيل من أجل تحديد جوهرها وشروط تطبيقها، وكذلك تسليط الضوء على أنواع المتوسطات وطرق حسابها.

الإحصاء، كما نعلم، يدرس الظواهر الاجتماعية والاقتصادية الضخمة. وقد يكون لكل من هذه الظواهر تعبير كمي مختلف لنفس الخاصية. على سبيل المثال أجور العاملين في نفس المهنة أو أسعار السوق لنفس المنتج وما إلى ذلك. تمثل القيم المتوسطة المؤشرات النوعية للنشاط التجاري: تكاليف التوزيع، الربح، الربحية، إلخ.

لدراسة أي مجتمع وفقًا لخصائص مختلفة (متغيرة كميًا)، تستخدم الإحصائيات القيم المتوسطة.

كيان متوسط ​​الحجم

القيمة المتوسطة هي خاصية كمية معممة لمجموعة من الظواهر المتشابهة بناءً على خاصية واحدة متباينة. في الممارسة الاقتصادية، يتم استخدام مجموعة واسعة من المؤشرات، والتي يتم حسابها كقيم متوسطة.

أهم خاصية للقيمة المتوسطة هي أنها تمثل قيمة صفة معينة في مجموع السكان برقم واحد، رغم اختلافاتها الكمية في الوحدات الفردية من السكان، وتعبر عن ما هو مشترك بين جميع وحدات السكان قيد الدراسة . وهكذا، من خلال خصائص وحدة من السكان، فإنها تميز جميع السكان ككل.

ترتبط القيم المتوسطة بقانون الأعداد الكبيرة. جوهر هذا الارتباط هو أنه أثناء حساب المتوسط، فإن الانحرافات العشوائية للقيم الفردية، بسبب عمل قانون الأعداد الكبيرة، تلغي بعضها البعض ويتم الكشف عن اتجاه التطور الرئيسي والضرورة والنمط في المتوسط. تتيح لك القيم المتوسطة مقارنة المؤشرات المتعلقة بالسكان بأعداد مختلفة من الوحدات.

في الظروف الحديثة لتطور علاقات السوق في الاقتصاد، تعمل المتوسطات كأداة لدراسة الأنماط الموضوعية للظواهر الاجتماعية والاقتصادية. ومع ذلك، في التحليل الاقتصادي، لا يمكن للمرء أن يقتصر على المؤشرات المتوسطة فقط، لأن المتوسطات المواتية العامة قد تخفي عيوبًا خطيرة كبيرة في أنشطة الكيانات الاقتصادية الفردية، وبراعم كيان تقدمي جديد. على سبيل المثال، فإن توزيع السكان حسب الدخل يجعل من الممكن تحديد تشكيل مجموعات اجتماعية جديدة. لذلك، إلى جانب البيانات الإحصائية المتوسطة، من الضروري مراعاة خصائص الوحدات الفردية من السكان.

والقيمة المتوسطة هي محصلة جميع العوامل المؤثرة على الظاهرة محل الدراسة. أي أنه عند حساب القيم المتوسطة، يتم إلغاء تأثير العوامل العشوائية (الاضطراب، الفردي)، وبالتالي، من الممكن تحديد النمط المتأصل في الظاهرة قيد الدراسة. وأكد أدولف كويتيليت أن أهمية طريقة المتوسطات هي إمكانية الانتقال من الفرد إلى العام، ومن العشوائي إلى المنتظم، ووجود المتوسطات هو فئة من الواقع الموضوعي.

تدرس الإحصائيات الظواهر والعمليات الجماعية. كل من هذه الظواهر لها خصائص مشتركة للمجموعة بأكملها وخصائص فردية خاصة. الفرق بين الظواهر الفرديةيسمى الاختلاف. خاصية أخرى للظواهر الجماعية هي التشابه المتأصل في خصائص الظواهر الفردية. لذلك، فإن تفاعل عناصر المجموعة يؤدي إلى الحد من اختلاف جزء من خصائصها على الأقل. وهذا الاتجاه موجود بشكل موضوعي. وفي موضوعيته يكمن السبب في الاستخدام الأوسع للقيم المتوسطة في الممارسة العملية والنظرية.

متوسط ​​القيمة في الإحصاء هو مؤشر عام يصف المستوى النموذجي لظاهرة ما في ظروف محددة من المكان والزمان، ويعكس قيمة خاصية متفاوتة لكل وحدة من السكان المتجانسين نوعيا.

في الممارسة الاقتصادية، يتم استخدام مجموعة واسعة من المؤشرات، والتي يتم حسابها كقيم متوسطة.

باستخدام طريقة المتوسطات، تحل الإحصائيات العديد من المشكلات.

تكمن الأهمية الرئيسية للمتوسطات في وظيفتها التعميمية، أي استبدال العديد من القيم الفردية المختلفة للخاصية بقيمة متوسطة تميز مجموعة الظواهر بأكملها.

إذا كانت القيمة المتوسطة تعمم قيمًا متجانسة نوعيًا لخاصية ما، فهي خاصية نموذجية للخاصية في مجموعة سكانية معينة.

ومع ذلك، فمن غير الصحيح اختزال دور القيم المتوسطة فقط في خصائص القيم النموذجية للخصائص المتجانسة هذه الخاصيةتجمعات. من الناحية العملية، تستخدم الإحصاءات الحديثة في كثير من الأحيان القيم المتوسطة التي تعمم الظواهر المتجانسة بشكل واضح.

متوسط ​​الدخل القومي للفرد، ومتوسط ​​إنتاج الحبوب في جميع أنحاء البلاد، ومتوسط ​​استهلاك مختلف المنتجات الغذائية - هذه هي خصائص الدولة كنظام اقتصادي واحد، وهذا ما يسمى بمتوسطات النظام.

يمكن لمتوسطات النظام أن تميز كلاً من الأنظمة المكانية أو الكائنية الموجودة في وقت واحد (الحالة، الصناعة، المنطقة، كوكب الأرض، إلخ) والأنظمة الديناميكية الممتدة بمرور الوقت (السنة، العقد، الموسم، إلخ).

وأهم خاصية للقيمة المتوسطة هي أنها تعكس ما هو مشترك بين جميع وحدات السكان قيد الدراسة. تتقلب قيم السمات للوحدات الفردية من السكان في اتجاه أو آخر تحت تأثير العديد من العوامل، من بينها قد يكون هناك عوامل أساسية وعشوائية. على سبيل المثال، يتم تحديد سعر سهم الشركة ككل حسب وضعها المالي. وفي الوقت نفسه، في أيام معينة وفي بورصات معينة، قد يتم بيع هذه الأسهم، بسبب الظروف السائدة، بسعر أعلى أو أقل. جوهر المتوسط ​​هو أنه يلغي انحرافات القيم المميزة للوحدات الفردية من السكان الناجمة عن عمل العوامل العشوائية، ويأخذ في الاعتبار التغيرات الناجمة عن عمل العوامل الرئيسية. وهذا يسمح للمتوسط ​​أن يعكس المستوى النموذجي للسمة ويستخلص من الخصائص الفردية المتأصلة في الوحدات الفردية.

يعد حساب المتوسط ​​أحد أساليب التعميم الأكثر شيوعًا؛ ويعكس المؤشر المتوسط ​​ما هو شائع (نموذجي) لجميع وحدات السكان محل الدراسة، بينما يتجاهل في الوقت نفسه الاختلافات بين الوحدات الفردية. في كل ظاهرة وتطورها هناك مزيج من الصدفة والضرورة.

المتوسط ​​هو خاصية موجزة لقوانين العملية في الظروف التي تحدث فيها.

يميز كل متوسط ​​السكان قيد الدراسة وفقًا لخاصية واحدة، ولكن لتوصيف أي مجتمع ووصف سماته النموذجية وخصائصه النوعية، هناك حاجة إلى نظام للمؤشرات المتوسطة. لذلك، في ممارسة الإحصاءات المحلية، لدراسة الظواهر الاجتماعية والاقتصادية، كقاعدة عامة، يتم حساب نظام متوسط ​​المؤشرات. لذلك، على سبيل المثال، يتم تقييم مؤشر متوسط ​​الأجر مع مؤشرات متوسط ​​الإنتاج، ونسبة رأس المال إلى العمل، ونسبة الطاقة إلى العمل، ودرجة الميكنة وأتمتة العمل، وما إلى ذلك.

وينبغي حساب المتوسط ​​مع الأخذ بعين الاعتبار المحتوى الاقتصادي للمؤشر قيد الدراسة. لذلك، بالنسبة لمؤشر محدد يستخدم في التحليل الاجتماعي والاقتصادي، يمكن حساب قيمة حقيقية واحدة فقط للمتوسط ​​بناءً على الطريقة العلمية للحساب.

تعد القيمة المتوسطة من أهم المؤشرات الإحصائية المعممة، حيث تميز مجموعة من الظواهر المتشابهة وفقا لبعض الخصائص المتباينة كميا. المتوسطات في الإحصاء هي مؤشرات عامة، أرقام تعبر عن الأبعاد المميزة النموذجية للظواهر الاجتماعية وفقا لخاصية واحدة متغيرة كميا.

أنواع المتوسطات

تختلف أنواع القيم المتوسطة بشكل أساسي في أي خاصية، وما هي معلمة الكتلة المتغيرة الأولية للقيم الفردية للسمة التي يجب أن تظل دون تغيير.

المتوسط ​​الحسابي

المتوسط ​​الحسابي هو متوسط ​​​​قيمة الخاصية، والتي يظل أثناء حسابها الحجم الإجمالي للخاصية في المجموع دون تغيير. وإلا يمكننا القول أن المتوسط الكمية الحسابية- حد أوسط. عند حسابها، يتم توزيع الحجم الإجمالي للسمة عقليا بالتساوي بين جميع وحدات السكان.

ويستخدم الوسط الحسابي إذا كانت قيم الخاصية التي يتم حساب متوسطها (x) وعدد الوحدات السكانية ذات القيمة المميزة المحددة (f) معروفة.

يمكن أن يكون المتوسط ​​الحسابي بسيطًا أو مرجحًا.

الوسط الحسابي البسيط

يتم استخدام Simple إذا كانت كل قيمة للسمة x تحدث مرة واحدة، أي. لكل x تكون قيمة السمة f=1، أو إذا لم يتم ترتيب البيانات المصدر وكان عدد الوحدات التي لها قيم سمات معينة غير معروف.

صيغة الوسط الحسابي بسيطة:

أين القيمة المتوسطة؟ x - قيمة الخاصية المتوسطة (المتغير)، - عدد وحدات السكان محل الدراسة.

المتوسط ​​الحسابي المرجح

على عكس المتوسط ​​البسيط، يتم استخدام المتوسط ​​الحسابي المرجح إذا حدثت كل قيمة للسمة x عدة مرات، أي. لكل قيمة للميزة f≠1. يستخدم هذا المتوسط ​​على نطاق واسع في حساب المتوسط ​​بناءً على سلسلة توزيع منفصلة:

حيث هو عدد المجموعات، x هي قيمة الخاصية التي يتم حساب متوسطها، f هو وزن القيمة المميزة (التكرار، إذا كان f هو عدد الوحدات في المجتمع؛ التكرار، إذا كان f هو نسبة الوحدات ذات الخيار x في الحجم الإجمالي للسكان).

الوسط التوافقي

إلى جانب الوسط الحسابي، تستخدم الإحصائيات الوسط التوافقي، وهو معكوس الوسط الحسابي للقيم العكسية للسمة. مثل الوسط الحسابي، يمكن أن يكون بسيطًا ومرجحًا. يتم استخدامه عندما لا يتم تحديد الأوزان اللازمة (f i) في البيانات الأولية بشكل مباشر، ولكن يتم تضمينها كعامل في أحد المؤشرات المتاحة (أي عندما يكون بسط النسبة الأولية للمتوسط ​​معروفًا، ولكن مقامه غير معروف).

التوافقي يعني المرجح

المنتج xf يعطي حجم الخاصية المتوسطة x لمجموعة من الوحدات ويرمز له بـ w. إذا كانت البيانات المصدر تحتوي على قيم الخاصية x التي يتم متوسطها وحجم الخاصية التي يتم متوسطها w، فسيتم استخدام الطريقة الموزونة التوافقية لحساب المتوسط:

حيث x هي قيمة الخاصية المتوسطة x (المتغير)؛ ث - وزن المتغيرات x، حجم الخاصية المتوسطة.

الوسط التوافقي غير المرجح (البسيط)

هذا النموذج المتوسط، الذي يستخدم بشكل أقل تكرارًا، لديه العرض التالي:

حيث x هي قيمة الخاصية التي يتم حساب متوسطها؛ ن – عدد قيم x.

أولئك. هذا هو مقلوب الوسط الحسابي البسيط للقيم المتبادلة للسمة.

ومن الناحية العملية، نادرا ما يستخدم الوسط البسيط التوافقي في الحالات التي تكون فيها قيم w للوحدات السكانية متساوية.

يعني مربع ويعني مكعب

في عدد من الحالات في الممارسة الاقتصادية، هناك حاجة لحساب متوسط ​​حجم الخاصية، معبرًا عنه بوحدات قياس مربعة أو مكعبة. ثم يتم استخدام متوسط ​​المربع (على سبيل المثال، لحساب متوسط ​​حجم المقاطع الجانبية والمربعة، ومتوسط ​​أقطار الأنابيب، والجذوع، وما إلى ذلك) ومتوسط ​​المكعب (على سبيل المثال، عند تحديد متوسط ​​طول الجانب و مكعبات).

إذا كان من الضروري، عند استبدال القيم الفردية للخاصية بقيمة متوسطة، الحفاظ على مجموع مربعات القيم الأصلية دون تغيير، فسيكون المتوسط ​​قيمة متوسطة تربيعية، بسيطة أو مرجحة.

مربع متوسط ​​بسيط

يتم استخدام Simple إذا كانت كل قيمة للسمة x تحدث مرة واحدة، وبشكل عام يكون لها النموذج:

أين هو مربع قيم الخاصية التي يتم حساب متوسطها؛ - عدد الوحدات في السكان.

مربع المتوسط ​​المرجح

يتم تطبيق مربع المتوسط ​​المرجح إذا حدثت كل قيمة للخاصية المتوسطة x مرات:

,

حيث f هو وزن الخيارات x.

مكعب متوسط ​​بسيط ومرجح

متوسط ​​​​العدد الأولي المكعب هو الجذر التكعيبي لحاصل قسمة مجموع مكعبات قيم السمات الفردية على عددها:

أين هي قيم السمة، n هو رقمها.

متوسط ​​الوزن المكعب:

,

حيث f هو وزن الخيارات x.

الوسائل المربعة والمكعبة لها استخدام محدود في الممارسة الإحصائية. يتم استخدام إحصائية المربع المتوسط ​​على نطاق واسع، ولكن ليس من الخيارات نفسها x , وعن انحرافاتها عن المتوسط ​​عند حساب مؤشرات التباين.

ولا يمكن حساب المتوسط ​​للجميع، بل لجزء من وحدات السكان. ومن الأمثلة على هذا المتوسط ​​يمكن أن يكون المتوسط ​​التدريجي باعتباره أحد المتوسطات الجزئية، الذي لا يحسب للجميع، ولكن فقط "للأفضل" (على سبيل المثال، للمؤشرات الأعلى أو الأدنى من المتوسطات الفردية).

المتوسط ​​الهندسي

إذا كانت قيم الخاصية التي يتم حساب متوسطها تختلف بشكل كبير عن بعضها البعض أو يتم تحديدها بواسطة معاملات (معدلات النمو، مؤشرات الأسعار)، يتم استخدام الوسط الهندسي للحساب.

يتم حساب الوسط الهندسي عن طريق استخراج جذر الدرجة ومن منتجات القيم الفردية - متغيرات الخاصية العاشر:

حيث n هو عدد الخيارات؛ ف - علامة المنتج.

معظم تطبيق واسعتم الحصول على الوسط الهندسي لتحديد متوسط ​​معدل التغير في السلسلة الديناميكية وكذلك في سلسلة التوزيع.

القيم المتوسطة هي مؤشرات عامة يتم فيها التعبير عن تأثير الظروف العامة ونمط الظاهرة محل الدراسة. يتم حساب المتوسطات الإحصائية على أساس البيانات الجماعية من المراقبة الجماعية المنظمة إحصائيًا بشكل صحيح (مستمر أو عينة). ومع ذلك، فإن المتوسط ​​الإحصائي سيكون موضوعيا ونموذجيا إذا تم حسابه من البيانات الجماعية لسكان متجانسين نوعيا (الظواهر الجماعية). يجب أن ينطلق استخدام المتوسطات من الفهم الجدلي لفئات العام والفرد والكتلة والفرد.

إن الجمع بين الوسائل العامة والوسائل الجماعية يجعل من الممكن الحد من المجموعات السكانية المتجانسة نوعياً. تقسيم كتلة الأشياء التي تشكل هذه الظاهرة المعقدة أو تلك إلى متجانسة داخليًا ولكن نوعيًا مجموعات مختلفةمن خلال وصف كل مجموعة بمتوسطها، من الممكن الكشف عن احتياطيات عملية ظهور الجودة الجديدة. على سبيل المثال، يسمح لنا توزيع السكان حسب الدخل بتحديد تكوين مجموعات اجتماعية جديدة. في الجزء التحليلي، نظرنا إلى مثال معين لاستخدام القيمة المتوسطة. لتلخيص ذلك، يمكننا القول أن نطاق واستخدام المتوسطات في الإحصائيات واسع جدًا.

مهمة عملية

المهمة رقم 1

تحديد متوسط ​​سعر الشراء ومتوسط ​​سعر البيع بالدولار الأمريكي

متوسط ​​سعر الشراء

متوسط ​​معدل البيع

المهمة رقم 2

يتم عرض ديناميكيات حجم منتجات تقديم الطعام العامة في منطقة تشيليابينسك للفترة 1996-2004 في الجدول بأسعار قابلة للمقارنة (مليون روبل)

قم بتوصيل الصفين A و B. لتحليل سلسلة ديناميكيات الإنتاج المنتجات النهائيةاحسب:

1. النمو المطلق والنمو التسلسلي والقاعدي ومعدلات النمو

2. متوسط ​​الإنتاج السنوي من المنتجات النهائية

3. متوسط ​​معدل النمو السنوي والزيادة في منتجات الشركة

4. إجراء محاذاة تحليلية لسلسلة الديناميكيات وحساب التوقعات لعام 2005

5. تصوير سلسلة من الديناميكيات بيانياً

6. ارسم استنتاجًا بناءً على نتائج الديناميكيات

1) yi B = yi-y1 yi C = yi-y1

y2 ب = 2.175 – 2.04 y2 C = 2.175 – 2.04 = 0.135

y3B = 2.505 – 2.04 y3 C = 2.505 – 2.175 = 0.33

y4 ب = 2.73 – 2.04 y4 C = 2.73 – 2.505 = 0.225

y5 ب = 1.5 – 2.04 y5 C = 1.5 – 2.73 = 1.23

y6 ب = 3.34 – 2.04 y6 C = 3.34 – 1.5 = 1.84

y7 ب = 3.6 3 - 2.04 y7 C = 3.6 3 - 3.34 = 0.29

y8 ب = 3.96 – 2.04 y8 C = 3.96 – 3.63 = 0.33

y9 ب = 4.41–2.04 y9 C = 4.41 – 3.96 = 0.45

تر ب2 آر Ts2

تر ب3 آر Ts3

تر ب4 آر Ts4

تر ب5 آر Ts5

آر ب6 آر Ts6

آر ب7 آر Ts7

آر ب8 آر Ts8

آر ب9 آر Ts9

Tr B = (TprB *100%) – 100%

Tr B2 = (1.066*100%) – 100% = 6.6%

Ts3 = (1.151*100%) – 100% = 15.1%

2) ذ مليون روبل - متوسط ​​إنتاجية المنتج

2,921 + 0,294*(-4) = 2,921-1,176 = 1,745

2,921 + 0,294*(-3) = 2,921-0,882 = 2,039

(yt-y) = (1.745-2.04) = 0.087

(yt-yt) = (1.745-2.921) = 1.382

(ص-ي) = (2.04-2.921) = 0.776

TP

بواسطة

y2005=2.921+1.496*4=2.921+5.984=8.905

8,905+2,306*1,496=12,354

8,905-2,306*1,496=5,456

5,456 2005 12,354


المهمة رقم 3

وترد في الرسوم البيانية المقابلة بيانات إحصائية عن إمدادات الجملة من المواد الغذائية وغير الغذائية وشبكة تجارة التجزئة في المنطقة في عامي 2003 و2004.

وفقا للجدولين 1 و 2، فهو مطلوب

1. إيجاد الرقم القياسي العام لعرض الجملة من المنتجات الغذائية بالأسعار الفعلية.

2. إيجاد الرقم القياسي العام للحجم الفعلي لإمدادات الغذاء.

3. مقارنة المؤشرات العامة واستخلاص النتيجة المناسبة.

4. إيجاد الرقم القياسي العام لعرض المنتجات غير الغذائية بالأسعار الفعلية.

5. إيجاد الرقم القياسي العام لحجم المعروض المادي من المنتجات غير الغذائية.

6. مقارنة المؤشرات التي تم الحصول عليها واستخلاص النتائج حول المنتجات غير الغذائية.

7. إيجاد مؤشرات العرض العام الموحدة لكامل الكتلة السلعية بالأسعار الفعلية.

8. ابحث عن المؤشر العام الموحد للحجم المادي (لكامل الكتلة السلعية للسلع)؛

9. قارن بين الفهارس الموجزة الناتجة واستخلص النتيجة المناسبة.

فترة الأساس

الفترة المشمولة بالتقرير (2004)

توريدات فترة التقرير بأسعار فترة الأساس

1,291-0,681=0,61= - 39

خاتمة

في الختام، دعونا نلخص. القيم المتوسطة هي مؤشرات عامة يتم فيها التعبير عن تأثير الظروف العامة ونمط الظاهرة محل الدراسة. يتم حساب المتوسطات الإحصائية على أساس البيانات الجماعية من المراقبة الجماعية المنظمة إحصائيًا بشكل صحيح (مستمر أو عينة). ومع ذلك، فإن المتوسط ​​الإحصائي سيكون موضوعيا ونموذجيا إذا تم حسابه من البيانات الجماعية لسكان متجانسين نوعيا (الظواهر الجماعية). يجب أن ينطلق استخدام المتوسطات من الفهم الجدلي لفئات العام والفرد والكتلة والفرد.

يعكس المتوسط ​​ما هو مشترك في كل فرد، كائن واحد، بفضل هذا يتلقاه المتوسط أهمية عظيمةلتحديد الأنماط المتأصلة في الكتلة الظواهر الاجتماعيةوغير مرئية في الظواهر المعزولة.

إن انحراف الفرد عن العام هو مظهر من مظاهر عملية التنمية. وفي بعض الحالات المعزولة، قد يتم وضع عناصر جديدة ومتقدمة. في هذه الحالة، فإن العوامل المحددة، المأخوذة على خلفية القيم المتوسطة، هي التي تميز عملية التطوير. لذلك، يعكس المتوسط ​​المستوى المميز والنموذجي والحقيقي للظواهر التي تتم دراستها. وتعد خصائص هذه المستويات وتغيراتها في الزمان والمكان من المشاكل الرئيسية للمتوسطات. وهكذا، من خلال المتوسطات، على سبيل المثال، تتجلى سمة المؤسسات في مرحلة معينة من التنمية الاقتصادية؛ وتنعكس التغيرات في رفاهية السكان في متوسط ​​الأجور، ودخل الأسرة بشكل عام وللفئات الاجتماعية الفردية، ومستوى استهلاك المنتجات والسلع والخدمات.

المؤشر المتوسط ​​هو قيمة نموذجية (عادية، عادية، سائدة ككل)، ولكنها كذلك لأنها تتشكل بشكل طبيعي، الظروف الطبيعيةوجود معين ظاهرة جماعية، تعتبر ككل. ويعكس المتوسط ​​الخاصية الموضوعية لهذه الظاهرة. في الواقع، غالبًا ما توجد ظواهر منحرفة فقط، وقد لا يكون المتوسط ​​​​كظاهرة موجودًا، على الرغم من أن مفهوم نموذجية الظاهرة مستعار من الواقع. إن متوسط ​​القيمة هو انعكاس لقيمة الخاصية محل الدراسة، وبالتالي يتم قياسها بنفس البعد الخاص بهذه الخاصية. ومع ذلك، هناك طرق مختلفةالتحديد التقريبي لمستوى التوزيع السكاني لمقارنة الخصائص الموجزة التي لا يمكن مقارنتها بشكل مباشر مع بعضها البعض، على سبيل المثال الرقم المتوسطعدد السكان بالنسبة إلى الإقليم (متوسط ​​الكثافة السكانية). اعتمادًا على العامل الذي يجب إزالته، سيتم أيضًا تحديد محتوى المتوسط.

إن الجمع بين الوسائل العامة والوسائل الجماعية يجعل من الممكن الحد من المجموعات السكانية المتجانسة نوعياً. من خلال تقسيم كتلة الأشياء التي تشكل هذه الظاهرة المعقدة أو تلك إلى مجموعات متجانسة داخليًا، ولكنها مختلفة نوعيًا، وتميز كل مجموعة بمتوسطها، فمن الممكن الكشف عن احتياطيات عملية الجودة الجديدة الناشئة. على سبيل المثال، يسمح لنا توزيع السكان حسب الدخل بتحديد تكوين مجموعات اجتماعية جديدة. في الجزء التحليلي، نظرنا إلى مثال معين لاستخدام القيمة المتوسطة. لتلخيص ذلك، يمكننا القول أن نطاق واستخدام المتوسطات في الإحصائيات واسع جدًا.

فهرس

1. جوساروف، ف.م. نظرية الإحصاء حسب الجودة [النص]: كتاب مدرسي. بدل / ف.م.

دليل جوساروف للجامعات. - م، 1998

2. إيدرونوفا، ن.ن. النظرية العامة للإحصاء [النص]: كتاب مدرسي / إد. ن.ن. إيدرونوفا - م: المالية والإحصاء 2001 - 648 ص.

3. إليسيفا الثانية، يوزباشيف م.م. النظرية العامة للإحصاء [النص]: كتاب مدرسي / إد. العضو المقابل راس الثاني إليسيفا. – الطبعة الرابعة، المنقحة. وإضافية - م: المالية والإحصاء، 1999. - 480 ص: غير.

4. إفيموفا إم آر، بتروفا إي في، روميانتسيف في إن. النظرية العامة للإحصاء: [النص]: كتاب مدرسي. - م: إنفرا-م، 1996. - 416 ص.

5. رياوزوفا، ن.ن. النظرية العامة للإحصاء [النص]: كتاب مدرسي / إد. ن.ن.

رياوزوفا - م: المالية والإحصاء، 1984.


جوساروف ف.م. نظرية الإحصاء: كتاب مدرسي. دليل للجامعات. - م.، 1998.-ص60.

إليسيفا الثاني، يوزباشيف م. النظرية العامة للإحصاء. - م.، 1999.-ص76.

جوساروف ف.م. نظرية الإحصاء: كتاب مدرسي. دليل للجامعات. -م، 1998.-ص61.

وأهم خاصية للمتوسط ​​هو أنه يعكس ما هو مشترك بين جميع وحدات السكان قيد الدراسة. تختلف قيم الخصائص الفردية للوحدات السكانية تحت تأثير العديد من العوامل، من بينها قد يكون هناك عوامل أساسية وعشوائية. يكمن جوهر المتوسط ​​في حقيقة أنه يعوض بشكل متبادل الانحرافات في قيم السمة الناتجة عن عمل العوامل العشوائية، ويتراكم (يأخذ في الاعتبار) التغييرات الناجمة عن عمل العوامل الرئيسية . وهذا يسمح للمتوسط ​​أن يعكس المستوى النموذجي للسمة ويستخلص من الخصائص الفردية المتأصلة في الوحدات الفردية.

ولكي يكون المتوسط ​​ممثلا حقا، يجب أن يتم حسابه مع مراعاة مبادئ معينة.

المبادئ الأساسية لاستخدام المتوسطات.

1. يجب تحديد المتوسط ​​للسكان الذين يتكونون من وحدات متجانسة نوعيا.

2. يجب حساب المتوسط ​​لمجموعة سكانية تتكون من عدد كبير بما فيه الكفاية من الوحدات.

3. يجب حساب المتوسط ​​للسكان في ظل ظروف ثابتة (عندما لا تتغير العوامل المؤثرة أو لا تتغير بشكل كبير).

4. يجب أن يتم حساب المتوسط ​​مع الأخذ في الاعتبار المحتوى الاقتصادي للمؤشر قيد الدراسة.

يعتمد حساب معظم المؤشرات الإحصائية المحددة على استخدام:

· متوسط ​​المجموع؛

· القوة المتوسطة (التوافقية، الهندسية، الحسابية، التربيعية، المكعبة).

· متوسط ​​زمني (انظر القسم).

يمكن حساب جميع المتوسطات، باستثناء المتوسط ​​الإجمالي، بطريقتين - مرجحة أو غير مرجحة.

متوسط ​​المجموع. الصيغة المستخدمة هي:

أين ث ط= × ط* و أنا;

× ط- الخيار الأولالخاصية التي يتم حساب متوسطها؛

و أنا, - وزن أنا- الخيار الرابع.

قوة متوسطة. في منظر عامصيغة الحساب:

أين هي الدرجة ك– نوع الطاقة المتوسطة.

إن قيم المتوسطات المحسوبة على أساس متوسطات القدرة لنفس البيانات الأولية ليست هي نفسها. مع زيادة الأس k، تزداد القيمة المتوسطة المقابلة أيضًا:

متوسط ​​زمني. بالنسبة لسلسلة زمنية ثانية ذات فواصل زمنية متساوية بين التواريخ، يتم حسابها باستخدام الصيغة:

,

أين × 1و Xنقيمة المؤشر في تاريخ البداية والانتهاء.

صيغ لحساب متوسطات الطاقة

مثال. حسب الجدول. 2.1 تحتاج إلى حساب المتوسط أجوربشكل عام للشركات الثلاث.

الجدول 2.1

أجور الشركات المساهمة

شركة

عدد الصناعية إنتاجالأفراد (PPP) ، الأشخاص.

الصندوق الشهري الأجور، فرك.

متوسط الأجر,فرك.

564840

2092

332750

2750

517540

2260

المجموع

1415130

محدد صيغة الحسابيعتمد على البيانات الموجودة في الجدول. 7 هي الأصلية. وبناء على ذلك، فإن الخيارات التالية ممكنة: البيانات من العمودين 1 (عدد الموظفين) و2 (كشوف المرتبات الشهرية)؛ أو - 1 (عدد الشراكة بين القطاعين العام والخاص) و3 (متوسط ​​الراتب)؛ أو 2 (الراتب الشهري) و 3 (متوسط ​​الراتب).

في حالة توفر بيانات العمودين 1 و2 فقط. تحتوي نتائج هذه الأعمدة على القيم اللازمة لحساب المتوسط ​​المطلوب. يتم استخدام الصيغة الإجمالية المتوسطة:

في حالة توفر بيانات العمودين 1 و3 فقطفإن مقام النسبة الأصلية معروف، لكن بسطها غير معروف. ومع ذلك، يمكن الحصول على صندوق الأجور عن طريق ضرب متوسط ​​الأجر بعدد أعضاء هيئة التدريس. ولذلك، يمكن حساب المتوسط ​​الإجمالي باستخدام الصيغة المتوسط ​​الحسابي المرجح:

ويجب أن يؤخذ في الاعتبار أن الوزن ( و أنا) الخامس في بعض الحالاتقد يكون نتاج قيمتين أو حتى ثلاث قيم.

وبالإضافة إلى ذلك، يُستخدم المتوسط ​​أيضًا في الممارسة الإحصائية. حسابية غير مرجحة:

حيث n هو حجم السكان.

ويستخدم هذا المتوسط ​​عندما تكون الأوزان ( و أنا) غائبة (كل متغير من الخاصية يحدث مرة واحدة فقط) أو متساويين مع بعضهما البعض.

إذا كانت هناك بيانات من العمودين 2 و3 فقط.أي: بسط النسبة الأصلية معروف، ولكن مقامها غير معروف. ويمكن الحصول على عدد الموظفين في كل مؤسسة عن طريق قسمة الرواتب على متوسط ​​الراتب. ثم يتم حساب متوسط ​​الراتب للمؤسسات الثلاث ككل باستخدام الصيغة الوسط التوافقي المرجح:

إذا كانت الأوزان متساوية ( و أنا) يمكن حساب المتوسط ​​بواسطة الوسط التوافقي غير المرجح:

في مثالنا استخدمنا أشكال مختلفةمتوسط، ولكن حصلت على نفس الإجابة. ويرجع ذلك إلى حقيقة أنه بالنسبة لبيانات محددة في كل مرة يتم تطبيق نفس النسبة الأولية للمتوسط.

يمكن حساب المؤشرات المتوسطة باستخدام منفصلة وفاصلة سلسلة الاختلاف. وفي هذه الحالة، يتم الحساب باستخدام المتوسط ​​الحسابي المرجح. بالنسبة للسلسلة المنفصلة، ​​يتم استخدام هذه الصيغة بنفس الطريقة كما في المثال أعلاه. في سلسلة الفواصل الزمنية، يتم تحديد نقاط منتصف الفواصل الزمنية للحساب.

مثال. حسب الجدول. 2.2 نحدد مقدار متوسط ​​الدخل النقدي للفرد شهريًا في منطقة مشروطة.

الجدول 2.2

البيانات الأولية (سلسلة التغيير)

متوسط ​​نصيب الفرد من الدخل النقدي شهريا، x، فرك. عدد السكان % من المجموع/
ما يصل إلى 400 30,2
400 — 600 24,4
600 — 800 16,7
800 — 1000 10,5
1000-1200 6,5
1200 — 1600 6,7
1600 — 2000 2,7
2000 فما فوق 2,3
المجموع 100

الموضوع 5. القيم المتوسطة كمؤشرات إحصائية

مفهوم القيمة المتوسطة. نطاق المتوسطات في البحوث الإحصائية

يتم استخدام القيم المتوسطة في مرحلة معالجة وتلخيص البيانات الإحصائية الأولية التي تم الحصول عليها. ترجع الحاجة إلى تحديد القيم المتوسطة إلى حقيقة أنه بالنسبة لوحدات مختلفة من السكان قيد الدراسة القيم الفرديةمن نفس الخصائص عادة ليست هي نفسها.

حجم متوسطيسمى المؤشر الذي يميز القيمة المعممة لخاصية أو مجموعة من الخصائص في المجتمع قيد الدراسة.

إذا تمت دراسة مجموعة سكانية ذات خصائص متجانسة نوعيا، فإن القيمة المتوسطة تعمل هنا على أنها متوسط ​​نموذجي. على سبيل المثال، بالنسبة لمجموعات من العمال في صناعة معينة ذات مستوى دخل ثابت، يتم تحديد متوسط ​​الإنفاق النموذجي على الضروريات الأساسية، أي. يعمم المتوسط ​​النموذجي قيمًا متجانسة نوعيًا للسمة في مجموعة سكانية معينة، وهي حصة النفقات بين العاملين في هذه المجموعة على السلع الأساسية.

عند دراسة مجموعة سكانية ذات خصائص غير متجانسة نوعيا، قد تظهر عدم نمطية المؤشرات المتوسطة في المقدمة. هذه، على سبيل المثال، هي متوسط ​​مؤشرات الدخل القومي المنتج للفرد (مختلفة الفئات العمرية) ، متوسط ​​​​غلة الحبوب في جميع أنحاء روسيا (مناطق المناطق المناخية المختلفة ومحاصيل الحبوب المختلفة)، ومتوسط ​​​​معدلات المواليد لجميع مناطق البلاد، ومتوسط ​​​​درجات الحرارة لفترة معينة، وما إلى ذلك. هنا، تعمم القيم المتوسطة قيمًا غير متجانسة نوعيًا للخصائص أو المجاميع المكانية النظامية (المجتمع الدولي، القارة، الدولة، المنطقة، إلخ) أو المجاميع الديناميكية الممتدة عبر الزمن (قرن، عقد، سنة، موسم، إلخ). ) . تسمى هذه القيم المتوسطة متوسطات النظام.

وبالتالي فإن أهمية القيم المتوسطة تكمن في وظيفتها التعميمية. تحل القيمة المتوسطة محل عدد كبير من القيم الفردية للخاصية المميزة الخصائص العامة، متأصلة في جميع وحدات السكان. وهذا بدوره يسمح لنا بتجنب الأسباب العشوائية وتحديد الأنماط العامة للأسباب الشائعة.

أنواع القيم المتوسطة وطرق حسابها

في مرحلة المعالجة الإحصائية، يمكن وضع مجموعة متنوعة من مشاكل البحث، لحلها من الضروري اختيار المتوسط ​​المناسب. في هذه الحالة، من الضروري الاسترشاد القاعدة التالية: الكميات التي تمثل بسط ومقام المتوسط ​​يجب أن تكون مرتبطة ببعضها البعض منطقيا.

    متوسطات الطاقة;

    المتوسطات الهيكلية.

دعونا نقدم الاتفاقيات التالية:

الكميات التي يتم حساب المتوسط ​​لها؛

المتوسط، حيث يشير الشريط أعلاه إلى حدوث متوسط ​​القيم الفردية؛

التردد (تكرار القيم المميزة الفردية).

يتم اشتقاق متوسطات مختلفة من صيغة متوسط ​​القدرة العامة:

(5.1)

عندما ك = 1 - الوسط الحسابي؛ ك = -1 - الوسط التوافقي؛ ك = 0 - الوسط الهندسي؛ ك = -2 - جذر متوسط ​​التربيع.

يمكن أن تكون القيم المتوسطة بسيطة أو مرجحة. المتوسطات المرجحةهذه هي القيم التي تأخذ في الاعتبار أن بعض متغيرات قيم السمات قد تحتوي على أرقام مختلفة، وبالتالي يجب ضرب كل خيار بهذا الرقم. وبعبارة أخرى، "المقاييس" هي أعداد الوحدات الإجمالية في مجموعات مختلفة، أي. يتم "ترجيح" كل خيار حسب تردده. يسمى التردد f الوزن الإحصائيأو متوسط ​​الوزن.

المتوسط ​​الحسابي- النوع الأكثر شيوعا من المتوسط. يتم استخدامه عند إجراء الحساب على بيانات إحصائية غير مجمعة، حيث تحتاج إلى الحصول على الحد المتوسط. المتوسط ​​الحسابي هو متوسط ​​قيمة الخاصية، وعند الحصول عليها يظل الحجم الإجمالي للخاصية في المجموع دون تغيير.

صيغة الوسط الحسابي (البسيط) لها الشكل

حيث n هو حجم السكان.

على سبيل المثال، يتم حساب متوسط ​​راتب موظفي المؤسسة على أنه المتوسط ​​الحسابي:


المؤشرات المحددة هنا هي راتب كل موظف وعدد موظفي المؤسسة. عند حساب المتوسط، بقي المبلغ الإجمالي للأجور كما هو، ولكن تم توزيعه بالتساوي بين جميع الموظفين. على سبيل المثال، تحتاج إلى حساب متوسط ​​راتب العمال في شركة صغيرة توظف 8 أشخاص:

عند حساب القيم المتوسطة، يمكن تكرار القيم الفردية للخاصية التي تم حساب متوسطها، وبالتالي يتم حساب القيمة المتوسطة باستخدام البيانات المجمعة. في هذه الحالة نحن نتحدث عن استخدام المتوسط ​​الحسابي المرجح، والتي لديها النموذج

(5.3)

لذلك، نحن بحاجة إلى حساب متوسط ​​سعر السهم لبعض شركة مساهمةفي تداول البورصة. ومن المعلوم أن الصفقات تمت خلال 5 أيام (5 صفقات)، وتوزع عدد الأسهم المباعة بنسبة المبيعات على النحو التالي:

    1 - 800 أك. - 1010 فرك.

    2 - 650 ألف. - 990 فرك.

    3 - 700 أك. - 1015 فرك.

    4 - 550 أك. - 900 فرك.

    5 - 850 أك. - 1150 فرك.

النسبة الأولية لتحديد متوسط ​​سعر الأسهم هي نسبة المبلغ الإجمالي للمعاملات (TVA) إلى عدد الأسهم المباعة (KPA):

OSS = 1010·800+990·650+1015·700+900·550+1150·850= 3,634,500؛

الجيش الشعبي الكوري = 800+650+700+550+850=3550.

في هذه الحالة، كان متوسط ​​سعر السهم يساوي

من الضروري معرفة خصائص المتوسط ​​الحسابي، وهو أمر مهم جدًا لاستخدامه وحسابه. يمكننا التمييز بين ثلاث خصائص رئيسية تحدد الاستخدام الواسع النطاق للمتوسط ​​الحسابي في الحسابات الإحصائية والاقتصادية.

الخاصية الأولى (صفر): مجموع الانحرافات الإيجابية للقيم الفردية للخاصية عن قيمتها المتوسطة يساوي مجموع الانحرافات السلبية. هذه خاصية مهمة جدًا، لأنها توضح أن أي انحرافات (+ و-) ناتجة عن أسباب عشوائية سيتم إلغاؤها بشكل متبادل.

دليل:

الخاصية الثانية (الحد الأدنى): مجموع الانحرافات التربيعية للقيم الفردية للخاصية عن الوسط الحسابي أقل من أي رقم آخر (أ)، أي. هناك الحد الأدنى لعدد.

دليل.

دعونا نجمع مجموع الانحرافات التربيعية من المتغير أ:

(5.4)

للعثور على الحد الأقصى لهذه الدالة، من الضروري مساواة مشتقتها بالنسبة إلى صفر:

ومن هنا نحصل على:

(5.5)

ونتيجة لذلك، يتم تحقيق الحد الأقصى لمجموع الانحرافات التربيعية عند . هذا الحد الأقصى هو الحد الأدنى، حيث لا يمكن أن يكون للدالة حد أقصى.

الخاصية الثالثة: الوسط الحسابي لقيمة ثابتة يساوي هذا الثابت: for a = const.

إلى جانب هؤلاء الثلاثة أهم الخصائصالحسابي يعني أن هناك ما يسمى خصائص التصميموالتي تفقد أهميتها تدريجياً بسبب استخدام تكنولوجيا الكمبيوتر الإلكترونية:

    إذا تم ضرب القيمة الفردية لخاصية كل وحدة أو قسمتها على عدد ثابت، فإن الوسط الحسابي سيزيد أو ينقص بنفس المقدار؛

    لن يتغير الوسط الحسابي إذا تم تقسيم وزن (تكرار) كل قيمة سمة على رقم ثابت؛

    فإذا نقصت أو زادت القيم الفردية لخاصية كل وحدة بنفس المقدار، فإن الوسط الحسابي سينقص أو يزيد بنفس المقدار.

الوسط التوافقي. ويسمى هذا المتوسط ​​بالمتوسط ​​الحسابي العكسي لأن هذه القيمة تستخدم عندما يكون k = -1.

الوسط التوافقي البسيطيتم استخدامه عندما تكون أوزان قيم السمات هي نفسها. يمكن استخلاص صيغتها من الصيغة الأساسية عن طريق استبدال k = -1:

على سبيل المثال، نحن بحاجة إلى حساب متوسط ​​السرعةسارت سيارتان على نفس المسار ولكن بسرعات مختلفة: الأولى بسرعة 100 كم/ساعة، والثانية بسرعة 90 كم/ساعة. وباستخدام طريقة الوسط التوافقي نحسب السرعة المتوسطة:

في الممارسة الإحصائية، يتم استخدام الموزون التوافقي في كثير من الأحيان، والذي تكون صيغته بالشكل

تُستخدم هذه الصيغة في الحالات التي تكون فيها الأوزان (أو أحجام الظواهر) لكل سمة غير متساوية. في العلاقة الأولية لحساب المتوسط، يكون البسط معروفًا، ولكن المقام غير معروف.