Средно квадратно уравнение. Освен това разграничете

При статистическа проверка на хипотези, при измерване на линейна връзка между случайни величини.

Стандартно отклонение:

Стандартно отклонение(оценка на стандартното отклонение на произволната променлива Под, стени около нас и таван, хспрямо неговото математическо очакване, базирано на безпристрастна оценка на неговата дисперсия):

където - дисперсия; - Подът, стените около нас и таванът, и-ти елемент на проба; - размер на извадката; - средноаритметично на извадката:

Трябва да се отбележи, че и двете оценки са предубедени. В общия случай е невъзможно да се направи безпристрастна оценка. Въпреки това, оценка, базирана на безпристрастна оценка на дисперсията, е последователна.

правило три сигма

правило три сигма() - почти всички стойности на нормално разпределена случайна променлива се намират в интервала. По-строго - с не по-малко от 99,7% сигурност, стойността на нормално разпределена случайна променлива се намира в посочения интервал (при условие, че стойността е вярна, а не е получена в резултат на обработка на извадката).

Ако истинската стойност е неизвестна, тогава трябва да използвате не, а пода, стените около нас и тавана, с. По този начин правилото на трите сигми се превежда в правилото на трите етажа, стените около нас и тавана, с .

Интерпретация на стойността на стандартното отклонение

Голяма стойност на стандартното отклонение показва голямо разпределение на стойностите в представения набор със средната стойност на набора; малка стойност, съответно, показва, че стойностите в набора са групирани около средната стойност.

Например, имаме три набора от числа: (0, 0, 14, 14), (0, 6, 8, 14) и (6, 6, 8, 8). И трите набора имат средни стойности от 7 и стандартни отклонения съответно 7, 5 и 1. Последният набор има малко стандартно отклонение, тъй като стойностите в набора са групирани около средната стойност; първият набор има най-голямата стойност на стандартното отклонение - стойностите в рамките на набора силно се отклоняват от средната стойност.

В общ смисъл стандартното отклонение може да се счита за мярка за несигурност. Например във физиката стандартното отклонение се използва за определяне на грешката на серия от последователни измервания на някаква величина. Тази стойност е много важна за определяне на правдоподобността на изследваното явление в сравнение със стойността, предвидена от теорията: ако средната стойност на измерванията се различава значително от стойностите, предвидени от теорията (голямо стандартно отклонение), тогава получените стойности или методът за получаването им трябва да бъдат проверени отново.

Практическа употреба

На практика стандартното отклонение ви позволява да определите колко стойностите в комплекта могат да се различават от средната стойност.

Климат

Да предположим, че има два града с еднаква средна дневна максимална температура, но единият се намира на брега, а другият е във вътрешността на страната. Известно е, че крайбрежните градове имат много различни дневни максимални температури, по-ниски от тези във вътрешните градове. Следователно стандартното отклонение на максималните дневни температури в крайбрежния град ще бъде по-малко, отколкото във втория град, въпреки факта, че средната стойност на тази стойност е една и съща за тях, което на практика означава, че вероятността максималният въздух температурата на всеки конкретен ден от годината ще бъде по-силна, различна от средната стойност, по-висока за град, разположен вътре в континента.

Спорт

Да приемем, че има няколко футболни отбора, които са класирани по някакъв набор от параметри, например брой отбелязани и допуснати голове, шансове за гол и т.н. Най-вероятно е най-добрият отбор в тази група да има най-добрия стойности в повече параметри. Колкото по-малко е стандартното отклонение на отбора за всеки от представените параметри, толкова по-предвидим е резултатът на отбора, такива отбори са балансирани. От друга страна, отбор с голямо стандартно отклонение трудно може да предвиди резултата, което от своя страна се обяснява с дисбаланс, например силна защита, но слаба атака.

Използването на стандартното отклонение на параметрите на отбора позволява до известна степен да се предвиди резултатът от мача между два отбора, като се оценяват силните и слабите страни на отборите, а оттам и избраните методи на борба.

Технически анализ

Вижте също

литература

* Боровиков, В.СТАТИСТИКА. Изкуството на компютърния анализ на данни: За професионалисти / В. Боровиков. - Санкт Петербург. : Петър, 2003. - 688 с. - ISBN 5-272-00078-1.

Стандартното отклонение е класически индикатор за вариабилност от описателната статистика.

Стандартно отклонение, стандартно отклонение, RMS, извадково стандартно отклонение (английски стандартно отклонение, STD, STDev) е много често срещана мярка за дисперсия в описателната статистика. Но защото техническият анализ е подобен на статистиката, този индикатор може (и трябва) да се използва в техническия анализ за откриване на степента на дисперсия на цената на анализирания инструмент във времето. Обозначава се с гръцкия символ Сигма "σ".

Благодарим на Карл Гаус и Пиърсън за това, че имаме възможността да използваме стандартното отклонение.

Използвайки стандартно отклонение в техническия анализ, обръщаме това "индекс на разсейване"индикатор за волатилност„Запазване на значението, но промяна на термините.

Какво е стандартно отклонение

Но в допълнение към междинните спомагателни изчисления, стандартното отклонение е напълно приемливо за самостоятелно изчисляванеи приложения в техническия анализ. Както отбеляза активен читател на нашето списание репей, „ Все още не разбирам защо RMS не е включен в набора от стандартни индикатори на вътрешните дилинг центрове«.

Наистина ли, стандартното отклонение може по класически и "чист" начин да измерва променливостта на инструмент. Но за съжаление този индикатор не е толкова често срещан в анализа на ценни книжа.

Прилагане на стандартното отклонение

Ръчното изчисляване на стандартното отклонение не е много интересно.но полезно за опит. Стандартното отклонение може да бъде изразеноформула STD=√[(∑(x-x ) 2)/n] , която звучи като коренната сума на квадратните разлики между извадковите елементи и средната стойност, разделена на броя на елементите в извадката.

Ако броят на елементите в извадката надвишава 30, тогава знаменателят на фракцията под корена придобива стойност n-1. В противен случай се използва n.

стъпка по стъпка изчисляване на стандартното отклонение:

  1. изчислете средноаритметичната стойност на извадката от данни
  2. извадете тази средна стойност от всеки елемент от извадката
  3. всички получени разлики са на квадрат
  4. сумирайте всички получени квадрати
  5. разделете получената сума на броя на елементите в извадката (или на n-1, ако n>30)
  6. изчислете квадратния корен от полученото частно (нареч дисперсия)

Мъдрите математици и статистици излязоха с по-надежден индикатор, макар и с малко по-различна цел - средно линейно отклонение. Този индикатор характеризира мярката за разпространение на стойностите на набора от данни около тяхната средна стойност.

За да покажете мярката на разпространението на данните, първо трябва да определите спрямо какво ще се счита този спред - обикновено това е средната стойност. След това трябва да изчислите колко далеч стойностите на анализирания набор от данни са далеч от средните. Ясно е, че всяка стойност съответства на определено отклонение, но ние също се интересуваме от обща оценка, обхващаща цялата съвкупност. Следователно средното отклонение се изчислява по формулата на обичайното средноаритметично. Но! Но за да се изчисли средната стойност на отклоненията, те първо трябва да се добавят. И ако добавим положителни и отрицателни числа, те ще се отменят взаимно и тяхната сума ще клони към нула. За да се избегне това, всички отклонения се вземат по модул, тоест всички отрицателни числа стават положителни. Сега средното отклонение ще покаже обобщена мярка за разпространението на стойностите. В резултат на това средното линейно отклонение ще бъде изчислено по формулата:

ае средното линейно отклонение,

х- анализирания индикатор, с тире отгоре - средната стойност на индикатора,

не броят на стойностите в анализирания набор от данни,

операторът за сумиране, надявам се, не плаши никого.

Средното линейно отклонение, изчислено по посочената формула, отразява средното абсолютно отклонение от средната стойност за тази съвкупност.

Червената линия на снимката е средната стойност. Отклоненията на всяко наблюдение от средната стойност са обозначени с малки стрелки. Те се вземат по модул и се сумират. След това всичко се разделя на броя на стойностите.

За да завършите картината, трябва да дадете още един пример. Да кажем, че има фирма, която произвежда резници за лопати. Всеки изрез трябва да е дълъг 1,5 метра, но по-важното е, че всички трябва да са еднакви или поне плюс-минус 5 см. Небрежните работници обаче ще отрежат 1,2 м, след това 1,8 м. . Директорът на фирмата реши да направи статистически анализ на дължината на разрезите. Избрах 10 броя и измерих дължината им, намерих средното и изчислих средното линейно отклонение. Средното се оказа точно - 1,5 м. Но средното линейно отклонение се оказа 0,16 м. Така се оказва, че всеки разрез е по-дълъг или по-къс от необходимото средно с 16 см. Има какво да говорим с работниците . Всъщност не съм виждал реалното използване на този индикатор, затова сам излязох с пример. В статистиката обаче има такъв показател.

Дисперсия

Подобно на средното линейно отклонение, дисперсията също отразява степента, до която данните се разпространяват около средната стойност.

Формулата за изчисляване на дисперсията изглежда така:

(за серии от вариации (претеглена дисперсия))

(за негрупирани данни (проста вариация))

Където: σ 2 - дисперсия, Xi– анализираме индикатора sq (стойност на характеристиките), – средната стойност на индикатора, f i – броя на стойностите в анализирания набор от данни.

Дисперсията е средният квадрат на отклоненията.

Първо се изчислява средната стойност, след което разликата между всяка базова и средна стойност се взема, квадратира се, умножава се по честотата на съответната стойност на характеристиката, добавя се и след това се разделя на броя на стойностите в популацията.

Въпреки това, в чиста форма, като например средноаритметичната стойност или индекс, дисперсията не се използва. Това е по-скоро спомагателен и междинен индикатор, който се използва за други видове статистически анализи.

Опростен начин за изчисляване на дисперсията

стандартно отклонение

За да се използва дисперсията за анализ на данните, от нея се взема корен квадратен. Оказва се т.нар стандартно отклонение.

Между другото, стандартното отклонение се нарича още сигма - от гръцката буква, която го обозначава.

Стандартното отклонение очевидно също характеризира мярката за дисперсия на данните, но сега (за разлика от дисперсията) може да се сравни с оригиналните данни. По правило средноквадратните показатели в статистиката дават по-точни резултати от линейните. Следователно стандартното отклонение е по-точна мярка за разсейване на данните от средното линейно отклонение.

Приблизителен метод за оценка на флуктуацията на вариационна серия е определянето на границата и амплитудата, но стойностите на варианта в серията не се вземат предвид. Основната общоприета мярка за флуктуацията на даден количествен признак в рамките на диапазона от вариации е стандартно отклонение (σ - сигма). Колкото по-голямо е стандартното отклонение, толкова по-висока е степента на флуктуация на тази серия.

Методът за изчисляване на стандартното отклонение включва следните стъпки:

1. Намерете средноаритметичната стойност (M).

2. Определете отклоненията на отделните опции от средноаритметичната стойност (d=V-M). В медицинската статистика отклоненията от средната стойност се обозначават с d (отклонение). Сумата от всички отклонения е равна на нула.

3. Квадратирайте всяко отклонение d 2 .

4. Умножете квадратните отклонения по съответните честоти d 2 *p.

5. Намерете сбора от произведения å(d 2 *p)

6. Изчислете стандартното отклонение по формулата:

Когато n е по-голямо от 30 или когато n е по-малко или равно на 30, където n е броят на всички опции.

Стойността на стандартното отклонение:

1. Стандартното отклонение характеризира разпространението на варианта спрямо средната стойност (т.е. флуктуацията на вариационния ред). Колкото по-голяма е сигмата, толкова по-висока е степента на разнообразие на тази серия.

2. Стандартното отклонение се използва за сравнителна оценка на степента на съответствие на средноаритметичната стойност с вариационния ред, за който е изчислена.

Вариациите на масовите явления се подчиняват на закона за нормалното разпределение. Кривата, представяща това разпределение, има формата на гладка камбановидна симетрична крива (крива на Гаус). Според теорията на вероятността при явления, които се подчиняват на закона за нормалното разпределение, съществува строга математическа връзка между стойностите на средната аритметична стойност и стандартното отклонение. Теоретичното разпределение на вариант в хомогенна серия от вариации се подчинява на правилото три сигма.

Ако в системата от правоъгълни координати по оста на абсцисата са нанесени стойностите на количествения признак (опции), а по оста на ординатата - честотата на поява на варианта във вариационния ред, тогава варианти с по-големи и по-малки стойности са разположени равномерно по страните на средноаритметичната стойност.



Установено е, че при нормално разпределение на признака:

68,3% от стойностите на варианта са в рамките на М±1s

95,5% от стойностите на варианта са в рамките на M±2s

99,7% от стойностите на варианта са в рамките на M±3s

3. Стандартното отклонение ви позволява да зададете нормалните стойности за клинични и биологични параметри. В медицината интервалът M ± 1s обикновено се приема извън нормалните граници за изследваното явление. Отклонението на изчислената стойност от средноаритметичната стойност с повече от 1s показва отклонението на изследвания параметър от нормата.

4. В медицината правилото на три сигма се използва в педиатрията за индивидуална оценка на нивото на физическо развитие на децата (метод на сигма отклонения), за разработване на стандарти за детско облекло

5. Стандартното отклонение е необходимо за характеризиране на степента на разнообразие на изследваната черта и изчисляване на грешката на средноаритметичната стойност.

Стойността на стандартното отклонение обикновено се използва за сравняване на флуктуациите на един и същи тип серии. Ако се сравняват два реда с различни характеристики (височина и тегло, средна продължителност на болничния престой и болнична смъртност и т.н.), тогава директното сравнение на размерите на сигма е невъзможно. , защото стандартно отклонение - именувана стойност, изразена в абсолютни числа. В тези случаи прилагайте коефициент на вариация (Cv), което е относителна стойност: процентът на стандартното отклонение към средноаритметичната стойност.

Коефициентът на вариация се изчислява по формулата:

Колкото по-висок е коефициентът на вариация , толкова по-голяма е променливостта на тази серия. Смята се, че коефициентът на вариация над 30% показва качествената хетерогенност на популацията.

Според извадковото проучване вложителите са групирани според размера на депозита в Сбербанк на града:

Определете:

1) диапазон на вариации;

2) среден размер на депозита;

3) средно линейно отклонение;

4) дисперсия;

5) стандартно отклонение;

6) коефициент на вариация на вноските.

Решение:

Тази серия за разпространение съдържа отворени интервали. В такива серии стойността на интервала от първата група условно се приема, че е равна на стойността на интервала от следващата, а стойността на интервала от последната група е равна на стойността на интервала от предишната един.

Стойността на интервала на втората група е 200, следователно стойността на първата група също е 200. Стойността на интервала на предпоследната група е 200, което означава, че последният интервал също ще има стойност, равна на 200.

1) Определете диапазона на вариация като разликата между най-голямата и най-малката стойност на атрибута:

Диапазонът на промяна в размера на приноса е 1000 рубли.

2) Средният размер на приноса се определя по формулата на средноаритметичната претеглена стойност.

Нека предварително определим дискретната стойност на атрибута във всеки интервал. За да направите това, използвайки простата формула за средноаритметично, намираме средните точки на интервалите.

Средната стойност на първия интервал ще бъде равна на:

вторият - 500 и т.н.

Нека сложим резултатите от изчисленията в таблицата:

Сума на депозита, разтривайте.Брой на сътрудниците, еСредата на интервала, xxf
200-400 32 300 9600
400-600 56 500 28000
600-800 120 700 84000
800-1000 104 900 93600
1000-1200 88 1100 96800
Обща сума 400 - 312000

Средният депозит в градската Сбербанк ще бъде 780 рубли:

3) Средното линейно отклонение е средноаритметичната стойност на абсолютните отклонения на отделните стойности на атрибута от общата средна стойност:

Процедурата за изчисляване на средното линейно отклонение в сериите на интервалното разпределение е както следва:

1. Средноаритметичната претеглена стойност се изчислява, както е показано в параграф 2).

2. Определят се абсолютните отклонения на варианта от средната стойност:

3. Получените отклонения се умножават по честотите:

4. Сборът от претеглените отклонения се намира без да се отчита знакът:

5. Сборът от претеглените отклонения се разделя на сбора от честотите:

Удобно е да използвате таблицата с изчислени данни:

Сума на депозита, разтривайте.Брой на сътрудниците, еСредата на интервала, x
200-400 32 300 -480 480 15360
400-600 56 500 -280 280 15680
600-800 120 700 -80 80 9600
800-1000 104 900 120 120 12480
1000-1200 88 1100 320 320 28160
Обща сума 400 - - - 81280

Средното линейно отклонение на размера на депозита на клиентите на Сбербанк е 203,2 рубли.

4) Дисперсията е средноаритметичната стойност на квадратните отклонения на всяка стойност на характеристиката от средната аритметична стойност.

Изчисляването на дисперсията в интервалното разпределение се извършва по формулата:

Процедурата за изчисляване на дисперсията в този случай е както следва:

1. Определете средноаритметичната претеглена стойност, както е показано в параграф 2).

2. Намерете отклонения от средната стойност:

3. Изчисляване на квадрат отклонението на всяка опция от средната стойност:

4. Умножете квадратните отклонения по тегла (честоти):

5. Обобщете получените произведения:

6. Получената сума се разделя на сумата от теглата (честоти):

Нека представим изчисленията в таблица:

Сума на депозита, разтривайте.Брой на сътрудниците, еСредата на интервала, x
200-400 32 300 -480 230400 7372800
400-600 56 500 -280 78400 4390400
600-800 120 700 -80 6400 768000
800-1000 104 900 120 14400 1497600
1000-1200 88 1100 320 102400 9011200
Обща сума 400 - - - 23040000