Statistikas datu apkopojums un grupēšana. Noteikumi diskrētu un intervālu sadalījuma rindu konstruēšanai

Veidojot intervālu sadalījuma sēriju, tiek atrisināti trīs jautājumi:

  • 1. Cik intervālus man vajadzētu veikt?
  • 2. Kāds ir intervālu garums?
  • 3. Kāda ir kārtība populācijas vienību iekļaušanai intervālu robežās?
  • 1. Intervālu skaits var noteikt pēc Stērdžesa formula:

2. Intervāla garums vai intervāla solis, parasti nosaka pēc formulas

Kur R- variāciju diapazons.

3. Iedzīvotāju vienību iekļaušanas secība intervāla robežās

var būt dažādi, bet, veidojot intervālu virkni, sadalījumam ir jābūt stingri noteiktam.

Piemēram, šis: [), kurā populācijas vienības ir iekļautas apakšējās robežās, bet netiek iekļautas augšējās robežās, bet tiek pārsūtītas uz nākamo intervālu. Izņēmums no šī noteikuma ir pēdējais intervāls, kura augšējā robeža ietver ranga sērijas pēdējo numuru.

Intervālu robežas ir:

  • slēgts - ar divām atribūta galējām vērtībām;
  • atvērts - ar vienu atribūta galējo vērtību (pirms tāds un tāds numurs vai beidzies tāds un tāds numurs).

Lai apgūtu teorētisko materiālu, mēs ievadām fona informācija risinājumiem gala līdz galam uzdevums.

Ir nosacīti dati par vidējo pārdošanas vadītāju skaitu, viņu pārdoto līdzīgu preču daudzumu, šī produkta individuālo tirgus cenu, kā arī 30 uzņēmumu pārdošanas apjomu vienā no Krievijas Federācijas reģioniem pirmajā. pārskata gada ceturksnī (2.1. tabula).

2.1. tabula

Sākotnējā informācija transversālam uzdevumam

Numurs

menedžeri,

Cena, tūkstoši rubļu

Pārdošanas apjoms, miljoni rubļu.

Numurs

menedžeri,

Pārdoto preču daudzums, gab.

Cena, tūkstoši rubļu

Pārdošanas apjoms, miljoni rubļu.

Pamatojoties uz sākotnējo informāciju, kā arī papildu informāciju, mēs uzstādīsim individuālus uzdevumus. Pēc tam iepazīstināsim ar to risināšanas metodiku un pašiem risinājumiem.

Šķērsgriezuma uzdevums. Uzdevums 2.1

Izmantojot avota datus no tabulas. Nepieciešams 2.1 izveidot diskrētu uzņēmumu sadalījuma sēriju pēc pārdoto preču daudzuma (2.2. tabula).

Risinājums:

2.2. tabula

Diskrētas uzņēmumu sadalījuma sērijas pēc pārdoto preču daudzuma vienā no Krievijas Federācijas reģioniem pārskata gada pirmajā ceturksnī

Šķērsgriezuma uzdevums. Uzdevums 2.2

nepieciešams izveidojiet 30 uzņēmumu ranžētu sēriju pēc vidējā vadītāju skaita.

Risinājums:

15; 17; 18; 20; 20; 20; 22; 22; 24; 25; 25; 25; 27; 27; 27; 28; 29; 30; 32; 32; 33; 33; 33; 34; 35; 35; 38; 39; 39; 45.

Šķērsgriezuma uzdevums. Uzdevums 2.3

Izmantojot avota datus no tabulas. 2.1, nepieciešams:

  • 1. Izveidojiet intervālu virkni uzņēmumu sadalījumam pēc vadītāju skaita.
  • 2. Aprēķināt firmu sadalījuma sērijas biežumus.
  • 3. Izdarīt secinājumus.

Risinājums:

Aprēķināsim, izmantojot Stērdžesa formulu (2.5) intervālu skaits:

Tādējādi mēs ņemam 6 intervālus (grupas).

Intervāla garums, vai intervāla solis, aprēķiniet, izmantojot formulu

Piezīme. Iedzīvotāju vienību iekļaušanas secība intervāla robežās ir šāda: I), kurā iedzīvotāju vienības tiek iekļautas apakšējās robežās, bet netiek iekļautas augšējās robežās, bet tiek pārnestas uz nākamo intervālu. Izņēmums no šī noteikuma ir pēdējais intervāls I ], kura augšējā robeža ietver sarindotās sērijas pēdējo numuru.

Mēs veidojam intervālu sēriju (2.3. tabula).

Uzņēmumu sadalījuma intervālu sērijas un vidējais vadītāju skaits vienā no Krievijas Federācijas reģioniem pārskata gada pirmajā ceturksnī

Secinājums. Lielākā uzņēmumu grupa ir grupa ar vidējo vadītāju skaitu 25-30 cilvēku, kurā ietilpst 8 firmas (27%); Mazākajā grupā ar vidējo vadītāju skaitu 40-45 cilvēki ir tikai viens uzņēmums (3%).

Izmantojot avota datus no tabulas. 2.1, kā arī uzņēmumu sadalījuma intervālu rinda pēc vadītāju skaita (2.3. tabula), nepieciešams izveidot analītisko grupējumu attiecībām starp vadītāju skaitu un uzņēmumu pārdošanas apjomu un, pamatojoties uz to, izdarīt secinājumu par saistību esamību (vai neesamību) starp šīm pazīmēm.

Risinājums:

Analītiskā grupēšana balstās uz faktoru īpašībām. Mūsu uzdevumā faktoru raksturojums (x) ir vadītāju skaits, bet rezultējošais raksturlielums (y) ir pārdošanas apjoms (2.4. tabula).

Tagad būvēsim analītiskā grupēšana(2.5. tabula).

Secinājums. Pamatojoties uz izveidotās analītiskās grupas datiem, varam teikt, ka, palielinoties pārdošanas vadītāju skaitam, palielinās arī vidējais uzņēmuma pārdošanas apjoms grupā, kas liecina par tiešu saikni starp šiem raksturlielumiem.

2.4. tabula

Palīgtabula analītiskās grupas izveidošanai

Vadītāju skaits, cilvēki,

Uzņēmuma numurs

Pārdošanas apjoms, miljoni rubļu, g

" = 59 f = 9,97

I-™ 4 - Yu.22

74 '25 1PY1

U4 = 7 = 10,61

plkst = ’ =10,31 30

2.5. tabula

Pārdošanas apjomu atkarība no uzņēmumu vadītāju skaita kādā no Krievijas Federācijas reģioniem pārskata gada pirmajā ceturksnī

KONTROLES JAUTĀJUMI
  • 1. Kāda ir statistiskā novērojuma būtība?
  • 2. Nosauciet statistiskās novērošanas posmus.
  • 3. Kādas ir statistiskās novērošanas organizatoriskās formas?
  • 4. Nosauc statistisko novērojumu veidus.
  • 5. Kas ir statistikas kopsavilkums?
  • 6. Nosauciet statistikas pārskatu veidus.
  • 7. Kas ir statistiskā grupēšana?
  • 8. Nosauciet statistisko grupējumu veidus.
  • 9. Kas ir izplatīšanas sērija?
  • 10. Nosauc sadales rindas strukturālos elementus.
  • 11. Kāda ir sadales sērijas konstruēšanas procedūra?

Ja pētāmais nejaušais lielums ir nepārtraukts, tad novēroto vērtību ranžēšana un grupēšana bieži vien neļauj noteikt tā vērtību variācijas raksturīgās pazīmes. Tas izskaidrojams ar to, ka gadījuma lieluma atsevišķas vērtības var atšķirties viena no otras tik maz, cik vēlams, un tāpēc novēroto datu kopumā reti var rasties identiskas lieluma vērtības, un gadījuma lieluma biežums. varianti maz atšķiras viens no otra.

Ir arī nepraktiski izveidot diskrētu rindu diskrētam gadījuma mainīgajam, kura iespējamo vērtību skaits ir liels. Šādos gadījumos jums vajadzētu būvēt intervālu variāciju sērijas sadales.

Lai izveidotu šādu sēriju, viss nejaušā lieluma novēroto vērtību variācijas intervāls tiek sadalīts sērijā daļējie intervāli un vērtību vērtību rašanās biežuma skaitīšana katrā daļējā intervālā.

Intervālu variāciju sērijas izsauciet sakārtotu nejauša lieluma mainīgo vērtību intervālu kopu ar atbilstošām frekvencēm vai mainīgā lieluma vērtību relatīvajām frekvencēm, kas ietilpst katrā no tām.

Lai izveidotu intervālu sēriju, jums ir nepieciešams:

  1. definēt Izmērs daļējie intervāli;
  2. definēt platums intervāli;
  3. iestatiet to katram intervālam tops Un apakšējā robeža ;
  4. sagrupējiet novērojumu rezultātus.

1 . Jautājums par grupēšanas intervālu skaita un platuma izvēli ir jāizlemj katrā konkrētajā gadījumā, pamatojoties uz mērķi pētniecība, apjoms paraugi un variācijas pakāpe raksturlielums izlasē.

Aptuvenais intervālu skaits k var novērtēt, pamatojoties tikai uz izlases lielumu n kādā no šiem veidiem:

  • saskaņā ar formulu Sturges : k = 1 + 3,32 log n ;
  • izmantojot 1. tabulu.

1. tabula

2 . Parasti priekšroka tiek dota vienāda platuma telpām. Lai noteiktu intervālu platumu h aprēķināt:

  • variāciju diapazons R - parauga vērtības: R = x max - x min ,

Kur xmax Un xmin - maksimālās un minimālās paraugu ņemšanas iespējas;

  • katra intervāla platums h nosaka pēc šādas formulas: h = R/k .

3 . Apakšējā līnija pirmais intervāls x h1 ir atlasīts tā, lai minimālā izlases opcija xmin iekrita aptuveni šī intervāla vidū: x h1 = x min - 0,5 h .

Starpposma intervāli iegūts, iepriekšējā intervāla beigām pievienojot daļējā intervāla garumu h :

x hi = x hi-1 + h.

Intervālu skalas konstruēšana, pamatojoties uz intervālu robežu aprēķinu, turpinās līdz vērtībai x sveiks apmierina attiecību:

x sveiks< x max + 0,5·h .

4 . Saskaņā ar intervālu skalu raksturīgās vērtības tiek grupētas - katram daļējam intervālam tiek aprēķināta frekvenču summa n i iekļauta opcija i th intervāls. Šajā gadījumā intervāls ietver nejaušā lieluma vērtības, kas ir lielākas vai vienādas ar apakšējo robežu un mazākas par intervāla augšējo robežu.

Daudzstūris un histogramma

Skaidrības labad tiek konstruēti dažādi statistiskā sadalījuma grafiki.

Pamatojoties uz diskrētu variāciju sērijas datiem, viņi konstruē daudzstūris frekvences vai relatīvās frekvences.

Frekvences daudzstūris x 1 ; n 1 ), (x 2 ; n 2 ), ..., (x k ; n k ). Lai izveidotu frekvenču daudzstūri, opcijas ir attēlotas uz abscisu ass. x i , un uz ordinātas - atbilstošās frekvences n i . Punkti ( x i ; n i ) savieno taisni segmenti un iegūst frekvences daudzstūri (1. att.).

Relatīvo frekvenču daudzstūris sauc par lauztu līniju, kuras segmenti savieno punktus ( x 1 ; W 1 ), (x 2 ; W 2 ), ..., (x k ; Ned ). Lai izveidotu relatīvo frekvenču daudzstūri, opcijas ir attēlotas uz abscisu ass x i , un uz ordinātas - atbilstošās relatīvās frekvences W i . Punkti ( x i ; W i ) ir savienoti ar taisniem segmentiem un tiek iegūts relatīvo frekvenču daudzstūris.

Kad nepārtraukta zīme vēlams būvēt histogramma .

Frekvences histogramma sauc par pakāpju figūru, kas sastāv no taisnstūriem, kuru pamati ir daļēji garuma intervāli h , un augstumi ir vienādi ar attiecību NIH (frekvences blīvums).

Lai izveidotu frekvenču histogrammu, uz abscisu ass tiek izlikti daļējie intervāli, un virs tiem attālumā tiek uzzīmēti segmenti, kas ir paralēli abscisu asij. NIH .

Svarīgākais posms sociāli ekonomisko parādību un procesu izpētē ir primāro datu sistematizācija un uz tā pamata visa objekta kopsavilkuma raksturojuma iegūšana, izmantojot vispārīgos rādītājus, kas tiek panākts, apkopojot un grupējot primāro statistikas materiālu.

Statistikas kopsavilkums - tas ir secīgu darbību komplekss, lai vispārinātu konkrētus atsevišķus faktus, kas veido kopumu, lai identificētu tipiskas iezīmes un modeļus, kas raksturīgi pētāmajai parādībai kopumā. Statistikas kopsavilkuma veikšana ietver šādas darbības :

  • grupēšanas raksturlielumu izvēle;
  • grupas veidošanas kārtības noteikšana;
  • statistisko rādītāju sistēmas izstrāde grupu un objekta raksturošanai kopumā;
  • statistikas tabulu izkārtojumu izstrāde kopsavilkuma rezultātu prezentēšanai.

Statistiskā grupēšana sauc par pētāmās populācijas vienību iedalījumu viendabīgās grupās pēc noteiktām tām būtiskām pazīmēm. Grupēšana ir svarīgākā statistikas metode statistikas datu apkopošanai, pamats pareizam statistisko rādītāju aprēķināšanai.

Izšķir šādus grupēšanas veidus: tipoloģisku, strukturālu, analītisku. Visus šos grupējumus vieno tas, ka objekta vienības tiek sadalītas grupās pēc kādas pazīmes.

Grupēšanas funkcija ir raksturlielums, pēc kura populācijas vienības tiek sadalītas atsevišķās grupās. Statistikas pētījuma secinājumi ir atkarīgi no pareizas grupēšanas pazīmes izvēles. Kā pamatu grupēšanai nepieciešams izmantot nozīmīgus, teorētiski pamatotus raksturlielumus (kvantitatīvos vai kvalitatīvos).

Grupēšanas kvantitatīvās īpašības ir skaitliska izteiksme (tirdzniecības apjoms, personas vecums, ģimenes ienākumi utt.), un kvalitatīvas grupēšanas pazīmes atspoguļo iedzīvotāju vienības stāvokli (dzimums, ģimenes stāvoklis, uzņēmuma nozare, tā īpašuma forma utt.).

Pēc grupēšanas pamata noteikšanas jāizlemj jautājums par to grupu skaitu, kurās pētāmā populācija ir jāiedala. Grupu skaits ir atkarīgs no pētījuma mērķiem un grupēšanas pamatā esošā rādītāja veida, populācijas apjoma un raksturlieluma variācijas pakāpes.

Piemēram, grupējot uzņēmumus pēc īpašumtiesību veida, tiek ņemts vērā pašvaldību, federālo un federālo subjektu īpašums. Ja grupēšana tiek veikta pēc kvantitatīvā kritērija, tad īpaša uzmanība jāpievērš pētāmā objekta vienību skaitam un grupēšanas raksturlieluma svārstību pakāpei.

Kad grupu skaits ir noteikts, jānosaka grupēšanas intervāli. Intervāls - tās ir dažādu raksturlielumu vērtības, kas atrodas noteiktās robežās. Katram intervālam ir sava vērtība, augšējā un apakšējā robeža vai vismaz viena no tām.

Intervāla apakšējā robeža sauc par raksturlieluma mazāko vērtību intervālā, un augšējā robeža - raksturlieluma lielākā vērtība intervālā. Intervāla vērtība ir starpība starp augšējo un apakšējo robežu.

Grupēšanas intervāli atkarībā no to lieluma ir: vienādi un nevienlīdzīgi. Ja raksturlieluma variācija izpaužas salīdzinoši šaurās robežās un sadalījums ir vienmērīgs, tad grupu veido vienādos intervālos. Vienāda intervāla vērtību nosaka pēc šādas formulas :

kur Xmax, Xmin ir raksturlieluma maksimālās un minimālās vērtības kopumā; n - grupu skaits.

Vienkāršākā grupēšana, kurā katrai atlasītajai grupai ir raksturīgs viens rādītājs, ir sadalījuma sērija.

Statistiskā sadalījuma rinda - tas ir sakārtots iedzīvotāju vienību sadalījums grupās atbilstoši noteiktai pazīmei. Atkarībā no raksturlieluma, kas ir sadalījuma rindas veidošanās pamatā, izšķir atributīvās un variācijas sadalījuma rindas.

Atribūti tiek sauktas par sadalījuma sērijām, kas veidotas pēc kvalitatīviem raksturlielumiem, tas ir, raksturlielumiem, kuriem nav skaitliskas izteiksmes (sadalījums pēc darba veida, pēc dzimuma, pēc profesijas utt.). Atribūtīvās sadalījuma rindas raksturo populācijas sastāvu pēc noteiktām būtiskām pazīmēm. Šie dati, ņemot vērā vairākus periodus, ļauj pētīt struktūras izmaiņas.

Variāciju sērija sauc par sadalījuma sērijām, kas veidotas kvantitatīvi. Jebkura variāciju sērija sastāv no diviem elementiem: opcijām un frekvencēm. Iespējas tiek sauktas raksturlieluma individuālās vērtības, kuras tas aizņem variāciju sērijā, tas ir, mainīgā raksturlieluma specifiskā vērtība.

Frekvences tiek izsaukti atsevišķu variantu vai katras variāciju sērijas grupas numuri, tas ir, tie ir skaitļi, kas parāda, cik bieži sadalījuma sērijās sastopami atsevišķi varianti. Visu frekvenču summa nosaka visas populācijas lielumu, tās apjomu. Frekvences sauc par frekvencēm, kas izteiktas vienības daļās vai procentos no kopsummas. Attiecīgi frekvenču summa ir vienāda ar 1 vai 100%.

Atkarībā no raksturlieluma variācijas rakstura izšķir trīs variāciju rindu formas: ranžētās sērijas, diskrētās sērijas un intervālu sērijas.

Sarindota variāciju sērija - tas ir atsevišķu populācijas vienību sadalījums pētāmās pazīmes augošā vai dilstošā secībā. Ranking ļauj viegli sadalīt kvantitatīvos datus grupās, nekavējoties noteikt mazākās un lielākās raksturlieluma vērtības un izcelt vērtības, kas visbiežāk atkārtojas.

Diskrētās variāciju sērijas raksturo populācijas vienību sadalījumu pēc diskrētas pazīmes, kas ņem tikai veselas vērtības. Piemēram, tarifu kategorija, bērnu skaits ģimenē, darbinieku skaits uzņēmumā utt.

Ja raksturlielumam ir nepārtrauktas izmaiņas, kas noteiktās robežās var iegūt jebkādas vērtības (“no - līdz”), tad šim raksturlielumam ir jāveido intervālu variāciju sērijas . Piemēram, ienākumu apjoms, darba stāžs, uzņēmuma pamatlīdzekļu izmaksas utt.

Problēmu risināšanas piemēri par tēmu “Statistikas kopsavilkums un grupēšana”

1. problēma . Ir informācija par grāmatu skaitu, ko studenti saņēmuši abonementos pagājušajā mācību gadā.

Izveidojiet ranžētu un diskrētu variāciju sadalījuma sēriju, apzīmējot sērijas elementus.

Risinājums

Šis komplekts atspoguļo daudzas iespējas studentu saņemto grāmatu skaitam. Saskaitīsim šādu opciju skaitu un sakārtosim tos variāciju ranžētu un variāciju diskrētu sadalījumu sēriju veidā.

2. problēma . Ir dati par pamatlīdzekļu izmaksām 50 uzņēmumiem, tūkstoši rubļu.

Izveidojiet sadalījuma sēriju, izceļot 5 uzņēmumu grupas (ar vienādiem intervāliem).

Risinājums

Lai atrisinātu, izvēlēsimies uzņēmumu pamatlīdzekļu vērtības lielākās un mazākās vērtības. Tie ir 30,0 un 10,2 tūkstoši rubļu.

Atradīsim intervāla lielumu: h = (30,0-10,2):5= 3,96 tūkstoši rubļu.

Tad pirmajā grupā būs uzņēmumi, kuru pamatlīdzekļu apjoms ir no 10,2 tūkstošiem rubļu. līdz 10,2+3,96=14,16 tūkstoši rubļu. Otrajā grupā būs uzņēmumi, kuru pamatlīdzekļu apjoms ir no 14,16 tūkstošiem rubļu. līdz 14,16+3,96=18,12 tūkstoši rubļu. Šādi uzņēmumi būs 16. Tāpat mēs atradīsim trešajā, ceturtajā un piektajā grupā iekļauto uzņēmumu skaitu.

Iegūtās sadalījuma sērijas ievietojam tabulā.

3. problēma . Par vairākiem vieglās rūpniecības uzņēmumiem tika iegūti šādi dati:

Grupējiet uzņēmumus pēc darbinieku skaita, vienādos intervālos veidojot 6 grupas. Aprēķiniet katrai grupai:

1. uzņēmumu skaits
2. strādnieku skaits
3. gadā saražotās produkcijas apjoms
4. vidējā faktiskā produkcija uz vienu darbinieku
5. pamatlīdzekļu apjoms
6. viena uzņēmuma vidējais pamatlīdzekļu lielums
7. viena uzņēmuma saražotās produkcijas vidējā vērtība

Aprēķinu rezultātus attēlot tabulās. Izdariet secinājumus.

Risinājums

Lai atrisinātu, mēs izvēlēsimies lielākās un mazākās vidējā darbinieku skaita uzņēmumā. Tie ir 43 un 256.

Noskaidrosim intervāla lielumu: h = (256-43):6 = 35,5

Tad pirmajā grupā tiks iekļauti uzņēmumi, kuru vidējais darbinieku skaits ir no 43 līdz 43 + 35,5 = 78,5 cilvēki. Šādi uzņēmumi būs 5 Otrajā grupā būs uzņēmumi, kuru vidējais darbinieku skaits būs no 78,5 līdz 78,5+35,5=114 cilvēki. Šādi uzņēmumi būs 12. Tāpat mēs atradīsim trešajā, ceturtajā, piektajā un sestajā grupā iekļauto uzņēmumu skaitu.

Iegūtās sadalījuma sērijas ievietojam tabulā un aprēķinām nepieciešamos rādītājus katrai grupai:

Secinājums : Kā redzams tabulā, otrā uzņēmumu grupa ir vislielākā. Tajā ietilpst 12 uzņēmumi. Mazākās grupas ir piektā un sestā grupa (katrā pa diviem uzņēmumiem). Tie ir lielākie uzņēmumi (pēc darbinieku skaita).

Tā kā otrā grupa ir lielākā, tad šīs grupas uzņēmumu saražotās produkcijas apjoms un pamatlīdzekļu apjoms ir ievērojami lielāks nekā citiem. Tajā pašā laikā vidējā faktiskā produkcija uz vienu darbinieku šīs grupas uzņēmumos nav tā lielākā. Šeit vadošie ir ceturtās grupas uzņēmumi. Šajā grupā ir arī diezgan liels pamatlīdzekļu apjoms.

Noslēgumā jāatzīmē, ka viena uzņēmuma vidējais pamatlīdzekļu apjoms un vidējais saražotās produkcijas apjoms ir tieši proporcionāls uzņēmuma lielumam (strādnieku skaita ziņā).

Stāvoklis:

Ir dati par strādājošo vecuma sastāvu (gadi): 18, 38, 28, 29, 26, 38, 34, 22, 28, 30, 22, 23, 35, 33, 27, 24, 30, 32, 28 , 25, 29, 26, 31, 24, 29, 27, 32, 25, 29, 29.

    1. Izveidojiet intervālu sadalījuma sēriju.
    2. Izveidojiet sērijas grafisko attēlojumu.
    3. Grafiski nosakiet režīmu un mediānu.

Risinājums:

1) Pēc Stērdžesa formulas populācija jāsadala 1 + 3,322 lg 30 = 6 grupās.

Maksimālais vecums - 38 gadi, minimālais - 18 gadi.

Intervāla platums Tā kā intervālu galiem jābūt veseliem skaitļiem, populāciju sadalām 5 grupās. Intervāla platums - 4.

Lai atvieglotu aprēķinus, mēs sakārtosim datus augošā secībā: 18, 22, 22, 23, 24, 24, 25, 25, 26, 26, 27, 27, 28, 28, 28, 29, 29, 29, 29., 29., 30., 30., 31., 32., 32., 33., 34., 35., 38., 38.

Strādnieku sadalījums pēc vecuma

Grafiski sēriju var attēlot kā histogrammu vai daudzstūri. Histogramma - joslu diagramma. Kolonnas pamatne ir intervāla platums. Kolonnas augstums ir vienāds ar frekvenci.

Daudzstūris (vai sadalījuma daudzstūris) - frekvences grafiks. Lai to izveidotu, izmantojot histogrammu, mēs savienojam taisnstūru augšējo malu viduspunktus. Mēs aizveram daudzstūri uz Vērša ass attālumos, kas vienādi ar pusi no intervāla no x galējām vērtībām.

Mode (Mo) ir pētāmā raksturlieluma vērtība, kas visbiežāk sastopama noteiktā populācijā.

Lai noteiktu režīmu no histogrammas, jums jāizvēlas augstākais taisnstūris, jānovelk līnija no šī taisnstūra labās virsotnes uz iepriekšējā taisnstūra augšējo labo stūri un no modālā taisnstūra kreisās virsotnes jānovelk līnija uz nākamā taisnstūra kreisā virsotne. No šo līniju krustpunkta uzvelciet perpendikulāru x asij. Abscisa būs modē. Mo ≈ 27,5. Tas nozīmē, ka visizplatītākais vecums šajā populācijā ir 27-28 gadi.

Mediāna (Me) ir pētāmā raksturlieluma vērtība, kas atrodas sakārtotās variāciju sērijas vidū.

Mēs atrodam mediānu, izmantojot kumulātu. Cumulates - uzkrāto frekvenču grafiks. Abscises ir sērijas varianti. Ordinātas ir uzkrātās frekvences.

Lai noteiktu mediānu virs kumulatīvās vērtības, mēs atrodam punktu gar ordinātu asi, kas atbilst 50% no uzkrātajām frekvencēm (mūsu gadījumā 15), novelkam cauri taisnu līniju paralēli Vērša asij un no punkta tā krustpunktu ar kumulātu, uzzīmējiet perpendikulāru x asij. Abscisa ir mediāna. Es ≈ 25,9. Tas nozīmē, ka puse strādājošo šajā populācijā ir jaunāki par 26 gadiem.

Grupu skaits (intervāli) ir aptuveni noteikts pēc Stērdžesa formulas:

m = 1 + 3,322 × log(n)

kur n ir kopējais novērojamo vienību skaits (kopējais elementu skaits populācijā utt.), log(n) ir n decimālais logaritms.

Saņemts saskaņā ar Stērdžesa formulu vērtību parasti noapaļo līdz tuvākajam veselajam skaitlim skaitļi, jo grupu skaits nevar būt daļskaitlis.

Ja intervālu sērija ar tik daudzām grupām nav apmierinoša dažiem kritērijiem, varat izveidot citu intervālu sēriju, noapaļojot m uz mazāku veselu skaitli un izvēlieties piemērotāko no divām rindām.

Grupu skaits nedrīkst būt lielāks par 15.

Varat arī izmantot šo tabulu, ja decimālo logaritmu nav iespējams aprēķināt vispār.

    Intervāla platuma noteikšana

Intervāla platums intervālu variāciju sērijai ar vienādiem intervāliem nosaka pēc formulas:

kur X max ir x i vērtību maksimālā, X min ir minimālā no x i vērtībām; m - grupu skaits (intervāli).

Intervāla lielums (i ) parasti tiek noapaļots līdz tuvākajam veselajam skaitlim, vienīgie izņēmumi ir gadījumi, kad tiek pētītas mazākās raksturlieluma svārstības (piemēram, grupējot detaļas pēc noviržu lieluma no nominālvērtības, mērot milimetra daļās).

Bieži tiek izmantots šāds noteikums:

Cipari aiz komata

Vairāki simboli aiz komata

Intervāla platuma piemērs, izmantojot formulu

Uz kādu zīmi mēs noapaļojam?

Noapaļota atstarpes platuma piemērs

    Intervālu robežu noteikšana

Apakšējā robeža pirmais intervāls tiek pieņemts vienāds ar atribūta minimālo vērtību (visbiežāk to vispirms noapaļo līdz mazākam veselam skaitlim ar tādu pašu rangu kā intervāla platumam). Piemēram, x min = 15, i = 130, pirmā intervāla x n = 10.

x n1 ≈ x min

Augšējā robeža pirmais intervāls atbilst vērtībai (Xmin + i).

Otrā intervāla apakšējā robeža vienmēr ir vienāda ar pirmā intervāla augšējo robežu. Nākamajām grupām robežas tiek noteiktas līdzīgi, tas ir, intervāla vērtība tiek secīgi pievienota.

x V i = x n i + i

x n i = x V i-1

    Nosakiet intervālu frekvences.

Mēs saskaitām, cik vērtību ietilpst katrā intervālā. Tajā pašā laikā mēs atceramies, ka, ja vienībai ir raksturīga vērtība, kas ir vienāda ar intervāla augšējās robežas vērtību, tad tā ir jāpiešķir nākamajam intervālam.

    Mēs veidojam intervālu sēriju tabulas veidā.

    Nosakiet intervālu viduspunktus.

Lai veiktu turpmāku intervālu sērijas analīzi, katram intervālam būs jāizvēlas raksturīgā vērtība. Šī atribūta vērtība būs kopīga visām novērojumu vienībām, kas ietilpst šajā intervālā. Tie. atsevišķi elementi “zaudē” savas individuālās atribūtu vērtības un tiem tiek piešķirta viena kopēja atribūta vērtība. Šī vispārējā nozīme ir intervāla vidus, kas ir apzīmēts x" i .

Izmantojot bērnu augšanas piemēru, apskatīsim, kā izveidot intervālu virkni ar vienādiem intervāliem.

Pieejami sākotnējie dati.

90, 91, 92, 93, 94, 95, 96, 97, 98, 99 , 92, 93, 94, 95, 96, 98 , , 100, 101, 102, 103, 104, 105, 106, 107, 108, 109 , 100, 101, 102, 104 , 110, 112, 114, 116, 117, 120, 122, 123, 124, 129, 110, 111, 113, 115, 116, 117, 121, 125, 126, 127 , 110, 111, 112, 113, 114, 115, 116, 117, 118, 119, 120, 121, 122, 123, 124, 125, 126, 127, 128, 129 , 111, 113, 116, 127 , 123, 122, 130, 131, 132, 133, 134, 136, 137, 138, 139, 140, 141, 142, 143, 144, 145, 146, 147, 148, 149, 150 , 131, 133, 135, 136, 138, 139, 140, 141, 142, 143, 145, 146, 147, 148