สรุปและจัดกลุ่มข้อมูลทางสถิติ กฎสำหรับการสร้างอนุกรมการแจกแจงแบบไม่ต่อเนื่องและแบบช่วงเวลา
เมื่อสร้างอนุกรมการแจกแจงตามช่วงเวลา คำถามสามข้อได้รับการแก้ไข:
- 1. ควรเว้นช่วงกี่ช่วง?
- 2. ระยะห่างเป็นเท่าใด?
- 3. ขั้นตอนการรวมหน่วยประชากรภายในขอบเขตของช่วงเป็นอย่างไร
- 1. จำนวนช่วงเวลาสามารถกำหนดได้โดย สูตรสเตอเจส:
2. ความยาวช่วงหรือขั้นตอนช่วงมักจะถูกกำหนดโดยสูตร
ที่ไหน ร-ช่วงของการเปลี่ยนแปลง
3. ลำดับการรวมหน่วยประชากรภายในขอบเขตของช่วงเวลา
อาจแตกต่างกัน แต่เมื่อสร้างอนุกรมช่วงเวลา จะต้องกำหนดการแจกแจงอย่างเคร่งครัด
ตัวอย่างเช่น สิ่งนี้: [) ซึ่งหน่วยประชากรจะรวมอยู่ในขอบเขตล่าง แต่ไม่รวมอยู่ในขอบเขตบน แต่จะถูกโอนไปยังช่วงถัดไป ข้อยกเว้นสำหรับกฎนี้คือช่วงสุดท้าย ซึ่งขีดจำกัดบนจะรวมหมายเลขสุดท้ายของลำดับอันดับด้วย
ขอบเขตของช่วงเวลาคือ:
- ปิด - ด้วยค่าแอตทริบิวต์สุดขั้วสองค่า
- เปิด - ด้วยค่าแอตทริบิวต์ที่มากสุดหนึ่งค่า (ก่อนดังกล่าวและจำนวนดังกล่าวหรือ เกินดังกล่าวและจำนวนดังกล่าว)
เพื่อที่จะซึมซับเนื้อหาทางทฤษฎีเราจึงแนะนำ ข้อมูลพื้นฐานสำหรับการแก้ปัญหา งานจากต้นจนจบ
มีข้อมูลแบบมีเงื่อนไขเกี่ยวกับจำนวนผู้จัดการฝ่ายขายโดยเฉลี่ย ปริมาณของสินค้าที่คล้ายกันที่ขาย ราคาตลาดแต่ละรายการสำหรับผลิตภัณฑ์นี้ รวมถึงปริมาณการขายของ 30 บริษัท ในภูมิภาคใดภูมิภาคหนึ่งของสหพันธรัฐรัสเซียในช่วงแรก ไตรมาสของปีรายงาน (ตาราง 2.1)
ตารางที่ 2.1
ข้อมูลเบื้องต้นสำหรับงานตัดขวาง
ตัวเลข ผู้จัดการ |
ราคาพันรูเบิล |
ปริมาณการขายล้านรูเบิล |
||
ตัวเลข ผู้จัดการ |
จำนวนสินค้าที่ขาย ชิ้น |
ราคาพันรูเบิล |
ปริมาณการขายล้านรูเบิล |
|
เราจะจัดเตรียมงานแต่ละงานตามข้อมูลเบื้องต้นตลอดจนข้อมูลเพิ่มเติม จากนั้นเราจะนำเสนอวิธีการในการแก้ปัญหาและวิธีแก้ปัญหาด้วยตนเอง
งานตัดขวาง งาน 2.1
การใช้ข้อมูลเริ่มต้นจากตาราง 2.1 จำเป็นสร้างชุดการกระจายของบริษัทแยกตามปริมาณสินค้าที่ขาย (ตารางที่ 2.2)
สารละลาย:
ตารางที่ 2.2
การกระจายตัวของ บริษัท แบบแยกส่วนตามปริมาณสินค้าที่ขายในภูมิภาคใดภูมิภาคหนึ่งของสหพันธรัฐรัสเซียในไตรมาสแรกของปีที่รายงาน
งานตัดขวาง งาน 2.2
ที่จำเป็นสร้างบริษัทที่ได้รับการจัดอันดับ 30 บริษัทตามจำนวนผู้จัดการโดยเฉลี่ย
สารละลาย:
15; 17; 18; 20; 20; 20; 22; 22; 24; 25; 25; 25; 27; 27; 27; 28; 29; 30; 32; 32; 33; 33; 33; 34; 35; 35; 38; 39; 39; 45.
งานตัดขวาง งาน 2.3
การใช้ข้อมูลเริ่มต้นจากตาราง 2.1, ที่จำเป็น:
- 1. สร้างชุดการกระจายของบริษัทตามจำนวนผู้จัดการ
- 2. คำนวณความถี่ของชุดการจำหน่ายของบริษัท
- 3. วาดข้อสรุป
สารละลาย:
ลองคำนวณโดยใช้สูตรสเตอเจส (2.5) จำนวนช่วงเวลา:
ดังนั้นเราจึงใช้เวลา 6 ช่วง (กลุ่ม)
ความยาวช่วง, หรือ ขั้นตอนช่วงเวลาให้คำนวณโดยใช้สูตร
บันทึก.ลำดับการรวมหน่วยประชากรในขอบเขตของช่วงมีดังนี้: I) ซึ่งหน่วยประชากรจะรวมอยู่ในขอบเขตล่าง แต่ไม่รวมอยู่ในขอบเขตบน แต่จะถูกโอนไปยังช่วงถัดไป ข้อยกเว้นสำหรับกฎนี้คือช่วงสุดท้าย I ] ซึ่งขีดจำกัดบนจะรวมหมายเลขสุดท้ายของซีรีส์การจัดอันดับด้วย
เราสร้างอนุกรมช่วงเวลา (ตารางที่ 2.3)
การกระจายตัวของ บริษัท และจำนวนผู้จัดการโดยเฉลี่ยในภูมิภาคใดภูมิภาคหนึ่งของสหพันธรัฐรัสเซียในช่วงไตรมาสแรกของปีที่รายงาน
บทสรุป.กลุ่มบริษัทที่ใหญ่ที่สุดคือกลุ่มที่มีจำนวนผู้จัดการโดยเฉลี่ย 25-30 คน ซึ่งรวมถึง 8 บริษัท (27%) กลุ่มที่เล็กที่สุดซึ่งมีผู้จัดการโดยเฉลี่ย 40-45 คน มีเพียงบริษัทเดียวเท่านั้น (3%)
การใช้ข้อมูลเริ่มต้นจากตาราง 2.1 เช่นเดียวกับชุดการกระจายของ บริษัท ตามจำนวนผู้จัดการ (ตารางที่ 2.3) ที่จำเป็นสร้างการจัดกลุ่มเชิงวิเคราะห์ของความสัมพันธ์ระหว่างจำนวนผู้จัดการและปริมาณการขายของ บริษัท และสรุปเกี่ยวกับการมีอยู่ (หรือไม่มี) ของความสัมพันธ์ระหว่างลักษณะเหล่านี้
สารละลาย:
การจัดกลุ่มการวิเคราะห์ขึ้นอยู่กับลักษณะของปัจจัย ในปัญหาของเรา ลักษณะปัจจัย (x) คือจำนวนผู้จัดการ และลักษณะผลลัพธ์ (y) คือปริมาณการขาย (ตารางที่ 2.4)
มาสร้างกันเลย การจัดกลุ่มเชิงวิเคราะห์(ตารางที่ 2.5)
บทสรุป.จากข้อมูลของการจัดกลุ่มการวิเคราะห์ที่สร้างขึ้น เราสามารถพูดได้ว่าเมื่อจำนวนผู้จัดการฝ่ายขายเพิ่มขึ้น ปริมาณการขายเฉลี่ยของบริษัทในกลุ่มก็เพิ่มขึ้นเช่นกัน ซึ่งบ่งบอกถึงความเชื่อมโยงโดยตรงระหว่างลักษณะเหล่านี้
ตารางที่ 2.4
ตารางเสริมสำหรับการสร้างกลุ่มการวิเคราะห์
จำนวนผู้จัดการ คน |
หมายเลขบริษัท |
ปริมาณการขายล้านรูเบิล y |
|
" = 59 ฉ = 9.97 |
|||
ฉัน-™ 4 -ย.22 |
|||
74'25 1PY1 ยู4 = 7 = 10,61 |
ที่ = ’ =10,31 30 |
ตารางที่ 2.5
การพึ่งพาปริมาณการขายกับจำนวนผู้จัดการบริษัทในภูมิภาคใดภูมิภาคหนึ่งของสหพันธรัฐรัสเซียในไตรมาสแรกของปีที่รายงาน
คำถามควบคุม- 1. สาระสำคัญของการสังเกตทางสถิติคืออะไร?
- 2. ตั้งชื่อขั้นตอนการสังเกตทางสถิติ
- 3. รูปแบบการสังเกตทางสถิติขององค์กรมีรูปแบบใดบ้าง?
- 4. ตั้งชื่อประเภทการสังเกตทางสถิติ
- 5. สรุปทางสถิติคืออะไร?
- 6. ตั้งชื่อประเภทของรายงานทางสถิติ
- 7. การจัดกลุ่มทางสถิติคืออะไร?
- 8. ตั้งชื่อประเภทของการจัดกลุ่มทางสถิติ
- 9. ซีรีย์การจัดจำหน่ายคืออะไร?
- 10. ตั้งชื่อองค์ประกอบโครงสร้างของแถวการแจกจ่าย
- 11. ขั้นตอนการสร้างซีรีย์การจัดจำหน่ายมีขั้นตอนอย่างไร?
หากตัวแปรสุ่มภายใต้การศึกษามีความต่อเนื่องการจัดอันดับและการจัดกลุ่มค่าที่สังเกตได้มักจะไม่อนุญาตให้ระบุลักษณะเฉพาะของการแปรผันในค่าของมัน สิ่งนี้อธิบายได้จากข้อเท็จจริงที่ว่าค่าแต่ละค่าของตัวแปรสุ่มสามารถแตกต่างกันได้เพียงเล็กน้อยเท่าที่ต้องการ ดังนั้นในจำนวนรวมของข้อมูลที่สังเกต ค่าที่เหมือนกันของปริมาณจึงแทบจะไม่เกิดขึ้น และความถี่ของ ตัวแปรที่แตกต่างกันเล็กน้อยจากกัน
นอกจากนี้ยังเป็นไปไม่ได้ที่จะสร้างอนุกรมแบบแยกสำหรับตัวแปรสุ่มแบบไม่ต่อเนื่องซึ่งจำนวนค่าที่เป็นไปได้ซึ่งมีขนาดใหญ่ ในกรณีเช่นนี้คุณควรสร้าง อนุกรมการเปลี่ยนแปลงช่วงเวลา การแจกแจง
ในการสร้างอนุกรมดังกล่าว ช่วงเวลาทั้งหมดของการเปลี่ยนแปลงของค่าที่สังเกตได้ของตัวแปรสุ่มจะถูกแบ่งออกเป็นอนุกรม ช่วงเวลาบางส่วน และการนับความถี่ของการเกิดขึ้นของค่าในแต่ละช่วงย่อย
อนุกรมความแปรผันของช่วงเรียกชุดช่วงเวลาที่เรียงลำดับของค่าที่แตกต่างกันของตัวแปรสุ่มที่มีความถี่ที่สอดคล้องกันหรือความถี่สัมพัทธ์ของค่าของตัวแปรที่ตกอยู่ในแต่ละค่า
ในการสร้างอนุกรมช่วงเวลาที่คุณต้องการ:
- กำหนด ขนาด ช่วงเวลาบางส่วน
- กำหนด ความกว้าง ช่วงเวลา;
- กำหนดไว้ในแต่ละช่วงเวลา สูงสุด และ ขีดจำกัดล่าง ;
- จัดกลุ่มผลการสังเกต
1 - คำถามในการเลือกจำนวนและความกว้างของช่วงเวลาการจัดกลุ่มจะต้องได้รับการตัดสินใจในแต่ละกรณีโดยเฉพาะ เป้าหมาย วิจัย, ปริมาณ ตัวอย่างและ ระดับของการเปลี่ยนแปลง ลักษณะเฉพาะในตัวตัวอย่าง
จำนวนช่วงโดยประมาณ เค สามารถประมาณได้ตามขนาดตัวอย่างเท่านั้น n ด้วยวิธีใดวิธีหนึ่งดังต่อไปนี้:
- ตามสูตร สเตอร์เจส : k = 1 + 3.32 บันทึก n ;
- โดยใช้ตารางที่ 1
ตารางที่ 1
2 - โดยทั่วไปควรใช้ช่องว่างที่มีความกว้างเท่ากัน เพื่อกำหนดความกว้างของช่วงเวลา ชม. คำนวณ:
- ช่วงของการเปลี่ยนแปลง R - ค่าตัวอย่าง: R = x สูงสุด - x นาที ,
ที่ไหน xmax และ เอ็กซ์มิน - ตัวเลือกการสุ่มตัวอย่างสูงสุดและต่ำสุด
- ความกว้างของแต่ละช่วง ชม. กำหนดโดยสูตรต่อไปนี้: ชั่วโมง = R/k .
3 . บรรทัดล่าง ช่วงแรก xh1 ถูกเลือกเพื่อให้มีตัวเลือกตัวอย่างขั้นต่ำ เอ็กซ์มิน ลดลงประมาณกลางช่วงเวลานี้: x h1 = x นาที - 0.5 ชม .
ระยะกลางได้มาจากการเพิ่มความยาวของช่วงบางส่วนต่อท้ายช่วงก่อนหน้า ชม. :
x สูง = x สูง-1 +h.
การสร้างมาตราส่วนช่วงเวลาตามการคำนวณขอบเขตของช่วงเวลาจะดำเนินต่อไปจนกระทั่งถึงค่า สวัสดี ตอบสนองความสัมพันธ์:
สวัสดี< x max + 0,5·h .
4 - ตามมาตราส่วนช่วงเวลาค่าลักษณะจะถูกจัดกลุ่ม - สำหรับแต่ละช่วงเวลาบางส่วนจะมีการคำนวณผลรวมของความถี่ ฉัน ตัวเลือกที่รวมอยู่ใน ฉัน ช่วงเวลาที่. ในกรณีนี้ ช่วงจะรวมค่าของตัวแปรสุ่มที่มากกว่าหรือเท่ากับขีดจำกัดล่างและน้อยกว่าขีดจำกัดบนของช่วงเวลา
รูปหลายเหลี่ยมและฮิสโตแกรม
เพื่อความชัดเจน จึงได้มีการสร้างกราฟการกระจายทางสถิติต่างๆ
พวกมันสร้างขึ้นจากข้อมูลของอนุกรมความแปรผันแบบแยกส่วน รูปหลายเหลี่ยม ความถี่หรือความถี่สัมพัทธ์
รูปหลายเหลี่ยมความถี่ x1 ; หมายเลข 1 ), (x2 ; หมายเลข 2 ), ..., (เอ็กซ์เค ; ไม่เป็นไร - ในการสร้างรูปหลายเหลี่ยมความถี่ ตัวเลือกต่างๆ จะถูกพล็อตบนแกนแอบซิสซา x ฉัน และในการกำหนด - ความถี่ที่สอดคล้องกัน ฉัน - คะแนน ( x ฉัน ; ฉัน ) เชื่อมต่อกันด้วยส่วนตรงและได้รับรูปหลายเหลี่ยมความถี่ (รูปที่ 1)
รูปหลายเหลี่ยมของความถี่สัมพัทธ์เรียกว่าเส้นขาดที่มีส่วนเชื่อมต่อจุด ( x1 ; ว 1 ), (x2 ; ว 2 ), ..., (เอ็กซ์เค ; สัปดาห์ - ในการสร้างรูปหลายเหลี่ยมที่มีความถี่สัมพัทธ์ ตัวเลือกต่างๆ จะถูกพล็อตบนแกนแอบซิสซา x ฉัน และบนพิกัด - ความถี่สัมพัทธ์ที่สอดคล้องกัน ฉัน - คะแนน ( x ฉัน ; ฉัน ) เชื่อมต่อกันด้วยส่วนตรงและได้รับรูปหลายเหลี่ยมของความถี่สัมพัทธ์
เมื่อไร สัญญาณต่อเนื่อง ขอแนะนำให้สร้าง ฮิสโตแกรม .
ฮิสโตแกรมความถี่เรียกว่ารูปก้าวประกอบด้วยสี่เหลี่ยมซึ่งมีฐานเป็นช่วงความยาวบางส่วน ชม. และความสูงเท่ากับอัตราส่วน NIH (ความหนาแน่นของความถี่)
ในการสร้างฮิสโตแกรมความถี่ ช่วงเวลาบางส่วนจะถูกวางบนแกน Abscissa และส่วนที่ขนานกับแกน Abscissa จะถูกวาดไว้เหนือพวกมันในระยะไกล NIH .
ขั้นตอนที่สำคัญที่สุดในการศึกษาปรากฏการณ์และกระบวนการทางเศรษฐกิจและสังคมคือการจัดระบบข้อมูลปฐมภูมิและบนพื้นฐานนี้การได้รับลักษณะสรุปของวัตถุทั้งหมดโดยใช้ตัวบ่งชี้ทั่วไป ซึ่งทำได้โดยการสรุปและจัดกลุ่มวัสดุทางสถิติหลัก
สรุปทางสถิติ - นี่เป็นการดำเนินการที่ซับซ้อนตามลำดับเพื่อสรุปข้อเท็จจริงเฉพาะของแต่ละบุคคลซึ่งก่อตัวเป็นชุดเพื่อระบุคุณลักษณะและรูปแบบทั่วไปที่มีอยู่ในปรากฏการณ์ที่กำลังศึกษาโดยรวม การจัดทำสรุปทางสถิติประกอบด้วยขั้นตอนดังต่อไปนี้ :
- การเลือกลักษณะการจัดกลุ่ม
- การกำหนดลำดับการก่อตัวของกลุ่ม
- การพัฒนาระบบตัวบ่งชี้ทางสถิติเพื่อระบุลักษณะกลุ่มและวัตถุโดยรวม
- การพัฒนาโครงร่างตารางสถิติเพื่อนำเสนอผลสรุป
การจัดกลุ่มทางสถิติ เรียกว่าการแบ่งหน่วยของประชากรที่กำลังศึกษาออกเป็นกลุ่มเนื้อเดียวกันตามลักษณะเฉพาะที่จำเป็นต่อพวกเขา การจัดกลุ่มเป็นวิธีทางสถิติที่สำคัญที่สุดในการสรุปข้อมูลทางสถิติ ซึ่งเป็นพื้นฐานสำหรับการคำนวณตัวบ่งชี้ทางสถิติที่ถูกต้อง
การจัดกลุ่มประเภทต่อไปนี้มีความโดดเด่น: ประเภท, โครงสร้าง, การวิเคราะห์ การจัดกลุ่มทั้งหมดนี้รวมกันโดยข้อเท็จจริงที่ว่าหน่วยของวัตถุถูกแบ่งออกเป็นกลุ่มตามลักษณะบางอย่าง
คุณลักษณะการจัดกลุ่ม เป็นลักษณะที่หน่วยประชากรถูกแบ่งออกเป็นกลุ่มต่างๆ ข้อสรุปของการศึกษาทางสถิติขึ้นอยู่กับการเลือกลักษณะการจัดกลุ่มที่ถูกต้อง เป็นพื้นฐานสำหรับการจัดกลุ่ม จำเป็นต้องใช้คุณลักษณะที่มีนัยสำคัญตามทฤษฎี (เชิงปริมาณหรือเชิงคุณภาพ)
ลักษณะเชิงปริมาณของการจัดกลุ่ม มีการแสดงตัวเลข (ปริมาณการซื้อขาย อายุของบุคคล รายได้ของครอบครัว ฯลฯ) และ สัญญาณเชิงคุณภาพของการจัดกลุ่ม สะท้อนถึงสถานะของหน่วยประชากร (เพศ, สถานภาพการสมรส, อุตสาหกรรมขององค์กร, รูปแบบการเป็นเจ้าของ ฯลฯ )
หลังจากกำหนดพื้นฐานของการจัดกลุ่มแล้ว จะต้องตัดสินใจคำถามเกี่ยวกับจำนวนกลุ่มที่ควรแบ่งประชากรภายใต้การศึกษา จำนวนกลุ่มขึ้นอยู่กับวัตถุประสงค์ของการศึกษาและประเภทของตัวบ่งชี้ที่เป็นพื้นฐานของการจัดกลุ่ม ปริมาณของประชากร และระดับของการเปลี่ยนแปลงของลักษณะเฉพาะ
ตัวอย่างเช่น การจัดกลุ่มวิสาหกิจตามประเภทความเป็นเจ้าของจะคำนึงถึงทรัพย์สินของเทศบาล รัฐบาลกลาง และของรัฐบาลกลาง หากดำเนินการจัดกลุ่มตามเกณฑ์เชิงปริมาณก็จำเป็นต้องให้ความสนใจเป็นพิเศษกับจำนวนหน่วยของวัตถุที่ศึกษาและระดับความผันผวนของลักษณะการจัดกลุ่ม
เมื่อกำหนดจำนวนกลุ่มแล้ว จะต้องกำหนดช่วงเวลาการจัดกลุ่ม ช่วงเวลา - นี่คือค่าของคุณลักษณะที่แตกต่างกันซึ่งอยู่ภายในขอบเขตที่กำหนด แต่ละช่วงเวลามีค่าของตัวเอง ขอบเขตบนและล่าง หรืออย่างน้อยหนึ่งขอบเขต
ขีดจำกัดล่างของช่วงเวลา เรียกว่าค่าที่น้อยที่สุดของคุณลักษณะในช่วงเวลา และ ขีด จำกัด บน - ค่าสูงสุดของคุณลักษณะในช่วงเวลา ค่าของช่วงเวลาคือความแตกต่างระหว่างขอบเขตบนและล่าง
ช่วงเวลาการจัดกลุ่มจะเท่ากันหรือไม่เท่ากัน ขึ้นอยู่กับขนาด หากการแปรผันของคุณลักษณะปรากฏภายในขอบเขตที่ค่อนข้างแคบและมีการกระจายสม่ำเสมอ แสดงว่ากลุ่มจะถูกสร้างขึ้นในช่วงเวลาที่เท่ากัน ค่าของช่วงเวลาที่เท่ากันถูกกำหนดโดยสูตรต่อไปนี้ :
โดยที่ Xmax, Xmin คือค่าสูงสุดและต่ำสุดของคุณลักษณะในการรวม n - จำนวนกลุ่ม
การจัดกลุ่มที่ง่ายที่สุดซึ่งแต่ละกลุ่มที่เลือกจะมีตัวบ่งชี้หนึ่งตัวแสดงถึงชุดการแจกจ่าย
ชุดการกระจายทางสถิติ - นี่คือการกระจายหน่วยประชากรออกเป็นกลุ่มตามลำดับตามลักษณะเฉพาะ ขึ้นอยู่กับคุณลักษณะที่เป็นรากฐานของการก่อตัวของอนุกรมการแจกแจง ซีรีส์การแจกแจงแบบระบุแหล่งที่มาและแบบแปรผันจะมีความโดดเด่น
แอตทริบิวต์ เรียกว่าชุดการจัดจำหน่ายที่สร้างขึ้นตามลักษณะเชิงคุณภาพ กล่าวคือ ลักษณะที่ไม่มีการแสดงออกทางตัวเลข (การกระจายตามประเภทของแรงงาน ตามเพศ ตามอาชีพ เป็นต้น) ชุดการแจกแจงแบบระบุลักษณะองค์ประกอบของประชากรตามลักษณะสำคัญบางประการ ข้อมูลเหล่านี้ใช้เวลาหลายช่วงเวลาทำให้สามารถศึกษาการเปลี่ยนแปลงโครงสร้างได้
ซีรี่ส์รูปแบบต่างๆ เรียกว่าชุดการแจกจ่ายที่สร้างขึ้นบนพื้นฐานเชิงปริมาณ ซีรีย์รูปแบบใดๆ ประกอบด้วยสององค์ประกอบ: ตัวเลือกและความถี่ ตัวเลือก ค่าแต่ละค่าของคุณลักษณะที่ใช้ในชุดรูปแบบเรียกว่าค่าเฉพาะของคุณลักษณะที่แตกต่างกัน
ความถี่ จะมีการเรียกหมายเลขของตัวแปรแต่ละตัวหรือแต่ละกลุ่มของซีรีย์ของตัวแปร นั่นคือตัวเลขเหล่านี้ที่แสดงว่าตัวแปรบางตัวเกิดขึ้นในซีรีย์การแจกแจงบ่อยแค่ไหน ผลรวมของความถี่ทั้งหมดจะกำหนดขนาดของประชากรทั้งหมดและปริมาตรของมัน ความถี่ เรียกว่าความถี่ที่แสดงเป็นเศษส่วนของหน่วยหรือเป็นเปอร์เซ็นต์ของทั้งหมด ดังนั้นผลรวมของความถี่จึงเท่ากับ 1 หรือ 100%
ขึ้นอยู่กับลักษณะของการเปลี่ยนแปลงของคุณลักษณะ อนุกรมรูปแบบสามรูปแบบจะมีความโดดเด่น: อนุกรมอันดับ อนุกรมแยก และอนุกรมช่วง
จัดอันดับซีรีส์รูปแบบต่างๆ - นี่คือการกระจายของแต่ละหน่วยของประชากรโดยเรียงลำดับจากน้อยไปหามากหรือจากมากไปหาน้อยของลักษณะที่กำลังศึกษา การจัดอันดับช่วยให้คุณแบ่งข้อมูลเชิงปริมาณออกเป็นกลุ่มได้อย่างง่ายดาย ตรวจจับค่าที่เล็กที่สุดและใหญ่ที่สุดของลักษณะเฉพาะได้ทันที และเน้นค่าที่ซ้ำกันบ่อยที่สุด
ซีรี่ส์รูปแบบที่ไม่ต่อเนื่อง ระบุลักษณะการกระจายของหน่วยประชากรตามลักษณะเฉพาะที่ไม่ต่อเนื่องซึ่งรับเฉพาะค่าจำนวนเต็ม ตัวอย่างเช่น หมวดหมู่ภาษี จำนวนเด็กในครอบครัว จำนวนพนักงานในองค์กร เป็นต้น
หากคุณลักษณะมีการเปลี่ยนแปลงอย่างต่อเนื่องซึ่งภายในขอบเขตที่กำหนดสามารถรับค่าใด ๆ (“จาก - ถึง”) ได้ดังนั้นสำหรับคุณลักษณะนี้จำเป็นต้องสร้าง อนุกรมการเปลี่ยนแปลงช่วงเวลา - ตัวอย่างเช่น จำนวนรายได้ ระยะเวลาการให้บริการ ต้นทุนสินทรัพย์ถาวรขององค์กร เป็นต้น
ตัวอย่างการแก้ปัญหาในหัวข้อ “สรุปทางสถิติ และการจัดกลุ่ม”
ปัญหาที่ 1 - มีข้อมูลเกี่ยวกับจำนวนหนังสือที่นักเรียนได้รับจากการสมัครสมาชิกในปีการศึกษาที่ผ่านมา
สร้างซีรีส์การแจกแจงรูปแบบการจัดอันดับและแยกส่วน โดยกำหนดองค์ประกอบของซีรีส์
สารละลาย
ชุดนี้แสดงถึงตัวเลือกมากมายสำหรับจำนวนหนังสือที่นักเรียนได้รับ ลองนับจำนวนตัวเลือกดังกล่าวแล้วจัดเรียงในรูปแบบของซีรีส์การแจกแจงแบบแยกส่วนแบบจัดอันดับแบบผันแปรและแบบแปรผัน
ปัญหาที่ 2 - มีข้อมูลเกี่ยวกับต้นทุนของสินทรัพย์ถาวรสำหรับ 50 องค์กรพันรูเบิล
สร้างชุดการแจกจ่ายโดยเน้นกลุ่มวิสาหกิจ 5 กลุ่ม (ในช่วงเวลาเท่ากัน)
สารละลาย
ในการแก้ปัญหาเราจะเลือกมูลค่าที่ใหญ่ที่สุดและเล็กที่สุดของมูลค่าสินทรัพย์ถาวรขององค์กร เหล่านี้คือ 30.0 และ 10.2 พันรูเบิล
มาหาขนาดของช่วงเวลา: h = (30.0-10.2):5= 3.96 พันรูเบิล
จากนั้นกลุ่มแรกจะรวมองค์กรที่มีสินทรัพย์ถาวรจำนวน 10.2 พันรูเบิล สูงถึง 10.2+3.96=14.16 พันรูเบิล จะมี 9 องค์กรดังกล่าว กลุ่มที่สองจะรวมองค์กรที่มีสินทรัพย์ถาวรจำนวน 14.16 พันรูเบิล สูงถึง 14.16+3.96=18.12 พันรูเบิล จะมีวิสาหกิจดังกล่าวจำนวน 16 แห่ง เราจะพบจำนวนวิสาหกิจที่รวมอยู่ในกลุ่มที่สาม สี่ และห้า
เราวางซีรีย์การแจกจ่ายผลลัพธ์ลงในตาราง
ปัญหา 3 - ข้อมูลต่อไปนี้ได้รับจากองค์กรอุตสาหกรรมเบาจำนวนหนึ่ง:
จัดกลุ่มวิสาหกิจตามจำนวนคนงาน โดยแบ่งเป็น 6 กลุ่มในช่วงเวลาเท่าๆ กัน คำนวณสำหรับแต่ละกลุ่ม:
1. จำนวนวิสาหกิจ
2. จำนวนคนงาน
3.ปริมาณสินค้าที่ผลิตต่อปี
4. ผลผลิตจริงโดยเฉลี่ยต่อคนงาน
5.ปริมาณสินทรัพย์ถาวร
6. ขนาดเฉลี่ยของสินทรัพย์ถาวรของหนึ่งองค์กร
7. มูลค่าเฉลี่ยของผลิตภัณฑ์ที่ผลิตโดยองค์กรเดียว
นำเสนอผลการคำนวณเป็นตาราง วาดข้อสรุป
สารละลาย
ในการแก้ปัญหา เราจะเลือกค่าที่ใหญ่ที่สุดและน้อยที่สุดของจำนวนพนักงานโดยเฉลี่ยในองค์กร คือ 43 และ 256
ลองหาขนาดของช่วงเวลา: h = (256-43):6 = 35.5
จากนั้นกลุ่มแรกจะรวมวิสาหกิจที่มีจำนวนคนงานโดยเฉลี่ยอยู่ระหว่าง 43 ถึง 43 + 35.5 = 78.5 คน จะมีวิสาหกิจดังกล่าวจำนวน 5 แห่ง กลุ่มที่สองจะรวมวิสาหกิจที่มีจำนวนคนงานโดยเฉลี่ยตั้งแต่ 78.5 ถึง 78.5+35.5=114 คน จะมี 12 วิสาหกิจดังกล่าว ในทำนองเดียวกัน เราจะค้นหาจำนวนวิสาหกิจที่รวมอยู่ในกลุ่มที่สาม สี่ ห้า และหก
เราวางชุดการแจกแจงผลลัพธ์ลงในตารางและคำนวณตัวบ่งชี้ที่จำเป็นสำหรับแต่ละกลุ่ม:
บทสรุป : ดังที่เห็นจากตาราง วิสาหกิจกลุ่มที่ 2 มีจำนวนมากที่สุด ประกอบด้วย 12 รัฐวิสาหกิจ กลุ่มที่เล็กที่สุดคือกลุ่มที่ห้าและหก (กลุ่มละ 2 แห่ง) เหล่านี้เป็นองค์กรที่ใหญ่ที่สุด (ในแง่ของจำนวนคนงาน)
เนื่องจากกลุ่มที่สองเป็นกลุ่มที่ใหญ่ที่สุดปริมาณผลิตภัณฑ์ที่ผลิตต่อปีโดยองค์กรของกลุ่มนี้และปริมาณสินทรัพย์ถาวรจึงสูงกว่ากลุ่มอื่นอย่างมาก ในขณะเดียวกัน ผลผลิตจริงโดยเฉลี่ยต่อคนงานในองค์กรในกลุ่มนี้ก็ไม่ได้สูงที่สุด องค์กรของกลุ่มที่สี่กำลังเป็นผู้นำที่นี่ กลุ่มนี้ยังคิดเป็นปริมาณสินทรัพย์ถาวรที่ค่อนข้างใหญ่
โดยสรุป เราทราบว่าขนาดเฉลี่ยของสินทรัพย์ถาวรและจำนวนผลผลิตเฉลี่ยที่ผลิตโดยองค์กรหนึ่งนั้นเป็นสัดส่วนโดยตรงกับขนาดขององค์กร (ในแง่ของจำนวนคนงาน)
เงื่อนไข:
มีข้อมูลเกี่ยวกับองค์ประกอบอายุของคนงาน (ปี): 18, 38, 28, 29, 26, 38, 34, 22, 28, 30, 22, 23, 35, 33, 27, 24, 30, 32, 28 , 25, 29, 26, 31, 24, 29, 27, 32, 25, 29, 29.
- สร้างอนุกรมการแจกแจงตามช่วงเวลา
- สร้างการแสดงภาพกราฟิกของซีรีส์
- กำหนดโหมดและค่ามัธยฐานแบบกราฟิก
สารละลาย:
1) ตามสูตรสเตอเจส ประชากรจะต้องแบ่งออกเป็น 1 + 3.322 lg 30 = 6 กลุ่ม
อายุสูงสุด - 38 ปี ขั้นต่ำ - 18 ปี
ความกว้างของช่วง เนื่องจากจุดสิ้นสุดของช่วงต้องเป็นจำนวนเต็ม เราจึงแบ่งประชากรออกเป็น 5 กลุ่ม ความกว้างช่วง - 4
เพื่อให้การคำนวณง่ายขึ้น เราจะจัดเรียงข้อมูลจากน้อยไปมาก: 18, 22, 22, 23, 24, 24, 25, 25, 26, 26, 27, 27, 28, 28, 28, 29, 29, 29, 29, 29, 30 , 30, 31, 32, 32, 33, 34, 35, 38, 38.
การกระจายอายุของคนงาน
ในเชิงกราฟิก ซีรีส์สามารถแสดงเป็นฮิสโตแกรมหรือรูปหลายเหลี่ยมได้ ฮิสโตแกรม - แผนภูมิแท่ง ฐานของคอลัมน์คือความกว้างของช่วงเวลา ความสูงของคอลัมน์เท่ากับความถี่
รูปหลายเหลี่ยม (หรือรูปหลายเหลี่ยมการกระจาย) - กราฟความถี่ ในการสร้างมันโดยใช้ฮิสโตแกรม เราเชื่อมต่อจุดกึ่งกลางของด้านบนของสี่เหลี่ยม เราปิดรูปหลายเหลี่ยมบนแกน Ox ในระยะทางเท่ากับครึ่งหนึ่งของช่วงเวลาจากค่าสุดขีดของ x
โหมด (Mo) คือค่าของคุณลักษณะที่กำลังศึกษา ซึ่งเกิดขึ้นบ่อยที่สุดในประชากรที่กำหนด
ในการกำหนดโหมดจากฮิสโตแกรม คุณจะต้องเลือกสี่เหลี่ยมที่สูงที่สุด ลากเส้นจากจุดยอดด้านขวาของสี่เหลี่ยมนี้ไปยังมุมขวาบนของสี่เหลี่ยมก่อนหน้า และจากจุดยอดซ้ายของสี่เหลี่ยมโมดอล ให้ลากเส้นไปที่ จุดยอดซ้ายของสี่เหลี่ยมถัดไป จากจุดตัดกันของเส้นเหล่านี้ ให้วาดตั้งฉากกับแกน x พวก Abscissa จะเป็นแฟชั่น โม µ 27.5 ซึ่งหมายความว่าอายุที่พบบ่อยที่สุดในประชากรกลุ่มนี้คือ 27-28 ปี
ค่ามัธยฐาน (Me) คือค่าของคุณลักษณะที่กำลังศึกษา ซึ่งอยู่ตรงกลางของอนุกรมการเปลี่ยนแปลงแบบเรียงลำดับ
เราหาค่ามัธยฐานโดยใช้การสะสม Cumulates - กราฟความถี่สะสม Abscissas เป็นรูปแบบหนึ่งของซีรีส์ Ordinates เป็นความถี่สะสม
ในการหาค่ามัธยฐานเหนือการสะสม เราจะพบจุดตามแกนกำหนดซึ่งสอดคล้องกับ 50% ของความถี่สะสม (ในกรณีของเรา 15) ลากเส้นตรงผ่านจุดนั้น ขนานกับแกน Ox และจากจุดที่ จุดตัดกับจุดสะสม ให้วาดตั้งฉากกับแกน x Abscissa คือค่ามัธยฐาน ฉัน 25.9. ซึ่งหมายความว่าครึ่งหนึ่งของคนงานในประชากรกลุ่มนี้มีอายุต่ำกว่า 26 ปี
จำนวนกลุ่ม (ช่วง)ถูกกำหนดโดยประมาณโดยสูตรสเตอเจส:
m = 1 + 3.322 × บันทึก(n)
โดยที่ n คือจำนวนหน่วยการสังเกตทั้งหมด (จำนวนองค์ประกอบทั้งหมดในประชากร ฯลฯ) log(n) คือลอการิทึมฐานสิบของ n
ได้รับ ตามสูตรสเตอเจส ค่ามักจะถูกปัดเศษให้เป็นจำนวนเต็มที่ใกล้ที่สุดตัวเลข เนื่องจากจำนวนกลุ่มไม่สามารถเป็นจำนวนเศษส่วนได้
หากอนุกรมช่วงเวลาที่มีกลุ่มจำนวนมากไม่เป็นที่พอใจสำหรับเกณฑ์บางอย่าง คุณสามารถสร้างอนุกรมช่วงเวลาใหม่ได้โดยการปัดเศษ มเป็นจำนวนเต็มที่น้อยกว่าแล้วเลือกจำนวนที่เหมาะสมกว่าจากสองแถว
จำนวนกลุ่มไม่ควรเกิน 15 กลุ่ม
คุณยังสามารถใช้ตารางต่อไปนี้ได้หากไม่สามารถคำนวณลอการิทึมทศนิยมได้เลย
การกำหนดความกว้างของช่วงเวลา
ความกว้างช่วงสำหรับชุดการแปรผันช่วงเวลาที่มีช่วงเวลาเท่ากันจะถูกกำหนดโดยสูตร:
โดยที่ X max คือค่าสูงสุดของ x i, X min คือค่าต่ำสุดของค่า x i; ม. - จำนวนกลุ่ม (ช่วงเวลา)
ขนาดของช่วงเวลา (ฉัน ) โดยปกติจะปัดเศษให้เป็นจำนวนเต็มที่ใกล้ที่สุดข้อยกเว้นเพียงอย่างเดียวคือกรณีที่ศึกษาความผันผวนเพียงเล็กน้อยของคุณลักษณะ (ตัวอย่างเช่น เมื่อจัดกลุ่มชิ้นส่วนตามขนาดของส่วนเบี่ยงเบนจากค่าที่ระบุ ซึ่งวัดเป็นเศษส่วนของมิลลิเมตร)
มักใช้กฎต่อไปนี้:
จำนวนตำแหน่งทศนิยม |
สัญลักษณ์จำนวนหนึ่งหลังเครื่องหมายจุลภาค |
ตัวอย่างความกว้างของช่วงโดยใช้สูตร |
เราปัดเศษไปที่เครื่องหมายอะไร? |
ตัวอย่างความกว้างของระยะห่างแบบโค้งมน |
การกำหนดขอบเขตของช่วงเวลา
ขีดจำกัดล่าง ช่วงแรกจะถูกนำมาเท่ากับค่าต่ำสุดของแอตทริบิวต์ (ส่วนใหญ่มักจะถูกปัดเศษเป็นจำนวนเต็มที่น้อยกว่าโดยมีอันดับเดียวกันกับความกว้างของช่วงเวลา) ตัวอย่างเช่น x นาที = 15, i=130, x n ของช่วงแรก = 10
x n1 หยาบคาย x นาที
ขีดจำกัดบนช่วงแรกสอดคล้องกับค่า (Xmin + ฉัน).
ขีดจำกัดล่างของช่วงที่สองจะเท่ากับขีดจำกัดบนของช่วงแรกเสมอ สำหรับกลุ่มที่ตามมา ขอบเขตจะถูกกำหนดในทำนองเดียวกัน นั่นคือค่าช่วงเวลาจะถูกเพิ่มอย่างต่อเนื่อง
x วี ฉัน = x n ฉัน +ฉัน
x n ฉัน = x วี ฉัน-1
กำหนดความถี่ของช่วงเวลา
เรานับจำนวนค่าในแต่ละช่วงเวลา ในเวลาเดียวกัน เราจำได้ว่าหากหน่วยมีค่าลักษณะเฉพาะเท่ากับค่าของขีดจำกัดบนของช่วงเวลา ก็ควรกำหนดหน่วยนั้นให้กับช่วงเวลาถัดไป
เราสร้างอนุกรมช่วงเวลาในรูปแบบของตาราง
กำหนดจุดกึ่งกลางของช่วงเวลา
สำหรับการวิเคราะห์อนุกรมช่วงเวลาเพิ่มเติม คุณจะต้องเลือกค่าลักษณะเฉพาะสำหรับแต่ละช่วงเวลา ค่าแอตทริบิวต์นี้จะเหมือนกันกับหน่วยการสังเกตทั้งหมดที่อยู่ในช่วงเวลานี้ เหล่านั้น. แต่ละองค์ประกอบ "สูญเสีย" ค่าแอตทริบิวต์แต่ละรายการและได้รับการกำหนดค่าแอตทริบิวต์ทั่วไปหนึ่งค่า ความหมายทั่วไปนี้ก็คือ ตรงกลางของช่วงเวลาซึ่งแสดงแทน เอ็กซ์" ฉัน .
จากตัวอย่างการเติบโตของเด็ก เรามาดูวิธีสร้างอนุกรมช่วงเวลาที่มีระยะห่างเท่ากันกัน
ข้อมูลเบื้องต้นที่มีอยู่
90, 91, 92, 93, 94, 95, 96, 97, 98, 99 , 92, 93, 94, 95, 96, 98 , , 100, 101, 102, 103, 104, 105, 106, 107, 108, 109 , 100, 101, 102, 104 , 110, 112, 114, 116, 117, 120, 122, 123, 124, 129, 110, 111, 113, 115, 116, 117, 121, 125, 126, 127 , 110, 111, 112, 113, 114, 115, 116, 117, 118, 119, 120, 121, 122, 123, 124, 125, 126, 127, 128, 129 , 111, 113, 116, 127 , 123, 122, 130, 131, 132, 133, 134, 136, 137, 138, 139, 140, 141, 142, 143, 144, 145, 146, 147, 148, 149, 150 , 131, 133, 135, 136, 138, 139, 140, 141, 142, 143, 145, 146, 147, 148