สรุปและจัดกลุ่มข้อมูลทางสถิติ กฎสำหรับการสร้างอนุกรมการแจกแจงแบบไม่ต่อเนื่องและแบบช่วงเวลา

เมื่อสร้างอนุกรมการแจกแจงตามช่วงเวลา คำถามสามข้อได้รับการแก้ไข:

  • 1. ควรเว้นช่วงกี่ช่วง?
  • 2. ระยะห่างเป็นเท่าใด?
  • 3. ขั้นตอนการรวมหน่วยประชากรภายในขอบเขตของช่วงเป็นอย่างไร
  • 1. จำนวนช่วงเวลาสามารถกำหนดได้โดย สูตรสเตอเจส:

2. ความยาวช่วงหรือขั้นตอนช่วงมักจะถูกกำหนดโดยสูตร

ที่ไหน ร-ช่วงของการเปลี่ยนแปลง

3. ลำดับการรวมหน่วยประชากรภายในขอบเขตของช่วงเวลา

อาจแตกต่างกัน แต่เมื่อสร้างอนุกรมช่วงเวลา จะต้องกำหนดการแจกแจงอย่างเคร่งครัด

ตัวอย่างเช่น สิ่งนี้: [) ซึ่งหน่วยประชากรจะรวมอยู่ในขอบเขตล่าง แต่ไม่รวมอยู่ในขอบเขตบน แต่จะถูกโอนไปยังช่วงถัดไป ข้อยกเว้นสำหรับกฎนี้คือช่วงสุดท้าย ซึ่งขีดจำกัดบนจะรวมหมายเลขสุดท้ายของลำดับอันดับด้วย

ขอบเขตของช่วงเวลาคือ:

  • ปิด - ด้วยค่าแอตทริบิวต์สุดขั้วสองค่า
  • เปิด - ด้วยค่าแอตทริบิวต์ที่มากสุดหนึ่งค่า (ก่อนดังกล่าวและจำนวนดังกล่าวหรือ เกินดังกล่าวและจำนวนดังกล่าว)

เพื่อที่จะซึมซับเนื้อหาทางทฤษฎีเราจึงแนะนำ ข้อมูลพื้นฐานสำหรับการแก้ปัญหา งานจากต้นจนจบ

มีข้อมูลแบบมีเงื่อนไขเกี่ยวกับจำนวนผู้จัดการฝ่ายขายโดยเฉลี่ย ปริมาณของสินค้าที่คล้ายกันที่ขาย ราคาตลาดแต่ละรายการสำหรับผลิตภัณฑ์นี้ รวมถึงปริมาณการขายของ 30 บริษัท ในภูมิภาคใดภูมิภาคหนึ่งของสหพันธรัฐรัสเซียในช่วงแรก ไตรมาสของปีรายงาน (ตาราง 2.1)

ตารางที่ 2.1

ข้อมูลเบื้องต้นสำหรับงานตัดขวาง

ตัวเลข

ผู้จัดการ

ราคาพันรูเบิล

ปริมาณการขายล้านรูเบิล

ตัวเลข

ผู้จัดการ

จำนวนสินค้าที่ขาย ชิ้น

ราคาพันรูเบิล

ปริมาณการขายล้านรูเบิล

เราจะจัดเตรียมงานแต่ละงานตามข้อมูลเบื้องต้นตลอดจนข้อมูลเพิ่มเติม จากนั้นเราจะนำเสนอวิธีการในการแก้ปัญหาและวิธีแก้ปัญหาด้วยตนเอง

งานตัดขวาง งาน 2.1

การใช้ข้อมูลเริ่มต้นจากตาราง 2.1 จำเป็นสร้างชุดการกระจายของบริษัทแยกตามปริมาณสินค้าที่ขาย (ตารางที่ 2.2)

สารละลาย:

ตารางที่ 2.2

การกระจายตัวของ บริษัท แบบแยกส่วนตามปริมาณสินค้าที่ขายในภูมิภาคใดภูมิภาคหนึ่งของสหพันธรัฐรัสเซียในไตรมาสแรกของปีที่รายงาน

งานตัดขวาง งาน 2.2

ที่จำเป็นสร้างบริษัทที่ได้รับการจัดอันดับ 30 บริษัทตามจำนวนผู้จัดการโดยเฉลี่ย

สารละลาย:

15; 17; 18; 20; 20; 20; 22; 22; 24; 25; 25; 25; 27; 27; 27; 28; 29; 30; 32; 32; 33; 33; 33; 34; 35; 35; 38; 39; 39; 45.

งานตัดขวาง งาน 2.3

การใช้ข้อมูลเริ่มต้นจากตาราง 2.1, ที่จำเป็น:

  • 1. สร้างชุดการกระจายของบริษัทตามจำนวนผู้จัดการ
  • 2. คำนวณความถี่ของชุดการจำหน่ายของบริษัท
  • 3. วาดข้อสรุป

สารละลาย:

ลองคำนวณโดยใช้สูตรสเตอเจส (2.5) จำนวนช่วงเวลา:

ดังนั้นเราจึงใช้เวลา 6 ช่วง (กลุ่ม)

ความยาวช่วง, หรือ ขั้นตอนช่วงเวลาให้คำนวณโดยใช้สูตร

บันทึก.ลำดับการรวมหน่วยประชากรในขอบเขตของช่วงมีดังนี้: I) ซึ่งหน่วยประชากรจะรวมอยู่ในขอบเขตล่าง แต่ไม่รวมอยู่ในขอบเขตบน แต่จะถูกโอนไปยังช่วงถัดไป ข้อยกเว้นสำหรับกฎนี้คือช่วงสุดท้าย I ] ซึ่งขีดจำกัดบนจะรวมหมายเลขสุดท้ายของซีรีส์การจัดอันดับด้วย

เราสร้างอนุกรมช่วงเวลา (ตารางที่ 2.3)

การกระจายตัวของ บริษัท และจำนวนผู้จัดการโดยเฉลี่ยในภูมิภาคใดภูมิภาคหนึ่งของสหพันธรัฐรัสเซียในช่วงไตรมาสแรกของปีที่รายงาน

บทสรุป.กลุ่มบริษัทที่ใหญ่ที่สุดคือกลุ่มที่มีจำนวนผู้จัดการโดยเฉลี่ย 25-30 คน ซึ่งรวมถึง 8 บริษัท (27%) กลุ่มที่เล็กที่สุดซึ่งมีผู้จัดการโดยเฉลี่ย 40-45 คน มีเพียงบริษัทเดียวเท่านั้น (3%)

การใช้ข้อมูลเริ่มต้นจากตาราง 2.1 เช่นเดียวกับชุดการกระจายของ บริษัท ตามจำนวนผู้จัดการ (ตารางที่ 2.3) ที่จำเป็นสร้างการจัดกลุ่มเชิงวิเคราะห์ของความสัมพันธ์ระหว่างจำนวนผู้จัดการและปริมาณการขายของ บริษัท และสรุปเกี่ยวกับการมีอยู่ (หรือไม่มี) ของความสัมพันธ์ระหว่างลักษณะเหล่านี้

สารละลาย:

การจัดกลุ่มการวิเคราะห์ขึ้นอยู่กับลักษณะของปัจจัย ในปัญหาของเรา ลักษณะปัจจัย (x) คือจำนวนผู้จัดการ และลักษณะผลลัพธ์ (y) คือปริมาณการขาย (ตารางที่ 2.4)

มาสร้างกันเลย การจัดกลุ่มเชิงวิเคราะห์(ตารางที่ 2.5)

บทสรุป.จากข้อมูลของการจัดกลุ่มการวิเคราะห์ที่สร้างขึ้น เราสามารถพูดได้ว่าเมื่อจำนวนผู้จัดการฝ่ายขายเพิ่มขึ้น ปริมาณการขายเฉลี่ยของบริษัทในกลุ่มก็เพิ่มขึ้นเช่นกัน ซึ่งบ่งบอกถึงความเชื่อมโยงโดยตรงระหว่างลักษณะเหล่านี้

ตารางที่ 2.4

ตารางเสริมสำหรับการสร้างกลุ่มการวิเคราะห์

จำนวนผู้จัดการ คน

หมายเลขบริษัท

ปริมาณการขายล้านรูเบิล y

" = 59 ฉ = 9.97

ฉัน-™ 4 -ย.22

74'25 1PY1

ยู4 = 7 = 10,61

ที่ = ’ =10,31 30

ตารางที่ 2.5

การพึ่งพาปริมาณการขายกับจำนวนผู้จัดการบริษัทในภูมิภาคใดภูมิภาคหนึ่งของสหพันธรัฐรัสเซียในไตรมาสแรกของปีที่รายงาน

คำถามควบคุม
  • 1. สาระสำคัญของการสังเกตทางสถิติคืออะไร?
  • 2. ตั้งชื่อขั้นตอนการสังเกตทางสถิติ
  • 3. รูปแบบการสังเกตทางสถิติขององค์กรมีรูปแบบใดบ้าง?
  • 4. ตั้งชื่อประเภทการสังเกตทางสถิติ
  • 5. สรุปทางสถิติคืออะไร?
  • 6. ตั้งชื่อประเภทของรายงานทางสถิติ
  • 7. การจัดกลุ่มทางสถิติคืออะไร?
  • 8. ตั้งชื่อประเภทของการจัดกลุ่มทางสถิติ
  • 9. ซีรีย์การจัดจำหน่ายคืออะไร?
  • 10. ตั้งชื่อองค์ประกอบโครงสร้างของแถวการแจกจ่าย
  • 11. ขั้นตอนการสร้างซีรีย์การจัดจำหน่ายมีขั้นตอนอย่างไร?

หากตัวแปรสุ่มภายใต้การศึกษามีความต่อเนื่องการจัดอันดับและการจัดกลุ่มค่าที่สังเกตได้มักจะไม่อนุญาตให้ระบุลักษณะเฉพาะของการแปรผันในค่าของมัน สิ่งนี้อธิบายได้จากข้อเท็จจริงที่ว่าค่าแต่ละค่าของตัวแปรสุ่มสามารถแตกต่างกันได้เพียงเล็กน้อยเท่าที่ต้องการ ดังนั้นในจำนวนรวมของข้อมูลที่สังเกต ค่าที่เหมือนกันของปริมาณจึงแทบจะไม่เกิดขึ้น และความถี่ของ ตัวแปรที่แตกต่างกันเล็กน้อยจากกัน

นอกจากนี้ยังเป็นไปไม่ได้ที่จะสร้างอนุกรมแบบแยกสำหรับตัวแปรสุ่มแบบไม่ต่อเนื่องซึ่งจำนวนค่าที่เป็นไปได้ซึ่งมีขนาดใหญ่ ในกรณีเช่นนี้คุณควรสร้าง อนุกรมการเปลี่ยนแปลงช่วงเวลา การแจกแจง

ในการสร้างอนุกรมดังกล่าว ช่วงเวลาทั้งหมดของการเปลี่ยนแปลงของค่าที่สังเกตได้ของตัวแปรสุ่มจะถูกแบ่งออกเป็นอนุกรม ช่วงเวลาบางส่วน และการนับความถี่ของการเกิดขึ้นของค่าในแต่ละช่วงย่อย

อนุกรมความแปรผันของช่วงเรียกชุดช่วงเวลาที่เรียงลำดับของค่าที่แตกต่างกันของตัวแปรสุ่มที่มีความถี่ที่สอดคล้องกันหรือความถี่สัมพัทธ์ของค่าของตัวแปรที่ตกอยู่ในแต่ละค่า

ในการสร้างอนุกรมช่วงเวลาที่คุณต้องการ:

  1. กำหนด ขนาด ช่วงเวลาบางส่วน
  2. กำหนด ความกว้าง ช่วงเวลา;
  3. กำหนดไว้ในแต่ละช่วงเวลา สูงสุด และ ขีดจำกัดล่าง ;
  4. จัดกลุ่มผลการสังเกต

1 - คำถามในการเลือกจำนวนและความกว้างของช่วงเวลาการจัดกลุ่มจะต้องได้รับการตัดสินใจในแต่ละกรณีโดยเฉพาะ เป้าหมาย วิจัย, ปริมาณ ตัวอย่างและ ระดับของการเปลี่ยนแปลง ลักษณะเฉพาะในตัวตัวอย่าง

จำนวนช่วงโดยประมาณ เค สามารถประมาณได้ตามขนาดตัวอย่างเท่านั้น n ด้วยวิธีใดวิธีหนึ่งดังต่อไปนี้:

  • ตามสูตร สเตอร์เจส : k = 1 + 3.32 บันทึก n ;
  • โดยใช้ตารางที่ 1

ตารางที่ 1

2 - โดยทั่วไปควรใช้ช่องว่างที่มีความกว้างเท่ากัน เพื่อกำหนดความกว้างของช่วงเวลา ชม. คำนวณ:

  • ช่วงของการเปลี่ยนแปลง R - ค่าตัวอย่าง: R = x สูงสุด - x นาที ,

ที่ไหน xmax และ เอ็กซ์มิน - ตัวเลือกการสุ่มตัวอย่างสูงสุดและต่ำสุด

  • ความกว้างของแต่ละช่วง ชม. กำหนดโดยสูตรต่อไปนี้: ชั่วโมง = R/k .

3 . บรรทัดล่าง ช่วงแรก xh1 ถูกเลือกเพื่อให้มีตัวเลือกตัวอย่างขั้นต่ำ เอ็กซ์มิน ลดลงประมาณกลางช่วงเวลานี้: x h1 = x นาที - 0.5 ชม .

ระยะกลางได้มาจากการเพิ่มความยาวของช่วงบางส่วนต่อท้ายช่วงก่อนหน้า ชม. :

x สูง = x สูง-1 +h.

การสร้างมาตราส่วนช่วงเวลาตามการคำนวณขอบเขตของช่วงเวลาจะดำเนินต่อไปจนกระทั่งถึงค่า สวัสดี ตอบสนองความสัมพันธ์:

สวัสดี< x max + 0,5·h .

4 - ตามมาตราส่วนช่วงเวลาค่าลักษณะจะถูกจัดกลุ่ม - สำหรับแต่ละช่วงเวลาบางส่วนจะมีการคำนวณผลรวมของความถี่ ฉัน ตัวเลือกที่รวมอยู่ใน ฉัน ช่วงเวลาที่. ในกรณีนี้ ช่วงจะรวมค่าของตัวแปรสุ่มที่มากกว่าหรือเท่ากับขีดจำกัดล่างและน้อยกว่าขีดจำกัดบนของช่วงเวลา

รูปหลายเหลี่ยมและฮิสโตแกรม

เพื่อความชัดเจน จึงได้มีการสร้างกราฟการกระจายทางสถิติต่างๆ

พวกมันสร้างขึ้นจากข้อมูลของอนุกรมความแปรผันแบบแยกส่วน รูปหลายเหลี่ยม ความถี่หรือความถี่สัมพัทธ์

รูปหลายเหลี่ยมความถี่ x1 ; หมายเลข 1 ), (x2 ; หมายเลข 2 ), ..., (เอ็กซ์เค ; ไม่เป็นไร - ในการสร้างรูปหลายเหลี่ยมความถี่ ตัวเลือกต่างๆ จะถูกพล็อตบนแกนแอบซิสซา x ฉัน และในการกำหนด - ความถี่ที่สอดคล้องกัน ฉัน - คะแนน ( x ฉัน ; ฉัน ) เชื่อมต่อกันด้วยส่วนตรงและได้รับรูปหลายเหลี่ยมความถี่ (รูปที่ 1)

รูปหลายเหลี่ยมของความถี่สัมพัทธ์เรียกว่าเส้นขาดที่มีส่วนเชื่อมต่อจุด ( x1 ; ว 1 ), (x2 ; ว 2 ), ..., (เอ็กซ์เค ; สัปดาห์ - ในการสร้างรูปหลายเหลี่ยมที่มีความถี่สัมพัทธ์ ตัวเลือกต่างๆ จะถูกพล็อตบนแกนแอบซิสซา x ฉัน และบนพิกัด - ความถี่สัมพัทธ์ที่สอดคล้องกัน ฉัน - คะแนน ( x ฉัน ; ฉัน ) เชื่อมต่อกันด้วยส่วนตรงและได้รับรูปหลายเหลี่ยมของความถี่สัมพัทธ์

เมื่อไร สัญญาณต่อเนื่อง ขอแนะนำให้สร้าง ฮิสโตแกรม .

ฮิสโตแกรมความถี่เรียกว่ารูปก้าวประกอบด้วยสี่เหลี่ยมซึ่งมีฐานเป็นช่วงความยาวบางส่วน ชม. และความสูงเท่ากับอัตราส่วน NIH (ความหนาแน่นของความถี่)

ในการสร้างฮิสโตแกรมความถี่ ช่วงเวลาบางส่วนจะถูกวางบนแกน Abscissa และส่วนที่ขนานกับแกน Abscissa จะถูกวาดไว้เหนือพวกมันในระยะไกล NIH .

ขั้นตอนที่สำคัญที่สุดในการศึกษาปรากฏการณ์และกระบวนการทางเศรษฐกิจและสังคมคือการจัดระบบข้อมูลปฐมภูมิและบนพื้นฐานนี้การได้รับลักษณะสรุปของวัตถุทั้งหมดโดยใช้ตัวบ่งชี้ทั่วไป ซึ่งทำได้โดยการสรุปและจัดกลุ่มวัสดุทางสถิติหลัก

สรุปทางสถิติ - นี่เป็นการดำเนินการที่ซับซ้อนตามลำดับเพื่อสรุปข้อเท็จจริงเฉพาะของแต่ละบุคคลซึ่งก่อตัวเป็นชุดเพื่อระบุคุณลักษณะและรูปแบบทั่วไปที่มีอยู่ในปรากฏการณ์ที่กำลังศึกษาโดยรวม การจัดทำสรุปทางสถิติประกอบด้วยขั้นตอนดังต่อไปนี้ :

  • การเลือกลักษณะการจัดกลุ่ม
  • การกำหนดลำดับการก่อตัวของกลุ่ม
  • การพัฒนาระบบตัวบ่งชี้ทางสถิติเพื่อระบุลักษณะกลุ่มและวัตถุโดยรวม
  • การพัฒนาโครงร่างตารางสถิติเพื่อนำเสนอผลสรุป

การจัดกลุ่มทางสถิติ เรียกว่าการแบ่งหน่วยของประชากรที่กำลังศึกษาออกเป็นกลุ่มเนื้อเดียวกันตามลักษณะเฉพาะที่จำเป็นต่อพวกเขา การจัดกลุ่มเป็นวิธีทางสถิติที่สำคัญที่สุดในการสรุปข้อมูลทางสถิติ ซึ่งเป็นพื้นฐานสำหรับการคำนวณตัวบ่งชี้ทางสถิติที่ถูกต้อง

การจัดกลุ่มประเภทต่อไปนี้มีความโดดเด่น: ประเภท, โครงสร้าง, การวิเคราะห์ การจัดกลุ่มทั้งหมดนี้รวมกันโดยข้อเท็จจริงที่ว่าหน่วยของวัตถุถูกแบ่งออกเป็นกลุ่มตามลักษณะบางอย่าง

คุณลักษณะการจัดกลุ่ม เป็นลักษณะที่หน่วยประชากรถูกแบ่งออกเป็นกลุ่มต่างๆ ข้อสรุปของการศึกษาทางสถิติขึ้นอยู่กับการเลือกลักษณะการจัดกลุ่มที่ถูกต้อง เป็นพื้นฐานสำหรับการจัดกลุ่ม จำเป็นต้องใช้คุณลักษณะที่มีนัยสำคัญตามทฤษฎี (เชิงปริมาณหรือเชิงคุณภาพ)

ลักษณะเชิงปริมาณของการจัดกลุ่ม มีการแสดงตัวเลข (ปริมาณการซื้อขาย อายุของบุคคล รายได้ของครอบครัว ฯลฯ) และ สัญญาณเชิงคุณภาพของการจัดกลุ่ม สะท้อนถึงสถานะของหน่วยประชากร (เพศ, สถานภาพการสมรส, อุตสาหกรรมขององค์กร, รูปแบบการเป็นเจ้าของ ฯลฯ )

หลังจากกำหนดพื้นฐานของการจัดกลุ่มแล้ว จะต้องตัดสินใจคำถามเกี่ยวกับจำนวนกลุ่มที่ควรแบ่งประชากรภายใต้การศึกษา จำนวนกลุ่มขึ้นอยู่กับวัตถุประสงค์ของการศึกษาและประเภทของตัวบ่งชี้ที่เป็นพื้นฐานของการจัดกลุ่ม ปริมาณของประชากร และระดับของการเปลี่ยนแปลงของลักษณะเฉพาะ

ตัวอย่างเช่น การจัดกลุ่มวิสาหกิจตามประเภทความเป็นเจ้าของจะคำนึงถึงทรัพย์สินของเทศบาล รัฐบาลกลาง และของรัฐบาลกลาง หากดำเนินการจัดกลุ่มตามเกณฑ์เชิงปริมาณก็จำเป็นต้องให้ความสนใจเป็นพิเศษกับจำนวนหน่วยของวัตถุที่ศึกษาและระดับความผันผวนของลักษณะการจัดกลุ่ม

เมื่อกำหนดจำนวนกลุ่มแล้ว จะต้องกำหนดช่วงเวลาการจัดกลุ่ม ช่วงเวลา - นี่คือค่าของคุณลักษณะที่แตกต่างกันซึ่งอยู่ภายในขอบเขตที่กำหนด แต่ละช่วงเวลามีค่าของตัวเอง ขอบเขตบนและล่าง หรืออย่างน้อยหนึ่งขอบเขต

ขีดจำกัดล่างของช่วงเวลา เรียกว่าค่าที่น้อยที่สุดของคุณลักษณะในช่วงเวลา และ ขีด จำกัด บน - ค่าสูงสุดของคุณลักษณะในช่วงเวลา ค่าของช่วงเวลาคือความแตกต่างระหว่างขอบเขตบนและล่าง

ช่วงเวลาการจัดกลุ่มจะเท่ากันหรือไม่เท่ากัน ขึ้นอยู่กับขนาด หากการแปรผันของคุณลักษณะปรากฏภายในขอบเขตที่ค่อนข้างแคบและมีการกระจายสม่ำเสมอ แสดงว่ากลุ่มจะถูกสร้างขึ้นในช่วงเวลาที่เท่ากัน ค่าของช่วงเวลาที่เท่ากันถูกกำหนดโดยสูตรต่อไปนี้ :

โดยที่ Xmax, Xmin คือค่าสูงสุดและต่ำสุดของคุณลักษณะในการรวม n - จำนวนกลุ่ม

การจัดกลุ่มที่ง่ายที่สุดซึ่งแต่ละกลุ่มที่เลือกจะมีตัวบ่งชี้หนึ่งตัวแสดงถึงชุดการแจกจ่าย

ชุดการกระจายทางสถิติ - นี่คือการกระจายหน่วยประชากรออกเป็นกลุ่มตามลำดับตามลักษณะเฉพาะ ขึ้นอยู่กับคุณลักษณะที่เป็นรากฐานของการก่อตัวของอนุกรมการแจกแจง ซีรีส์การแจกแจงแบบระบุแหล่งที่มาและแบบแปรผันจะมีความโดดเด่น

แอตทริบิวต์ เรียกว่าชุดการจัดจำหน่ายที่สร้างขึ้นตามลักษณะเชิงคุณภาพ กล่าวคือ ลักษณะที่ไม่มีการแสดงออกทางตัวเลข (การกระจายตามประเภทของแรงงาน ตามเพศ ตามอาชีพ เป็นต้น) ชุดการแจกแจงแบบระบุลักษณะองค์ประกอบของประชากรตามลักษณะสำคัญบางประการ ข้อมูลเหล่านี้ใช้เวลาหลายช่วงเวลาทำให้สามารถศึกษาการเปลี่ยนแปลงโครงสร้างได้

ซีรี่ส์รูปแบบต่างๆ เรียกว่าชุดการแจกจ่ายที่สร้างขึ้นบนพื้นฐานเชิงปริมาณ ซีรีย์รูปแบบใดๆ ประกอบด้วยสององค์ประกอบ: ตัวเลือกและความถี่ ตัวเลือก ค่าแต่ละค่าของคุณลักษณะที่ใช้ในชุดรูปแบบเรียกว่าค่าเฉพาะของคุณลักษณะที่แตกต่างกัน

ความถี่ จะมีการเรียกหมายเลขของตัวแปรแต่ละตัวหรือแต่ละกลุ่มของซีรีย์ของตัวแปร นั่นคือตัวเลขเหล่านี้ที่แสดงว่าตัวแปรบางตัวเกิดขึ้นในซีรีย์การแจกแจงบ่อยแค่ไหน ผลรวมของความถี่ทั้งหมดจะกำหนดขนาดของประชากรทั้งหมดและปริมาตรของมัน ความถี่ เรียกว่าความถี่ที่แสดงเป็นเศษส่วนของหน่วยหรือเป็นเปอร์เซ็นต์ของทั้งหมด ดังนั้นผลรวมของความถี่จึงเท่ากับ 1 หรือ 100%

ขึ้นอยู่กับลักษณะของการเปลี่ยนแปลงของคุณลักษณะ อนุกรมรูปแบบสามรูปแบบจะมีความโดดเด่น: อนุกรมอันดับ อนุกรมแยก และอนุกรมช่วง

จัดอันดับซีรีส์รูปแบบต่างๆ - นี่คือการกระจายของแต่ละหน่วยของประชากรโดยเรียงลำดับจากน้อยไปหามากหรือจากมากไปหาน้อยของลักษณะที่กำลังศึกษา การจัดอันดับช่วยให้คุณแบ่งข้อมูลเชิงปริมาณออกเป็นกลุ่มได้อย่างง่ายดาย ตรวจจับค่าที่เล็กที่สุดและใหญ่ที่สุดของลักษณะเฉพาะได้ทันที และเน้นค่าที่ซ้ำกันบ่อยที่สุด

ซีรี่ส์รูปแบบที่ไม่ต่อเนื่อง ระบุลักษณะการกระจายของหน่วยประชากรตามลักษณะเฉพาะที่ไม่ต่อเนื่องซึ่งรับเฉพาะค่าจำนวนเต็ม ตัวอย่างเช่น หมวดหมู่ภาษี จำนวนเด็กในครอบครัว จำนวนพนักงานในองค์กร เป็นต้น

หากคุณลักษณะมีการเปลี่ยนแปลงอย่างต่อเนื่องซึ่งภายในขอบเขตที่กำหนดสามารถรับค่าใด ๆ (“จาก - ถึง”) ได้ดังนั้นสำหรับคุณลักษณะนี้จำเป็นต้องสร้าง อนุกรมการเปลี่ยนแปลงช่วงเวลา - ตัวอย่างเช่น จำนวนรายได้ ระยะเวลาการให้บริการ ต้นทุนสินทรัพย์ถาวรขององค์กร เป็นต้น

ตัวอย่างการแก้ปัญหาในหัวข้อ “สรุปทางสถิติ และการจัดกลุ่ม”

ปัญหาที่ 1 - มีข้อมูลเกี่ยวกับจำนวนหนังสือที่นักเรียนได้รับจากการสมัครสมาชิกในปีการศึกษาที่ผ่านมา

สร้างซีรีส์การแจกแจงรูปแบบการจัดอันดับและแยกส่วน โดยกำหนดองค์ประกอบของซีรีส์

สารละลาย

ชุดนี้แสดงถึงตัวเลือกมากมายสำหรับจำนวนหนังสือที่นักเรียนได้รับ ลองนับจำนวนตัวเลือกดังกล่าวแล้วจัดเรียงในรูปแบบของซีรีส์การแจกแจงแบบแยกส่วนแบบจัดอันดับแบบผันแปรและแบบแปรผัน

ปัญหาที่ 2 - มีข้อมูลเกี่ยวกับต้นทุนของสินทรัพย์ถาวรสำหรับ 50 องค์กรพันรูเบิล

สร้างชุดการแจกจ่ายโดยเน้นกลุ่มวิสาหกิจ 5 กลุ่ม (ในช่วงเวลาเท่ากัน)

สารละลาย

ในการแก้ปัญหาเราจะเลือกมูลค่าที่ใหญ่ที่สุดและเล็กที่สุดของมูลค่าสินทรัพย์ถาวรขององค์กร เหล่านี้คือ 30.0 และ 10.2 พันรูเบิล

มาหาขนาดของช่วงเวลา: h = (30.0-10.2):5= 3.96 พันรูเบิล

จากนั้นกลุ่มแรกจะรวมองค์กรที่มีสินทรัพย์ถาวรจำนวน 10.2 พันรูเบิล สูงถึง 10.2+3.96=14.16 พันรูเบิล จะมี 9 องค์กรดังกล่าว กลุ่มที่สองจะรวมองค์กรที่มีสินทรัพย์ถาวรจำนวน 14.16 พันรูเบิล สูงถึง 14.16+3.96=18.12 พันรูเบิล จะมีวิสาหกิจดังกล่าวจำนวน 16 แห่ง เราจะพบจำนวนวิสาหกิจที่รวมอยู่ในกลุ่มที่สาม สี่ และห้า

เราวางซีรีย์การแจกจ่ายผลลัพธ์ลงในตาราง

ปัญหา 3 - ข้อมูลต่อไปนี้ได้รับจากองค์กรอุตสาหกรรมเบาจำนวนหนึ่ง:

จัดกลุ่มวิสาหกิจตามจำนวนคนงาน โดยแบ่งเป็น 6 กลุ่มในช่วงเวลาเท่าๆ กัน คำนวณสำหรับแต่ละกลุ่ม:

1. จำนวนวิสาหกิจ
2. จำนวนคนงาน
3.ปริมาณสินค้าที่ผลิตต่อปี
4. ผลผลิตจริงโดยเฉลี่ยต่อคนงาน
5.ปริมาณสินทรัพย์ถาวร
6. ขนาดเฉลี่ยของสินทรัพย์ถาวรของหนึ่งองค์กร
7. มูลค่าเฉลี่ยของผลิตภัณฑ์ที่ผลิตโดยองค์กรเดียว

นำเสนอผลการคำนวณเป็นตาราง วาดข้อสรุป

สารละลาย

ในการแก้ปัญหา เราจะเลือกค่าที่ใหญ่ที่สุดและน้อยที่สุดของจำนวนพนักงานโดยเฉลี่ยในองค์กร คือ 43 และ 256

ลองหาขนาดของช่วงเวลา: h = (256-43):6 = 35.5

จากนั้นกลุ่มแรกจะรวมวิสาหกิจที่มีจำนวนคนงานโดยเฉลี่ยอยู่ระหว่าง 43 ถึง 43 + 35.5 = 78.5 คน จะมีวิสาหกิจดังกล่าวจำนวน 5 แห่ง กลุ่มที่สองจะรวมวิสาหกิจที่มีจำนวนคนงานโดยเฉลี่ยตั้งแต่ 78.5 ถึง 78.5+35.5=114 คน จะมี 12 วิสาหกิจดังกล่าว ในทำนองเดียวกัน เราจะค้นหาจำนวนวิสาหกิจที่รวมอยู่ในกลุ่มที่สาม สี่ ห้า และหก

เราวางชุดการแจกแจงผลลัพธ์ลงในตารางและคำนวณตัวบ่งชี้ที่จำเป็นสำหรับแต่ละกลุ่ม:

บทสรุป : ดังที่เห็นจากตาราง วิสาหกิจกลุ่มที่ 2 มีจำนวนมากที่สุด ประกอบด้วย 12 รัฐวิสาหกิจ กลุ่มที่เล็กที่สุดคือกลุ่มที่ห้าและหก (กลุ่มละ 2 แห่ง) เหล่านี้เป็นองค์กรที่ใหญ่ที่สุด (ในแง่ของจำนวนคนงาน)

เนื่องจากกลุ่มที่สองเป็นกลุ่มที่ใหญ่ที่สุดปริมาณผลิตภัณฑ์ที่ผลิตต่อปีโดยองค์กรของกลุ่มนี้และปริมาณสินทรัพย์ถาวรจึงสูงกว่ากลุ่มอื่นอย่างมาก ในขณะเดียวกัน ผลผลิตจริงโดยเฉลี่ยต่อคนงานในองค์กรในกลุ่มนี้ก็ไม่ได้สูงที่สุด องค์กรของกลุ่มที่สี่กำลังเป็นผู้นำที่นี่ กลุ่มนี้ยังคิดเป็นปริมาณสินทรัพย์ถาวรที่ค่อนข้างใหญ่

โดยสรุป เราทราบว่าขนาดเฉลี่ยของสินทรัพย์ถาวรและจำนวนผลผลิตเฉลี่ยที่ผลิตโดยองค์กรหนึ่งนั้นเป็นสัดส่วนโดยตรงกับขนาดขององค์กร (ในแง่ของจำนวนคนงาน)

เงื่อนไข:

มีข้อมูลเกี่ยวกับองค์ประกอบอายุของคนงาน (ปี): 18, 38, 28, 29, 26, 38, 34, 22, 28, 30, 22, 23, 35, 33, 27, 24, 30, 32, 28 , 25, 29, 26, 31, 24, 29, 27, 32, 25, 29, 29.

    1. สร้างอนุกรมการแจกแจงตามช่วงเวลา
    2. สร้างการแสดงภาพกราฟิกของซีรีส์
    3. กำหนดโหมดและค่ามัธยฐานแบบกราฟิก

สารละลาย:

1) ตามสูตรสเตอเจส ประชากรจะต้องแบ่งออกเป็น 1 + 3.322 lg 30 = 6 กลุ่ม

อายุสูงสุด - 38 ปี ขั้นต่ำ - 18 ปี

ความกว้างของช่วง เนื่องจากจุดสิ้นสุดของช่วงต้องเป็นจำนวนเต็ม เราจึงแบ่งประชากรออกเป็น 5 กลุ่ม ความกว้างช่วง - 4

เพื่อให้การคำนวณง่ายขึ้น เราจะจัดเรียงข้อมูลจากน้อยไปมาก: 18, 22, 22, 23, 24, 24, 25, 25, 26, 26, 27, 27, 28, 28, 28, 29, 29, 29, 29, 29, 30 , 30, 31, 32, 32, 33, 34, 35, 38, 38.

การกระจายอายุของคนงาน

ในเชิงกราฟิก ซีรีส์สามารถแสดงเป็นฮิสโตแกรมหรือรูปหลายเหลี่ยมได้ ฮิสโตแกรม - แผนภูมิแท่ง ฐานของคอลัมน์คือความกว้างของช่วงเวลา ความสูงของคอลัมน์เท่ากับความถี่

รูปหลายเหลี่ยม (หรือรูปหลายเหลี่ยมการกระจาย) - กราฟความถี่ ในการสร้างมันโดยใช้ฮิสโตแกรม เราเชื่อมต่อจุดกึ่งกลางของด้านบนของสี่เหลี่ยม เราปิดรูปหลายเหลี่ยมบนแกน Ox ในระยะทางเท่ากับครึ่งหนึ่งของช่วงเวลาจากค่าสุดขีดของ x

โหมด (Mo) คือค่าของคุณลักษณะที่กำลังศึกษา ซึ่งเกิดขึ้นบ่อยที่สุดในประชากรที่กำหนด

ในการกำหนดโหมดจากฮิสโตแกรม คุณจะต้องเลือกสี่เหลี่ยมที่สูงที่สุด ลากเส้นจากจุดยอดด้านขวาของสี่เหลี่ยมนี้ไปยังมุมขวาบนของสี่เหลี่ยมก่อนหน้า และจากจุดยอดซ้ายของสี่เหลี่ยมโมดอล ให้ลากเส้นไปที่ จุดยอดซ้ายของสี่เหลี่ยมถัดไป จากจุดตัดกันของเส้นเหล่านี้ ให้วาดตั้งฉากกับแกน x พวก Abscissa จะเป็นแฟชั่น โม µ 27.5 ซึ่งหมายความว่าอายุที่พบบ่อยที่สุดในประชากรกลุ่มนี้คือ 27-28 ปี

ค่ามัธยฐาน (Me) คือค่าของคุณลักษณะที่กำลังศึกษา ซึ่งอยู่ตรงกลางของอนุกรมการเปลี่ยนแปลงแบบเรียงลำดับ

เราหาค่ามัธยฐานโดยใช้การสะสม Cumulates - กราฟความถี่สะสม Abscissas เป็นรูปแบบหนึ่งของซีรีส์ Ordinates เป็นความถี่สะสม

ในการหาค่ามัธยฐานเหนือการสะสม เราจะพบจุดตามแกนกำหนดซึ่งสอดคล้องกับ 50% ของความถี่สะสม (ในกรณีของเรา 15) ลากเส้นตรงผ่านจุดนั้น ขนานกับแกน Ox และจากจุดที่ จุดตัดกับจุดสะสม ให้วาดตั้งฉากกับแกน x Abscissa คือค่ามัธยฐาน ฉัน 25.9. ซึ่งหมายความว่าครึ่งหนึ่งของคนงานในประชากรกลุ่มนี้มีอายุต่ำกว่า 26 ปี

จำนวนกลุ่ม (ช่วง)ถูกกำหนดโดยประมาณโดยสูตรสเตอเจส:

m = 1 + 3.322 × บันทึก(n)

โดยที่ n คือจำนวนหน่วยการสังเกตทั้งหมด (จำนวนองค์ประกอบทั้งหมดในประชากร ฯลฯ) log(n) คือลอการิทึมฐานสิบของ n

ได้รับ ตามสูตรสเตอเจส ค่ามักจะถูกปัดเศษให้เป็นจำนวนเต็มที่ใกล้ที่สุดตัวเลข เนื่องจากจำนวนกลุ่มไม่สามารถเป็นจำนวนเศษส่วนได้

หากอนุกรมช่วงเวลาที่มีกลุ่มจำนวนมากไม่เป็นที่พอใจสำหรับเกณฑ์บางอย่าง คุณสามารถสร้างอนุกรมช่วงเวลาใหม่ได้โดยการปัดเศษ เป็นจำนวนเต็มที่น้อยกว่าแล้วเลือกจำนวนที่เหมาะสมกว่าจากสองแถว

จำนวนกลุ่มไม่ควรเกิน 15 กลุ่ม

คุณยังสามารถใช้ตารางต่อไปนี้ได้หากไม่สามารถคำนวณลอการิทึมทศนิยมได้เลย

    การกำหนดความกว้างของช่วงเวลา

ความกว้างช่วงสำหรับชุดการแปรผันช่วงเวลาที่มีช่วงเวลาเท่ากันจะถูกกำหนดโดยสูตร:

โดยที่ X max คือค่าสูงสุดของ x i, X min คือค่าต่ำสุดของค่า x i; ม. - จำนวนกลุ่ม (ช่วงเวลา)

ขนาดของช่วงเวลา (ฉัน ) โดยปกติจะปัดเศษให้เป็นจำนวนเต็มที่ใกล้ที่สุดข้อยกเว้นเพียงอย่างเดียวคือกรณีที่ศึกษาความผันผวนเพียงเล็กน้อยของคุณลักษณะ (ตัวอย่างเช่น เมื่อจัดกลุ่มชิ้นส่วนตามขนาดของส่วนเบี่ยงเบนจากค่าที่ระบุ ซึ่งวัดเป็นเศษส่วนของมิลลิเมตร)

มักใช้กฎต่อไปนี้:

จำนวนตำแหน่งทศนิยม

สัญลักษณ์จำนวนหนึ่งหลังเครื่องหมายจุลภาค

ตัวอย่างความกว้างของช่วงโดยใช้สูตร

เราปัดเศษไปที่เครื่องหมายอะไร?

ตัวอย่างความกว้างของระยะห่างแบบโค้งมน

    การกำหนดขอบเขตของช่วงเวลา

ขีดจำกัดล่าง ช่วงแรกจะถูกนำมาเท่ากับค่าต่ำสุดของแอตทริบิวต์ (ส่วนใหญ่มักจะถูกปัดเศษเป็นจำนวนเต็มที่น้อยกว่าโดยมีอันดับเดียวกันกับความกว้างของช่วงเวลา) ตัวอย่างเช่น x นาที = 15, i=130, x n ของช่วงแรก = 10

x n1 หยาบคาย x นาที

ขีดจำกัดบนช่วงแรกสอดคล้องกับค่า (Xmin + ฉัน).

ขีดจำกัดล่างของช่วงที่สองจะเท่ากับขีดจำกัดบนของช่วงแรกเสมอ สำหรับกลุ่มที่ตามมา ขอบเขตจะถูกกำหนดในทำนองเดียวกัน นั่นคือค่าช่วงเวลาจะถูกเพิ่มอย่างต่อเนื่อง

x วี ฉัน = x n ฉัน +ฉัน

x n ฉัน = x วี ฉัน-1

    กำหนดความถี่ของช่วงเวลา

เรานับจำนวนค่าในแต่ละช่วงเวลา ในเวลาเดียวกัน เราจำได้ว่าหากหน่วยมีค่าลักษณะเฉพาะเท่ากับค่าของขีดจำกัดบนของช่วงเวลา ก็ควรกำหนดหน่วยนั้นให้กับช่วงเวลาถัดไป

    เราสร้างอนุกรมช่วงเวลาในรูปแบบของตาราง

    กำหนดจุดกึ่งกลางของช่วงเวลา

สำหรับการวิเคราะห์อนุกรมช่วงเวลาเพิ่มเติม คุณจะต้องเลือกค่าลักษณะเฉพาะสำหรับแต่ละช่วงเวลา ค่าแอตทริบิวต์นี้จะเหมือนกันกับหน่วยการสังเกตทั้งหมดที่อยู่ในช่วงเวลานี้ เหล่านั้น. แต่ละองค์ประกอบ "สูญเสีย" ค่าแอตทริบิวต์แต่ละรายการและได้รับการกำหนดค่าแอตทริบิวต์ทั่วไปหนึ่งค่า ความหมายทั่วไปนี้ก็คือ ตรงกลางของช่วงเวลาซึ่งแสดงแทน เอ็กซ์" ฉัน .

จากตัวอย่างการเติบโตของเด็ก เรามาดูวิธีสร้างอนุกรมช่วงเวลาที่มีระยะห่างเท่ากันกัน

ข้อมูลเบื้องต้นที่มีอยู่

90, 91, 92, 93, 94, 95, 96, 97, 98, 99 , 92, 93, 94, 95, 96, 98 , , 100, 101, 102, 103, 104, 105, 106, 107, 108, 109 , 100, 101, 102, 104 , 110, 112, 114, 116, 117, 120, 122, 123, 124, 129, 110, 111, 113, 115, 116, 117, 121, 125, 126, 127 , 110, 111, 112, 113, 114, 115, 116, 117, 118, 119, 120, 121, 122, 123, 124, 125, 126, 127, 128, 129 , 111, 113, 116, 127 , 123, 122, 130, 131, 132, 133, 134, 136, 137, 138, 139, 140, 141, 142, 143, 144, 145, 146, 147, 148, 149, 150 , 131, 133, 135, 136, 138, 139, 140, 141, 142, 143, 145, 146, 147, 148