สรุปสูตรสถิติ
1.การสร้างตารางแจกแจงความถี่
ขั้นตอนการสร้างตารางแจกแจงความถี่ 1.)เรียงข้อมูลจากน้อยไปหามาก
2.)จัดกลุ่มของข้อมูลโดยการสร้างรอยขีด
ขั้นตอนการสร้างตารางแจกแจงความถี่ 1.)พิสัย= ค่าสูงสุด-ค่าต่ำสุด (Xmax - X )min
แบบ อันตรภาคชั้น 2.)กำหนดจำนวนอันตรภาคชั้น พิสัย
3.)หาความกว้างของอันตรภาคชั้น โดย ความกว้าง =
จำนวนชั้น
สูตรที่เกี่ยวข้องอื่นๆ 1.)ความถี่สะสม แทนด้วย f
2.)ขอบล่าง = ค่าน้อยสุดของชั้นนั้น+ค่ามากสุดที่อยู่ต่ำกว่า1ชั้น
2
3.)ขอบบน = ค่ามากสุดของชั้นนั้น + ค่าน้อยสุดของชั้นที่สูงกว่า1ชั้น
2
4.)จุดกึ่งกลางของอันตรภาคชั้น = ค่าต่ำสุดของชั้น + ค่ามากสุดของชั้นนั้น
2
5.)ความกว้างของอันตรภาคชั้น = ขอบบน - ขอบล่าง
6.)ความถี่สัมพัทธ์ = ความถี่ของอันตรภาคชั้นนั้น = f
ผลรวมของความถี่ทั้งหมด N
7.)ร้อยละของความถี่สัมพัทธ์ = ความถี่ของอันตภาคชั้นนั้น × 100 = f × 100
ผลรวมของความถี่ทั้งหมด N
8.)ความถี่สะสมสัมพัทธ์ = ความถี่สะสมของอันตรภาคชั้นนั้น = F
ผลรวมของความถี่ทั้งหมด N
9.)ร้อยละของความถี่สะสมสัมพัทธ์ = ความถี่สะสมของอันตภาคชั้นนั้น × 100 = F × 100
N
ผลรวมของความถี่ทั้งหมด
สูตรค่ากลางข้อมูล
1.ค่าเฉลี่ยเลขคณิต (ARITHMETIC MEAN) ใช้สัญลักษณ์ X ( เอ็กซ์=บาร์)
ไม่แจกแจงความถี่ N
จำนวนทั้งหมด μ= Σi=1 Xi
N
n Xi
แค่จำนวนหนึ่ง X = Σ
i=1 n ข้อมูล
n น้ำหนักข้อมูล(หน่วยกิต)
ค่าเฉลี่ยเลขคณิตถ่วงน้ำหนัก = Σ Xi Wi
i=1 n
Σ Wi
i=1
K Xini
ค่าเฉลี่ยเลขคณิตรวม = Σ
i=1 K
Σi=1ni
แจกแจงความถี่ จุดกึ่งกลางข้อมูล(แต่ละชั้น)
X= K Xifi
Σ ความถี่ของข้อมูลนั้น
n ความถี่รวม
i=1
ค่าเฉลี่ยสมมติ
(X = A + (I) iΣn=1 fidi ( โดยที่ d = Xi-A
n I
จุดกึ่งกลางชั้นที่มีความถี่สูงสุด ความกว้าง
2.มัธยฐาน(Median)
ไม่แจกแจงความถี่
ตำแหน่งมัธยฐาน = n+ 1 จะต้องเอาไปเทียบ ตำแหน่งอีกที ถ้าคำตอบ
2 เป็น ทศนิยม --> ดูว่าอยู่ระหว่างตำแหน่ง
ไหน --> เอา 2 ค่าคะแนนของตำแหน่งนั้น
บวกกัน แล้วหาร 2 = ค่ามัธยฐาน
แจกแจงความถี่ (หาตำแหน่ง
(มัธยฐาน l+ I
N - FL ( N แล้วให้เอาไปเทียบกับ
2 2
((
fme ความถี่สะสม --> จะรู้ว่าอยู่อันตรภาคไหน
3.ฐานนิยม (mode) ค่าของข้อมูลที่มีความถี่สูงสุด
ไม่แจกแจงความถี่ ซ้ำกันสูงสุด --> มีได้มากสุด2ค่า
-->ไม่มีฐานนิยม
แจกแจงความถี่ ชั้นที่มีความถี่สูงสุด d1 = f ฐานนิยม - f ต่ำกว่า
d2 = f ฐานนิยม - f สูงกว่า
(ฐานนิยม(mode) = L + (I) d1
d1+ d 2
น.ส.กานต์พิชชา นนท์ธีระวิรุฬห์ ม.6/2 เลขที่ 34
การวัดตำแหน่งที่ของข้อมูลและ
แผนภาพกล่อง
1.การวัดตำแหน่งของข้อมูลแบบควอไทล์(quartile)
คือ การแบ่งข้อมูลออกเป็น 4 ส่วน
น้อย 25 25 25 25 มาก ถ้าควอไทล์ที่ 1 ตรงกับ
เปอร์เซ็นต์ไมล์ที่ = 25
Q1 Q2 Q 3
ควอไทล์ที่ 1 (G1) น้อยกว่าหรือเท่ากับค่านี้อยู่ 1 ใน 4 ของข้อมูลทั้งหมด
ควอไทล์ที่ 2 (G2) น้อยกว่าหรือเท่ากับค่านี้อยู่ 2 ใน 4 ของข้อมูลทั้งหมด
ควอไทล์ที่ 3 (G3) น้อยกว่าหรือเท่ากับค่านี้อยู่ 3 ใน 4 ของข้อมูลทั้งหมด
2.การวัดตำแหน่งของข้อมูลแบบควอไซล์(Decile) มาก
คือ การแบ่งข้อมูลออกเป็น 10 ส่วน
น้อย
D1 D2 D3 D4 D5 D6 D 7 D8 D9
เดไซล์ที่ 1 (D1) น้อยกว่าหรือเท่ากับค่านี้อยู่ 1 ใน 10 ของข้อมูลทั้งหมด
เดไซล์ที่ 5 (D5) น้อยกว่าหรือเท่ากับค่านี้อยู่ 5 ใน 10 ของข้อมูลทั้งหมด
เดไซล์ที่ 8 (D8) น้อยกว่าหรือเท่ากับค่านี้อยู่ 8 ใน 10 ของข้อมูลทั้งหมด
3.การวัดตำแหน่งของข้อมูลแบบเปอร์เซ็นต์ไมล์(Percentile)
คือ การแบ่งข้อมูลออกเป็น 100 ส่วน
P10 P20 P30 P40 P50 P60 P70 P80 P90
เปอร์เซ็นต์ไมล์ที่1(P1)น้อยกว่าหรือเท่ากับค่านี้อยู่ 1 ใน 100 ของข้อมูลทั้งหมด
เปอร์เซ็นต์ไมล์ที่50(P50)น้อยกว่าหรือเท่ากับค่านี้อยู่ 50 ใน 100 ของข้อมูลทั้งหมด
เปอร์เซ็นต์ไมล์ที่80(P80)น้อยกว่าหรือเท่ากับค่านี้อยู่ 80 ใน 100 ของข้อมูลทั้งหมด
จะเห็นว่าสามารถเปรียบเทียบค่าของ q,d,p ได้เช่น q2 = D5 = P50= มัธยฐาน
การหา q,d,p ของข้อมูลที่ไม่ได้แจกแจงความถี่มีลำดับขั้นตอนการหาเหมือนกับวิธีหามัธย
ญาน คือ
1. เรียงลำดับค่าของข้อมูลจากน้อยไปหามาก
2. หาตำแหน่งของ Qr หรือ Dr หรือ Pr ที่ต้องการ จากสูตร
ตำแหน่งของ Qr = r(N+1)
4
ตำแหน่งของ Dr = r(N+1)
10
ตำแหน่งของ Pr = r(N+1)
100
เมื่อ N เป็นจำนวนข้อมูลทั้งหมด
3. คำนวณหา Q r หรือ Dr หรือ Pr ที่ต้องการ
การวัดการกระจายของข้อมูล
มี 2 วิธี 1.การวัดการกระจายสัมบูรณ์(absolutevariation)
คือการวัดการกระจายของข้อมูลด้วยค่าวัดทาง
สถิติ ที่มีหน่วยดียวกับข้อมูล มี 6 ชนิด ได้แก่
1.พิสัย
2.พิสัยระหว่าวควอร์ไทล์
3.ส่วนเบี่ยงเบนควอร์ไทล์
4.ส่วนเบี่ยงเบนเฉลี่ย
5.ส่วนเบี่ยงเบนมาตรฐาน
6.ความแปรปรวน
2.การวัดการกระจายสัมพันธ์(relativevariation)
เป็นค่าที่ใช้ในการเปรียบเทียบการกระจาย
ระหว่างข้อมูลมากกว่า 1 ชุด มี 4 ชุด
1.สัมประสิทธิ์ของพิสัย
2.สัมประสิทธิ์ส่วนเบี่ยงเบนควอร์ไทล์
3.สัมประสิทธิ์ส่วนเบนเฉลี่ย
4.สัมประสิทธิ์ของการแปรผัน
1.1พิสัย ค่าที่ใช้วัดการกระจายของข้อมูลที่ได้ผลต่างระหว่างข้อมูล
กรณีที่ข้อมูลไม่ได้เเจกแจงความถี่
พิสัย = Xmax - Xmin เมื่อ Xmax แทนข้อมูลที่มีค่ามากที่สุด
Xmin แทนขอบล่างของอันตรภาคชั้นที่มีค่าต่ำสุด
กรณีที่ข้อมูลเเจกแจงความถี่ เมื่อ Umax แทนข้อมูลที่มีค่ามากที่สุด
Lmin แทนขอบล่างของอันตรภาคชั้นที่มีค่าต่ำสุด
พิสัย = Umax - L min
1.2พิสัยระหว่างควอร์ไทล์
ค่าที่ใช้วัดการกระจายของข้อมูล
IQR = Q 3 - Q 1
1.3ส่วนเบี่ยงเบนควอร์ไทล์ ค่าที่ใช้วัดการกระจายของข้อมูลรอบๆ
ส่วนเบี่ยงเบนควอร์ไทล์(Q.D.) = Q3 - Q 1
2
1.4ส่วนเบี่ยงเบนเฉลี่ย ค่าที่ใช้วัดการกระจายของข้อมูลรอบๆ
กรณีที่ข้อมูลไม่ได้แจกแจงความถี่ M.D. = n X|
Σ |x i-
i=1 n
กรณีที่ข้อมูลแจกแจงความถี่ M.D. = n fi |x i-
Σ X|
i=1
n
Σ
fi
i=1
เมื่อ xi เป็นจุดกึ่งกลางของอัตรภาคชั้นต่างๆโดยที่ i = 1,2,3,...,n
fi เป็นความถี่ของอัตรภาคชั้นที่ i
n เป็นจำนวนข้อมูลตัวอย่างทั้งหมด
X เป็นค่าเฉลี่ยเลขคณิตของข้อมูลชุดนี้
1.5ส่วนเบี่ยงเบนมาตรฐาน เป็นการวัดการกระจาย ใช้ข้อมูลทุกค่า
มาคำนวณ
กลุ่มประชากร
N
i=1
1.6ความแปรปรวน คือค่าที่ใช้วัดการกระจายของข้อมูล โดยคำนวณ
จากกำลังสองของส่วนเบี่ยงเบนมาตรฐาน
กลุ่มประชากร σ2 = n2
กลุ่มตัวอย่าง Σ (xi - μ)
i=1 n
S 2= n2
Σ (xi - x)
i=1 n-1
น.ส.กานต์พิชชา นนท์ธีระวิรุฬห์ ม.6/2 เลขที่ 34