สรุปและเจาะลึกแผนภาพกล่อง
เขยี นโดยเราเอง (ลีโอ) ใช้สำนวนของตัวเองในการเขียน ปะปนบ้างกบั ภาษาวิชาการ ทำขึน้ เพอ่ื ทบทวน
บทเรียนใหก้ บั ตัวเอง และคนอนื่ กส็ ามารถมาอ่านไดด้ ้วยเหมอื นกัน หวงั ว่าคงจะมปี ระโยชน์กบั ใครหลายๆคน
แผนภาพกล่องมสี ว่ นประกอบหลกั ๆ 5 สว่ นไดแ้ ก่
- คา่ ตำ่ สุด (Min/L)
- ค่าสงู สุด (Max/H)
- ควอไทล์ท่ี 1 (Q1)
- ควอไทลท์ ่ี 2 (Q2) หรอื มัธยฐาน (Median)
- ควอไทล์ท่ี 3 (Q3)
ค่าทเี่ กยี่ วขอ้ งอ่ืนๆไดแ้ ก่
- IQR (interquartile range ค่าพิสัยระหว่างกล่อง)
- ค่านอกเกณฑ์ (outlier)
ค่าสูงสุดหรือค่าต่ำสุดเราคงรู้กันอยู่แล้ว เพราะฉะน้ันเราไม่ขอพูดถึง ดังนั้นเราจึงขอเจาะลึกเกี่ยวกับ
ควอไทลต์ า่ งๆวา่ คอื อะไร มาจากไหน แตก่ ่อนอ่นื ขอทบทวนคา่ ๆหนึ่งก่อนซง่ึ กค็ อื
มธั ยฐาน (Median)
มัธยฐานคอื ข้อมลู ทอี่ ยูต่ รงกลางของข้อมูลทง้ั หมด มวี ธิ ีการหาดงั นี้
ตัวอยา่ งที่ 1 ข้อมูลตัวเลขชุดหนงึ่ เปน็ ดงั นี้
7 3 5 7 8 3 35 9 14 7 17
เรยี งขอ้ มลู จากนอ้ ยไปมากจะได้
3 3 5 7 7 7 8 9 14 17 35
มธั ยฐานกค็ ือ 7 นนั่ เอง เพราะเป็นขอ้ มลู ทอ่ี ยู่ตรงกลางที่สดุ
สูตรการหาตำแหนง่ มัธยฐาน คือ N + 1 โดยท่ี N คอื จำนวนข้อมูลซ่ึงเป็น สูตรน้ีเป็นสูตรที่
2
ได้มาจากการสังเกต มีประโยชนใ์ นกรณีท่ขี ้อมูลมจี ำนวนมากๆ
ตัวอย่างที่ 2 ข้อมลู ตัวเลขชุดหน่ึงประกอบไปด้วย
3 3 5 7 7 7 8 9 14 17 35
จากการนบั จะไดว้ ่า มีข้อมูลท้ังหมด 11 ตวั
จากสูตรตำแหนง่ มธั ยฐาน คือ N + 1
2
จะไดต้ ำแหน่งมัธยฐานเป็น 11 + 1 = 12 = 6
22
ซ่งึ ข้อมลู ตำแหนง่ ท่ี 6 คือ 7 ดงั นั้นมธั ยฐานของขอ้ มลู ชุดนค้ี ือ 7 นน่ั เอง
ในกรณีจำนวนข้อมูลเป็นเลขคู่จะได้ ตำแหนง่ มัธยฐานเป็นทศนิยม เชน่
มขี อ้ มลู 12 ตัว ได้ตำแหน่งมธั ยฐานเปน็ 12 + 1 = 13 = 6.5
2 2
ให้นำขอ้ มลู ตำแหนง่ ท่ี 6 + ตำแหน่งท่ี 7 แลว้ หาร 2 จะได้ค่ามธั ยฐาน
ควอไทลท์ ่ี 1, 2 และ 3 (Q1, Q2, Q3)
ควอไทลท์ ่ี 2 (Q2) คอื อะไร
หากเรากำหนดชุดข้อมูลชุดหนึ่ง จะได้ว่ามัธยฐานของข้อมูลชุดนั้นคือ Q2 สูตรการหา
ตำแหนง่ Q2 หรอื ก็คือมธั ยฐานเปน็ N+1
2
ควอไทลท์ ี่ 1 (Q1) คอื อะไร
ถา้ เรานำชุดขอ้ มูลต้ังแต่คา่ ต่ำสดุ ถึงคา่ กอ่ น Q2 มาหามัธยฐาน จะไดม้ ธั ยฐานท่ีได้นั้นคือค่า
ของควอไทล์ที่ 1 (Q1) ตวั อย่างเชน่ ชุดขอ้ มลู ตอ่ ไปนี้
3 3 5 7 7 7 8 9 14 17 35
Q2
มี Q2 คอื 7 และค่าตำ่ สดุ คือ 3 นำขอ้ มลู ตง้ั แต่คา่ ตำ่ สุดถึงก่อน Q2 มาหามัธยฐาน
3 3 5 7 7 7 8 9 14 17 35
Q1 Q2
จะได้มธั ยฐาน = 5 ซ่งึ กค็ ือ Q1 น่ันเอง
เนอ่ื งจากสูตรการหามธั ยฐาน (Q2) คอื N + 1
2
และ Q1 อยตู่ ำแหนง่ ครึ่งหน่งึ ของ Q2 สตู รการหาตำแหน่ง Q1 จงึ หาได้ดังนี้
N + 1 × 1 = N+1 ดงั นั้นสตู รการหาตำแหน่ง Q1 คือ N+1
2 2 4 4
ควอไทลท์ ี่ 3 (Q3) คืออะไร
ถา้ เรานำชุดข้อมลู ตง้ั แตค่ ่าถดั จาก Q2 ถงึ ค่าสงู สดุ มาหามธั ยฐาน จะได้ว่ามัธยฐานทหี่ าได้
นัน้ คือควอไทลท์ ี่ 3 (Q3) ตัวอย่างเชน่ ชดุ ข้อมลู ต่อไปนี้
3 3 5 7 7 7 8 9 14 17 35
Q2
มี Q2 คอื 7 และค่าสูงสุดคือ 35 นำข้อมูลตัง้ แต่ค่าถดั จาก Q2 ถงึ คา่ สูงสุด มาหามัธยฐาน
3 3 5 7 7 7 8 9 14 17 35
Q2 Q3
จะได้มธั ยฐาน = 14 ซงึ่ กค็ อื Q3 นัน่ เอง
เนื่องจาก Q3 อยบู่ นตำแหน่งท่ี 3 ใน 4 ของข้อมลู ทัง้ หมด ดงั นั้นจึงมสี ูตรการหาคอื 3(N+1)
4
สรุป : มัธยฐานของชุดขอ้ มลู ตงั้ แต่ค่าต่ำสุดถึงค่าก่อน Q2 คอื ควอไทล์ที่ 1 (Q1)
มธั ยฐานของชุดขอ้ มูลทง้ั หมดคอื ควอไทล์ที่ 2 (Q2)
มัธยฐานของชุดข้อมูลตง้ั แต่ค่าถดั จาก Q3 ถึงค่าสงู สุด คือ ควอไทล์ท่ี 3 (Q3)
3 3 5 7 7 7 8 9 14 17 35
Q1 Q2 Q3
สูตรการหาตำแหนง่ และความสมั พันธข์ องควอไทล์ทง้ั สาม
สูตรการหาตำแหน่งควอไทล์ที่เราได้กล่าวไว้ข้างต้น มีถึง 3 สูตร ซึ่งอาจทำให้เกิดความ
สับสนในการใข้งาน ดังนั้นจึงมีการคดิ สูตรสำหรับหาตำแหนง่ ควอไทล์ใดๆ โดยต่อไปนี้จะขอกลา่ วถึง
ตำแหน่งควอไทล์ด้วยสัญลักษณ์ P(Qk) (P ย่อมาจาก position แปลว่า ตำแหน่ง เช่น P(Q2) อ่านว่า
ตำแหนง่ ของควอไทลท์ ่ี 2) มวี ิธีการหาสตู รดังน้ี
จาก P(Q1) = n+1 สามารถจดั รูปได้เปน็ 1(n+1)
4
n+1 4
2 สามารถจดั รูปได้เปน็ 2(n+1)
P(Q2) =
4
สามารถจัดรูปได้เปน็ 3(n+1)
และ P(Q3) = 3 (n + 1)
4 4
จากการสงั เกตจะได้วา่ สูตรการหาตำแหนง่ ควอไทลใ์ ดๆคือ P(Qk) = k(n+1)
4
ตำแหน่งควอไทล์แตล่ ะตำแหนง่ มคี วามสัมพันธก์ นั หรือไม่อย่างไร?
จาก P(Qk) = k(n + 1)/4
จะได้ P(Q1) = n+1, P(Q2) = n+1, P(Q3) = 3(n+1)
4
4 2
( +1) (2) 2 1
เมื่อนำ P(Q1) หาร P(Q2) จะได้ = 4 = 2
4 +1
นัน่ คือ P(Q1) เปน็ คร่งึ หน่ึงของ P(Q2)
และเมือ่ นำ P(Q1) หาร P(Q3) จะได้ ( +1) (4) = 1
3
4 3( +1)
นน่ั คือ P(Q1) เป็น 1 ใน 3 ของ P(Q3)
สรปุ แลว้ อัตราสว่ นของตำแหนง่ ควอไทล์แตล่ ะตำแหน่งเป็นไปตามความสมั พนั ธด์ ังน้ี
P(Q1) : P(Q2) : P(Q3) = 1 : 2 : 3
ยกตัวอยา่ งเช่น ถา้ ให้ P(Q1) = 5 จะได้ P(Q2) = 5×2 = 10 และ P(Q3) = 5×3 = 15
โดยท่ีไมต่ อ้ งเสียเวลาคำนวณด้วยสตู ร P(Qk) = k(n+1) ถึง 3 ครัง้
4
ตำแหนง่ ของควอไทล์ทมี่ คี ่าลงท้ายด้วย .25 และ .75 จะมีวิธหี าค่าอยา่ งไร
ปัญหานี้ไม่ได้ยากอยา่ งที่คดิ เราสามารถหาข้อมลู นั้นได้โดยเทียบบัญญัติไตรยางค์ระหว่าง
ตำแหนง่ ท่ีเพ่มิ กับค่าท่เี พ่ิม ซงึ่ มีวิธีทำดงั นี้
ตวั อยา่ งท่ี 3 ขอ้ มลู ตัวเลขชุดหนง่ึ เป็นดังน้ี
18 16 8 21 40 19 22 6
เรียงข้อมูลจากน้อยไปมากจะได้
6 8 16 18 19 21 22 40
จากการนบั จะพบวา่ มจี ำนวนข้อมลู 8 ตวั
มตี ำแหนง่ ควอไทลแ์ ต่ละตวั ดงั นี้
P(Q1) = 1(8+1) = 9 = 2.25, P(Q2) = 2.25×2 = 4.5, P(Q3) = 2.25×3 = 6.75
4 4
เนื่องจาก P(Q1) = 2.25 ข้อมูลตำแหน่งที่ 2 คือ 8 และข้อมูลตำแหน่งที่ 3 คือ 16 จาก
บญั ญัติไตรยางค์จะสามารถหาคา่ Q1 ไดด้ งั น้ี
เมือ่ ขอ้ มลู เพม่ิ 1 ตำแหนง่ ทำให้คา่ เพิ่ม 16-8 = 8
ดงั น้นั ถ้าข้อมูลเพมิ่ 0.25 ตำแหน่งจะทำให้คา่ เพมิ่ 0.25×8 = 2
ดังนัน้ ตำแหนง่ ท่ี 2.25 จึงเปน็ 8 + 2 = 10 นั่นคือ Q1 = 10
เนื่องจาก P(Q3) = 6.75 ข้อมูลตำแหน่งที่ 6 คือ 21 และข้อมูลตำแหน่งที่ 7 คือ 22 จาก
บญั ญัติไตรยางค์จะสามารถหาค่า Q3 ไดด้ งั นี้
เมอื่ ขอ้ มูลเพ่มิ 1 ตำแหน่ง ทำให้ค่าเพมิ่ 22-21 = 1
ดงั น้นั ถ้าขอ้ มลู เพิ่ม 0.75 ตำแหน่งจะทำให้ค่าเพม่ิ 0.75×1 = 0.75
ดังน้นั ตำแหนง่ ท่ี 6.75 จึงเป็น 21 + 0.75 = 21.75 น่ันคือ Q3 = 21.75
และ Q2 = 18+19 = 18.5
2
จากการสังเกตจะได้ว่า ค่าของควอไทล์ที่ 1 และ 3 เกิดจาก ค่าของข้อมูลตำแหน่งเดิม +
ค่าที่เพ่ิมขึ้นโดยคา่ ที่เพ่ิมข้ึนคอื สามารถหาได้จากวิธที ี่แสดงให้ดูข้างต้น เราจึงสามารถใช้สตู รมาแทน
บญั ญัติไตรยางค์ได้ ดังตวั อยา่ งทจี่ ะแสดงใหด้ ูตอ่ ไปนี้
ตัวอย่างที่ 4 ขอ้ มูลตวั เลขชุดหนึ่งเปน็ ดังน้ี
28 12 29 34 50 28 37 50
เรยี งขอ้ มลู จากน้อยไปมากจะได้
12 28 28 29 34 37 50 50
มขี อ้ มลู จำนวน 8 ตวั และมตี ำแหนง่ ควอไทล์แตล่ ะตวั ดังน้ี
P(Q1) = 1(8+1) = 9 = 2.25, P(Q2) = 2.25×2 = 4.5, P(Q3) = 2.25×3 = 6.75
4 4
สามารถหา Q1 และ Q3 ได้จากสูตรดังน้ี
Q1 = ข้อมูลตำแหนง่ ท่ี 2 + คา่ ทเ่ี พิม่ ขนึ้
Q1 = 28 + (0.25)(28 - 28)
Q1 = 28
Q3 = ขอ้ มลู ตำแหนง่ ที่ 6 + ค่าท่ีเพม่ิ ข้นึ
Q3 = 37 + (0.75)(50 - 37)
Q3 = 46.5
Q2 = 29 + 34 = 31.5
2
คา่ IQR และ คา่ นอกเกณฑ์
IQR (interquartile) คอื พิสยั ระหว่างกล่อง สามารถหาไดจ้ าก Q3 – Q1
ค่านอกเกณฑ์/ค่านอกกลุ่ม เป็นค่าที่จะบ่งบอกว่ามีค่าใดที่ผิดปกติไปจากข้อมูลส่วนใหญ่
หรอื ไม่ มากผดิ ปกติหรอื นอ้ ยผดิ ปกติหรือไม่ โดยมีนยิ ามดงั น้ี
ค่าที่มากผิดปกติ สามารถหาได้จากค่าที่มากกว่าค่าของ Q3 + 1.5(IQR) และค่าที่น้อย
ผดิ ปกติ สามารถหาไดจ้ ากคา่ ที่นอ้ ยกวา่ ค่าของ Q1 - 1.5(IQR)
ตัวอย่างที่ 5 ข้อมูลตวั เลขชุดหนง่ึ เป็นดงั น้ี
18 16 8 21 40 19 22 6
เรียงข้อมลู จากนอ้ ยไปมากจะได้
6 8 16 18 19 21 22 40
จากการนบั จะไดว้ ่ามีจำนวนขอ้ มลู 8 ตัว และมีตำแหนง่ ควอไทล์แต่ละตัวดังน้ี
P(Q1) = 1(8+1) = 9 = 2.25, P(Q2) = 2.25×2 = 4.5, P(Q3) = 2.25×3 = 6.75
4 4
Q1 = ข้อมูลตำแหนง่ ท่ี 2 + คา่ ท่ีเพมิ่ ขึ้น
Q1 = 28 + (0.25)(16 - 8)
Q1 = 10
Q3 = ขอ้ มลู ตำแหนง่ ท่ี 6 + ค่าทีเ่ พมิ่ ขน้ึ
Q3 = 37 + (0.75)(22 - 21)
Q3 = 21.75
Q2 = 18 + 19 = 18.5
2
ค่า IQR = Q3 – Q1 = 21.75 - 10 = 11.75
จากการสังเกตค่าของข้อมูล มีบางค่าที่สูงผิดปกติ จึงต้องหาค่า Q3 + 1.5(IQR) ซึ่งก็คือ
21.75 + 1.5(11.75) = 39.375 ดังนัน้ ค่าที่มากกวา่ 39.375 จดั เป็นค่านอกเกณฑ์ จะเหน็ ว่ามีขอ้ มูลท่ี
มากกวา่ 39.375 อยู่ 1 ตวั นัน่ คือ 40 ดงั นั้น 40 จดั เปน็ คา่ นอกเกณฑ์นั่นเอง