ความรู้เบอ้ื งต้นทางสถติ ิ
เนือ้ หาประกอบดว้ ย
1. ความหมายของสถติ ิ
2. ข้อมลู และระดับการวัดขอ้ มูล
3. การวัดแนวโนม้ เข้าสู่สว่ นกลาง
4. การวดั การกระจายและการกระจายสัมพทั ธ์
5. คะแนนมาตรฐาน
6. แผนภาพกล่อง
ฝ่ายนิทรรศการ สาขาวิชาสถติ ิ สปั ดาหว์ ันวิทยาศาสตร์ 2563
คณะวิทยาศาสตร์ มหาวทิ ยาลยั ขอนแกน่
1. ความหมายของสถิติ
สถติ ิในความหมายของ “ข้อมลู สถิต”ิ (Statistics Data) หมายถึง ขอ้ มลู ตัวเลข (Numerical
data) ท่ีแทนขอ้ เทจ็ จริงของสงิ่ ทเ่ี ราสนใจ หรอื รวบรวมไวเ้ พ่อื อธบิ ายส่งิ ท่ีสนใจ ซงึ่ เกย่ี วข้องกบั
เร่อื งใดเร่ืองหนงึ่ เชน่ ปรมิ าณนา้ ฝน มูลค่าสนิ คา้ สง่ ออก
สถติ ใิ นความหมายของ “สถิติศาสตร์” (Statistics) หมายถึง ศาสตรท์ ่เี กย่ี วกบั วิธกี าร
(Method) ทใ่ี ชใ้ นการศกึ ษาข้อมลู หรือทีเ่ รียกวา่ ระเบยี บวิธที างสถติ ิ (Statistical method) ซึ่ง
ประกอบด้วย การเก็บรวบรวมขอ้ มลู (Collection of data) การนา้ เสนอข้อมลู (Presentation
of data) การวเิ คราะหข์ ้อมูล (Analysis of data) การตคี วามหมายข้อมูล (Interpretation of
data)
สถติ ิในความหมายของ “ค่าสถติ ”ิ หมายถึง คา่ ตวั เลขท่ีค้านวณไดจ้ ากหน่วยตัวอย่าง (Sample)
ตัวอยา่ งสัญลกั ษณข์ องค่าสถิติ เช่น คา่ เฉลยี่ เลขคณิต ( ത ) สว่ นเบ่ยี งเบนมาตรฐาน (S.D.)
สถติ ิในความหมายของ “วชิ าสถติ ”ิ หมายถึง วิชาวิทยาศาสตร์แขนงหนง่ึ ที่มีเนือหาและ
รากฐานมาจากวชิ าคณิตศาสตร์ (mathematics) และตรรกวิทยา (logic)
ศริ ชิ ยั กาญจนวาสี และคณะ. (2551). การเลอื กใชส้ ถติ ทิ เี่ หมาะสมสาํ หรบั การวจิ ยั (พมิ พค์ รัง้ ท5ี ). จฬุ าลงกรณม์ หาวทิ ยาลยั . 2
Types of Statistics แบ่งออกเปน็ 2 สว่ นใหญ่ๆ คอื
1) สถติ เิ ชงิ พรรณนา (Descriptive Statistics)
เปน็ ระเบียบวธิ กี ารทางสถติ ิท่บี รรยายลกั ษณะของสิ่งทส่ี นใจศึกษา เพ่ือใหเ้ ข้าใจถงึ ลักษณะ
ของขอ้ มลู ทร่ี วบรวมมาได้เท่านัน โดยจะไมอ่ ธิบายอะไรทน่ี อกเหนอื จากข้อมูลท่ีมีอยู่ ไดแ้ ก่ การ
แจกแจงความถี่ การวัดค่ากลางของขอ้ มลู การวดั การกระจายของข้อมลู การน้าเสนอขอ้ มูลใน
รูปตาราง แผนภูมิ เป็นตน้
2) สถติ เิ ชิงอนุมาน (Inferential Statistics)
เปน็ สถิติท่วี า่ ด้วยเทคนิคในการเก็บรวบรวมข้อมูลบางสว่ นที่เรียกวา่ ตวั อยา่ ง แล้วนา้ ข้อมลู
ตวั อย่างไปอธิบายคณุ ลักษณะของข้อมูลทังหมดท่เี รยี กว่าประชากร โดยอาศยั ทฤษฎีความ
น่าจะเป็น ประกอบด้วย 2 องคป์ ระกอบ คือ การประมาณคา่ พารามเิ ตอร์(Parametric
Estimation) และการทดสอบสมมติฐาน (Testing Hypothesis) ซึง่ จะไดส้ ารสนเทศที่
สามารถนา้ ไปใชเ้ พอ่ื ประกอบการตัดสินใจได้
3
2. ขอ้ มูลและระดับการวดั ข้อมูล
ขอ้ มลู (Data) คือข้อเท็จจรงิ ต่างๆ ซง่ึ อาจเปน็ ตวั เลขหรอื มใิ ชต่ วั เลขก็ได้ ส้าหรับระดับข้อมลู ของการวดั
(Data Levels of Measurement) สามารถแบ่งได้ 4 ระดับหรอื 4 มาตรวดั ดังนี
1. มาตรนามบัญญตั ิ (Nominal scale) เปน็ มาตรการวดั ระดบั ตา้่ สุด โดยเปน็ เพียงการเรยี กชอื่ หรใื ช้
เพอ่ื อจ้าแนกประเภทของคณุ ลกั ษณะทสี่ นใจ เช่น เพศ อาชีพ เปน็ ตน้
2. มาตรเรยี งอนั ดบั (Ordinal scale) เป็นการเรยี งอบั ดบั ส่ิงตา่ งๆ ตามลกั ษณะหนงึ่ ๆ ซึง่ มคี วามสมั พนั ธ์
กนั ในลกั ษณะ ดกี ว่า ยากกว่า หรือนิยมมากกวา่ เช่น แมบ่ ้านคนหนงึ่ ท่ีนยิ มผงซักฟอก 3 ย่ีห้อ เปน็ ดี
ทสี่ ดุ ดีมาก และดี
3. มาตรอันตรภาค (Interval scale) การวัดระดบั นีจะมคี ุณสมบัตกิ ารจา้ แนกและการเรยี งอนั ดบั สงิ่
ตา่ งๆและหน่วยการวดั ยงั มคี า่ คงทสี่ ามารถระบคุ วามแตกตา่ งระหว่างส่งิ ตา่ งๆได้ โดยสามารถวดั คา่ ได้
แต่เป็นขอ้ มูลทไ่ี มม่ ีศูนย์แท้ เชน่ อณุ หภูมิ คะแนน I.Q.
4. มาตรวดั อัตราส่วน (Ratio scale) เปน็ การวัดระดบั สงู สดุ ซึ่งมคี ุณสมบตั ติ า่ งๆเหมอื นมาตรอนั ตรภาค
และข้อมูลมีศูนยแ์ ท้ เช่น น้าหนัก ส่วนสูง ระยะทาง รายได้
4
3. การวดั แนวโนม้ เข้าสูส่ ่วนกลาง
ในกรณที ต่ี ้องการคา่ ทเี่ ป็นตวั แทนของข้อมลู ชดุ หนึ่ง เรามักจะเลือกเอาตัวแทนทีม่ คี า่ ใกลเ้ คยี งกบั ค่าสว่ นมาก
ของข้อมลู ซง่ึ เรียกว่า ค่ากลางของข้อมลู
3.1 ค่าเฉลยี่ เลขคณิต (Arithmetic mean) หรอื เรยี กสนั ๆ ว่า ค่าเฉล่ยี (Mean) ซึ่งเขยี นแทนด้วย
เป็นค่ากลางของขอ้ มลู ทน่ี ยิ มใช้มากทส่ี ดุ
1) ข้อมูลที่ไม่มกี ารจัดเป็นหมวดหมู่ N
ถา้ มีข้อมูล X1, X2, , XN รวม N ตัว แล้ว Xi
i1
N
ถ้าข้อมูล X1, X2, , XR มีความถี่รวม f1, f2, , fR ครัง ตามล้าดบั แลว้
RR
fi Xi fi Xi
i 1 i1
R N
fi
i 1
R คอื ความถ่ีทังหมด
เมอ่ื N fi
i 1
5
ตัวอย่าง 1.3 นกั ศึกษา 10 คนมีน้าหนกั ตวั เป็นกิโลกรัม ดงั น้ี 4, 3, 3, 5, 6, 5, 7, 5, 7 และ 8 จงคานวณหา
คา่ เฉล่ียเลขคณิตของน้าหนกั ตวั ของนกั ศึกษากลุ่มน้ี
วธิ ีทา N
Xi
4 3 3 5 6 5 7 5 7 8 53 5.3
i1
N 10 10
นนั่ คือน้าหนกั ตวั เฉลี่ยของนกั ศึกษากลุ่มน้ีคือ 5.3 กิโลกรัม
2. ข้อมูลที่มีการจัดเป็ นหมวดหมู่ ซ่ึงไม่ทราบคา่ ที่แทจ้ ริงของขอ้ มูลในแต่ละช้นั ดงั น้นั ถา้ ใหค้ ่าก่ึงกลาง
ของแต่ละช้นั เป็นตวั แทนของขอ้ มูลในช้นั น้นั ๆ แลว้
RR
fi Xi fi Xi
i 1 i1
R N
fi
i 1
เมื่อ R คือ จานวนช้นั ของขอ้ มูล
Xiคือ คา่ ก่ึงกลางของช้นั ที่ i
fi คือ ความถ่ีของช้นั ท่ี i โดยที่ N R fi คือ ความถี่ท้งั หมด 6
i 1
7
หากข้อมูลบางค่ามีค่ามากหรือน้อยผิดปกติ และต้องการค่าเฉล่ียท่ีเหมาะสมก็ไม่ควรน้าค่าผิดปกติ
ดังกล่าวมาค้านวณด้วย น่ันคือ หากน้าข้อมูลมาเรียงล้าดับจากน้อยไปหามากและตัดข้อมูลท่ีมีค่ามาก
และนอ้ ยออกปลายละ k% แล้วจะเรียกค่าเฉลย่ี ท่คี า้ นวณได้จากข้อมูลทีเ่ หลืออยูต่ รงกลางวา่ ค่าเฉลยี่ ตัด
ปลาย k% (k% trimmed mean)
ตัวอย่าง 1.5 จงหาค่าเฉลยี่ ตดั ปลาย 20% ของข้อมูลตอ่ ไปนี
6.5, 12.0, 14.9, 10.0, 10.7, 7.9, 21.9, 12.5, 14.5, 9.2
วิธที า เรียงขอ้ มูลจากนอ้ ยไปหามากไดด้ งั นี
6.5, 7.9, 9.2, 10.0, 10.7, 12.0, 12.5, 14.5, 14.9, 21.9
ค่าเฉลี่ยตดั ปลาย 20% 9.2 10.0 10.7 12.0 12.5 14.5 = 11.48
6
8
ตัวอยา่ ง 1.4 อายกุ ารเข้ารบั ราชการของอาจารยใ์ นมหาวิทยาลยั (หน่วยเป็นปนี บั ถงึ ปี พ.ศ. 2540 )
จงหาค่าเฉลยี่ เลขคณิตของอายุการเข้ารบั ราชการของอาจารยก์ ลมุ่ นี
RR
วธิ ีทา fi Xi fi Xi 1082 21.64 ปี
50
i 1 i 1
R
N
fi
i 1 9
3.2 คา่ เฉล่ียถว่ งน้าหนัก (Weighted mean) คือค่าเฉลีย่ ของขอ้ มลู ทแี่ ตล่ ะคา่ มคี วามส้าคัญหรอื
น้าหนักไม่เท่ากนั
ก้าหนดให้ w1, w2, , wR เปน็ ความส้าคัญหรอื น้าหนักถว่ งของคา่ ข้อมลู X1, X2, , XR
ตามลา้ ดับแลว้ จะเรยี กคา่ เฉล่ียทีไ่ ด้ ซึ่งเขยี นแทนดว้ ย w วา่ ค่าเฉลี่ยถว่ งนา้ หนกั โดย
R
wi Xi
w i 1
R
wi
i 1
10
ตัวอย่าง 1.5 จงหาคะแนนเฉล่ียของนกั เรียนคนหนงึ่ ที่ลงทะเบยี นเรยี นวชิ าภาษาไทย ภาษาองั กฤษ
คณติ ศาสตร์ วทิ ยาศาสตร์และสงั คมศาสตร์ ซึง่ มเี วลาเรยี นและทา้ คะแนนในแตล่ ะวิชาดงั นี
วชิ า ภาษาไทย ภาษาองั กฤษ คณติ ศาสตร์ วทิ ยาศาสตร์ สังคมศาสตร์
ชัว่ โมงเรยี น/สัปดาห์ 4 3 2 5 8
คะแนนท่ีสอบได้ 3 4 4 2 1
วธิ ีทา ขอ้ มลู มี 5 ค่า คอื X1 3, X2 4, X3 4, X4 2, X5 1
ความสา้ คัญของคะแนนสอบแต่ละวิชาคือ w1 4, w2 3, w3 2, w4 5, w5 8
คา่ เฉล่ียของคะแนนสอบ w 4(3) 3(4) 2(4) 5(2) 8(1)
43258
= 2.27
11
3.3 มธั ยฐาน (Median) หมายถึงข้อมลู ท่ีอยู่ตรงก่ึงกลางของขอ้ มูลทังหมดเมอ่ื จดั เรียงล้าดับขอ้ มูลจากคา่ นอ้ ยไปค่ามาก
หรอื จากค่ามากไปค่าน้อย ในที่นีเขียนแทนด้วย Me
การหาคา่ มธั ยฐานสา้ หรับขอ้ มูลที่ไม่จดั เปน็ หมวดหมู่ มีขันตอนดังนี
1) เรียงลา้ ดบั ค่าข้อมลู N ตวั จากนอ้ ยไปหามากหรือจากมากไปหาน้อย
2) ถา้ ข้อมูลมจี า้ นวนเป็นเลขค่ี คา่ มัธยฐานคอื คา่ ของขอ้ มลู ทอี่ ยู่ตรงต้าแหน่ง (N 1) พอดี
3) ถา้ ขอ้ มูลมีจา้ นวนเป็นเลขคู่ คา่ มัธยฐานจะอยรู่ ะหว่างขอ้ มลู สองค่าทอ่ี ย่รู ะหว่าง2ขอ้ มลู ใน
ตา้ แหน่ง N และ N 1 ซ่ึงค่ามัธยฐานหาไดจ้ ากการเอาขอ้ มลู สองคา่ นันบวกกันแลว้ หารด้วย 2
22
12
ตวั อยา่ ง 1.6 ขอ้ มลู แสดงคะแนนสอบวิชา 316202 ของนักศกึ ษา 10 คน คือ
68, 60, 50, 42, 70, 80, 35, 63, 71 และ 64
จงหาค่ามธั ยฐานของคะแนนนกั ศึกษากลุ่มนี
วิธีทา 1. เรยี งลา้ ดับคา่ ของขอ้ มูลจากค่าน้อยไปหาคา่ มากได้
35, 42, 50, 60, 63, 64, 68, 70, 71, 80
2. หาตา้ แหน่งมธั ยฐาน คือ ต้าแหนง่ (N+1)/2 = (10+1)/2 = 5.5
3. ค่ามธั ยฐานคอื (63 64) 63.5
2
13
3.4 ฐานนยิ ม (Mode) คือ คา่ ของขอ้ มลู ท่มี ีจา้ นวนมากทส่ี ุดหรือเกดิ ขึนมากครงั ทีส่ ุด เขยี นแทนดว้ ย Mo
การหาค่าฐานนยิ มส้าหรบั ข้อมูลทไ่ี ม่จดั เปน็ หมวดหมู่
- ถ้าขอ้ มูลที่รวบรวมได้เปน็ 1, 1, 2, 3, 5
ฐานนยิ มคือ 1
- ถ้าขอ้ มลู ทร่ี วบรวมได้เปน็ 6, 6, 7, 8, 9, 9
ฐานนยิ มคอื 6 และ 9
- ถา้ ขอ้ มลู ท่ีรวบรวมได้เป็น 10, 12, 15, 18, 20
ไม่มีฐานนยิ ม
14
คา่ เฉล่ีย คา่ เฉล่ีย
มธั ยฐาน มธั ยฐาน
ฐานนิยม ฐานนิยม
15
3.5 คา่ เฉลยี่ เรขาคณติ
ถ้าข้อมูลประกอบด้วยอัตราการเปลี่ยนแปลง อัตราส่วน หรือเลชดรรชนีทางเศรษฐศาสตร์และ
ค่ากลางที่เหมาะสมกับข้อมูลประเภทนี คือ คา่ เฉล่ียเรขาคณิต (Geometric mean) ซ่ึงเขียนแทนด้วย
G.M. โดย
- ถา้ มขี อ้ มูล X1, X2, , XN รวม N ตวั แลว้ G.M. = N X1X2 XN
N
log X N
หรือ log G.M. = log X1 log X2 log Xi
i 1
NN
- ถ้าข้อมูล X1, X2, , XR ปรากฏรวม f1, f2, , fR ครัง ตามลา้ ดับ
โดยR G.M. = X X XN f1 f2 fR
12 R
fi N แล้ว
i1 R
หรอื log G.M. = f1 log X1 f2 log X 2 fR log X R i1 fi log Xi
NN
16
4. การวัดการกระจายและการกระจายสัมพทั ธ์
จากทก่ี ล่าวมาแล้ว เราสามารถค้านวณหาค่ากลางของขอ้ มูลไดห้ ลายคา่ แต่การทา้ ความเข้าใจ
เกี่ยวกบั ข้อมลู โดยการพิจารณาเฉพะค่ากลางท่ีค้านวณไดอ้ าจไม่เพยี งพอ พิจารณาข้อมูล 3 ชดุ ต่อไปนี
ข้อมลู ชุดที่ 1 10, 10, 10, 10, 10, 10, 10
ขอ้ มลู ชุดท่ี 2 9, 10, 9, 11, 10, 11, 10
ข้อมลู ชดุ ที่ 3 9, 8, 11, 8, 11, 12, 11
คา่ เฉล่ยี เลขคณติ ของข้อมลู ชดุ ท่ี 1 = ชุดท่ี 2 = ชุดท่ี 3 = 10 ซ่งึ ข้อมูลชดุ ที่ 1 ประกอบดว้ ย
ค่าท่ีมขี นาดเทา่ กันสว่ นที่ข้อมูลชดุ ที่ 3 ประกอบด้วยค่าทม่ี ขี นาดแตกตา่ งกันมากกว่าข้อมูลชดุ ที่ 2 แสดง
ว่าลักษณะของข้อมลู ทัง 3 ชุดย่อมแตกตา่ งกนั ในวชิ าสถิติถอื วา่ ข้อมูลชดุ ท่ี 1 จะมกี ารกระจายน้อยทีส่ ดุ
กลา่ วคือ มคี า่ การกระจายเทา่ กบั ศนู ย์และข้อมลู ชดุ ที่ 2 จะมีการกระจายนอ้ ยกว่าข้อมลู ชุดท่ี 3 การวัด
การกระจาย (Measure of dispersion) ของข้อมูลมีหลายวิธี คือ
17
4.1 พสิ ยั (Range) คอื ผลต่างระหว่างค่าสงู สุดและต่า้ สุดของขอ้ มลู นั่นคอื
ถา้ มีข้อมลู X1, X2, , XN รวม N ตัว แลว้
พิสัย = Xmax Xmin
เมอื่ XMax คอื คา่ ของข้อมูลทม่ี คี ่ามากท่สี ุด
XMin คอื ค่าของข้อมลู ที่มีคา่ นอ้ ยท่ีสดุ
4.2 พิสัยระหว่างควอร์ไทล์ (Interquartile range) ซึ่งเขียนแทนด้วย IQR เป็นวิธีวัดการกระจายที่ปรับปรุง
จากพิสัย โดยวัดพิสัยหรือผลต่างระหว่างควอร์ไทล์ที่มากที่สุดและน้อยท่ีสุด ทังนีเพื่อหลีกเลี่ยงผลกระทบกรณี
ค่าปลายสดุ คา่ หนึ่งหรอื ทังสองค่ามคี ่ามากหรือน้อยผิดปกติ น่ันคือ
IQR = Q3 Q1 เม่อื Q3 และ Q1 คอื ควอรไ์ ทลท์ ี่ 3 และควอร์ไทลท์ ี่ 1
กรณขี องขอ้ มลู ทีไ่ ม่จดั เปน็ หมวดหม่รู วม N ตัว Q1 Q2 Q3
r N 1
Qr 4 , r 1, 2, 3
18
ตวั อย่าง 1.11 จากข้อมูลแสดงคะแนนสอบวิชาหนงึ่ ของนกั ศกึ ษา 7 คน ดงั นี
55, 50, 59, 61, 65, 80 และ 71
จงหาพสิ ยั ระหวา่ งควอร์ไทล์
วธิ ีทา เรียงลา้ ดับขอ้ มลู จากน้อยไปหามาก 50, 55, 59, 61, 65, 71, 80
ตา้ แหนง่ ของ Q1 คือ 7 1 2 จะไดว้ ่า Q1 55
จะไดว้ ่า Q3 71
4
ตา้ แหนง่ ของ Q3 คอื 37 1 6
4
ดังนัน IQR คอื Q3 Q1 71 55 16
19
1.4.3 ความแปรปรวนและค่าเบ่ียงเบนมาตรฐาน
ความแปรปรวน (Variance) คอื คา่ เฉลี่ยของก้าลังสองของค่าเบี่ยงเบนจากคา่ เฉลีย่ ของขอ้ มลู แตล่ ะตวั
ซง่ึ เขียนแทนดว้ ย 2
N 2
หรอื 2 Xi
N N X 2
i 1 i i 1
X i 2
N
2 i1
N
N
ทังนี 2ทีค่ า้ นวณไดจ้ ะมีหน่วยเปน็ หน่วยของข้อมูลก้าลงั สอง และมีคา่ มากถ้าข้อมูลมีการกระจาย
จากคา่ เฉลี่ยมาก แตถ่ า้ ขอ้ มลู ไม่มีการกระจายเลยหรือขอ้ มลู ทกุ ตวั มคี า่ เทา่ กนั 2 ก็จะมคี ่า
เปน็ ศนู ย์
20
คณุ สมบัตขิ องความแปรปรวน
1. ถา้ บวกแต่ละค่าของข้อมลู X1 , X2 , … , XN ทมี่ ีความแปรปรวน 2 ด้วยคา่ คงที่ A แล้ว ขอ้ มลู
X1+A , X2+A , … , XN+A มีความแปรปรวนเทา่ เดมิ
2. ถา้ คณู แต่ละค่าของข้อมูล X1 , X2 , … , XN ที่มีความแปรปรวน 2 ดว้ ยคา่ คงที่ A แลว้ ขอ้ มลู
AX1 , AX2 , … , AXN มคี วามแปรปรวน A2 2
3. ถ้าขอ้ มลู 2 ชุด แตล่ ะชุดมขี นาด N1 , N2 ความแปรปรวน 2 , 2 และค่าเฉลีย่ 1 , 2
1 2
ตามลา้ ดบั แล้วความแปรปรวนรวม (Pooled variance) ของขอ้ มูลทงั 2 ชุด มคี า่ เปน็
2
N1 12 12 N2 22 2 N11 N22
2 2
p N1 N2 N1 N2
แต่ถา้ ขอ้ มลู ทงั สองมคี า่ เฉลยี่ เทา่ กัน ดังนัน
2 N112 N2 2
p 2
N1 N2 21
หากถอดรากทสี่ องของความแปรปรวน 2 ก็จะได้การวัดการกระจายอกี วิธหี นง่ึ ซ่ึงมหี น่วย
เหมอื นกบั หนว่ ยของขอ้ มูล เรยี กว่า คา่ เบีย่ งเบนมาตรฐาน (Standard deviation) แทนด้วย
2
โดยคา่ เบี่ยงเบนมาตรฐานทค่ี ้านวณได้ มีความหมายวา่ โดยเฉล่ียแลว้ ข้อมลู แตล่ ะคา่ เบ่ียงเบน
จากคา่ เฉล่ีย เป็นจานวน หนว่ ยขอ้ มลู
22
การวัดการกระจายสมั พทั ธ์
กรณีทข่ี อ้ มลู 2 ชดุ หากจะเปรยี บเทียบการกระจายของข้อมลู ทัง 2 ชดุ โดยพจิ ารณาจากคา่
ดังกลา่ วแล้วนับวา่ ไม่ถกู ตอ้ ง เพราะแต่ละค่าของขอ้ มูลในชุดเดยี วกันอาจมคี ่าใกลเ้ คยี งกนั แตร่ ะหว่างชุด
อาจมคี ่าแตกตา่ งกันมากๆกไ็ ด้ ท้าใหน้ า้ คา่ กระจายสมั บูรณข์ องข้อมลู แตล่ ะชุดมาเปรยี บเทยี บกันไมไ่ ด้
แม้วา่ จะมคี ่าเทา่ กันก็ตาม เชน่ ค่าเบย่ี งเบนมาตรฐานของน้าหนกั ไก่ 5 ตวั เท่ากบั 0.2 กรมั นบั ว่าน้อย
แตย่ ่อมมีผลกระทบแตกต่างจากค่าเบ่ียงเบนมาตรฐานของน้าหนกั ไข่ 5 ฟอง ทีเ่ ท่ากับ 0.2 กรัม ซ่ึง
นบั วา่ มาก
การเปรียบเทียบการกระจายของขอ้ มลู 2 ชดุ อย่างถูกวธิ ี ต้องพจิ ารณาจากการกระจาย
สมั พัทธ์ (Relative dispersion) โดย
การกระจายสมั พัทธ์ = การกระจายสมั บรู ณ์ / คา่ กลาง
การวัดการกระจายสมั พัทธ์ทใี่ ชก้ ันแพร่หลายคือ สมั ประสิทธข์ิ องความแปรผนั (Coefficient of
variation) ซงึ่ แทนด้วย C.V. โดย C.V. 100
23
ตัวอยา่ ง 1.16 ถา้ คะแนนสอบไลว่ ชิ าการใชห้ อ้ งสมดุ มีค่าเฉล่ีย 78 ค่าเบ่ียงเบนมาตรฐาน 8 และ
คะแนนสอบไลว่ ิชาจิตวทิ ยามคี ่าเฉลีย่ 73 ค่าเบ่ยี งเบนมาตรฐาน 7.6 จงหาวา่ คะแนนสอบไล่วชิ าไหนมี
การกระจายมากกวา่ กนั
วิธที า จาก C.V. 100
วชิ าการใชห้ ้องสมุด C.V. 8 100 10.26%
78
วิชาจติ วทิ ยา C.V. 7.6 10.41%
100
73
เนอื่ งจาก C.V. ของคะแนนสอบวิชาจิตวทิ ยามากกว่าวชิ าการใช้หอ้ งสมดุ
ดังนัน คะแนนสอบวิชาจติ วทิ ยามีการกระจายมากกว่าวิชาการใช้หอ้ งสมดุ
24
5. คะแนนมาตรฐาน
ในการเปรียบเทยี บคะแนนหรอื ค่าของขอ้ มลู ตังแต่ 2 คา่ ขนึ ไป ต้องแปลงค่าของข้อมลู ดงั กลา่ วให้
เป็นคะแนนมาตรฐาน (Standard score or Z-score) ซึ่งแทนดว้ ย Z โดย
Z X
ทงั นีคะแนนมาตรฐาน Z จะบอกใหท้ ราบวา่ ขอ้ มลู ดังกลา่ วมคี า่ มากหรือน้อยกว่าคา่ เฉลี่ย เป็น
กีเ่ ทา่ ของค่าเบ่ียงเบนมาตรฐาน ดังนัน โดยพิจารณาจากคะแนนมาตรฐาน Z ท่ีแปลงจากแต่ละค่า
ของข้อมูลที่ต้องการเปรียบเทียบ ก็จะได้ข้อสรุปว่าข้อมูลใดมีค่าสูงหรือต่้ากว่ากัน ในท้านองเดียวกัน
เน่ืองจากคะแนนมาตรฐาน Z เป็นค่าท่ีไม่มีหน่วย ดังนันจึงใช้ในการเปรียบเทียบข้อมูลประเภท
เดยี วกันแต่มีหน่วยต่างกนั ได้
25
ตัวอย่าง 1.17 ถา้ เวลาทพี่ นกั งานพิมพ์ดดี ซึง่ ทา้ งานในคณะนติ ิศาสตร์ พณิชยศาสตรแ์ ละการบญั ชี
และ วทิ ยาศาสตร์ ใช้ในการพมิ พ์แบบทดสอบของแต่ละกลุม่ ซง่ึ มกี ารปรบั แกจ้ า้ นวนคา้ ท่ีผดิ แลว้ มี
คา่ เฉลยี่ และคา่ เบีย่ งเบนมาตรฐานดังนี
คณะ ค่าเฉลี่ย ค่าเบ่ียงเบนมาตรฐาน
นติ ิศาสตร์ 180 วินาที 30 วนิ าที
พณชิ ยศาสตรแ์ ละการบญั ชี 10 นาที 2 นาที
วิทยาศาสตร์ 26 นาที 5 นาที
ถา้ ตอ้ งการเปรยี บเทียบความเร็วของ พนักงาน ซงึ่ ทา้ งานในคณะนิตศิ าสตร์ พณิชยศาสตร์และการ
บญั ชี และวทิ ยาศาสตร์ ตามล้าดับ ซ่ึงใชเ้ วลาในการพิมพแ์ บบทดสอบของแตล่ ะกลมุ่ เปน็ 141 วินาที
7 นาที และ 33 นาที ตามล้าดับ จงหาว่าใครมคี วามสามารถในการพิมพ์มากท่สี ดุ
26
วธิ ที า ต้องค้านวณหาคา่ Z ของแต่ละคน
จาก Z X Z 141180 1.3
30
Z 7 10 1.5
นิตศิ าสตร์ ; 2
พณชิ ยศาสตรแ์ ละการบัญชี ;
วิทยาศาสตร์ ; Z 33 26 1.4
5
เนือ่ งจากค่า Z ของพนกั งานคณะพณิชยศาสตรแ์ ละการบญั ชี มีค่าน้อยทสี่ ุด
ดังนัน พนักงานคณะพณิชยศาสตร์และการบัญชี มคี วามสามารถในการพิมพ์มากทสี่ ุด
27
6. แผนภาพกลอ่ ง
แผนภาพกลอ่ ง (Box plot หรือ Box-and-whisker plot) เปน็ วิธกี ารนา้ เสนอข้อมลู โดยจะแสดงคา่
กลาง การกระจาย ความสมมาตร และคา่ ผิดปกตขิ องขอ้ มูล (ถา้ มี) ตลอดจนความยาวของปลายหาง
ของการแจกแจงดว้ ยมัธยฐานและฮนิ จ์ (Hinge) โดยฮนิ จ์เป็นคา่ วัดทคี่ ล้ายคลึงกบั ควอร์ไทลแ์ ละมี
วตั ถปุ ระสงค์เดยี วกัน แต่คา่ ของฮินจ์และควอร์ไทลจ์ ะแตกตา่ งกนั เล็กนอ้ ย และจะมคี ่าใกลเ้ คียงกันมาก
เมอ่ื ข้อมูลมขี นาดใหญ่
28
ตวั อยา่ ง 1.18 จงสรา้ งบอ๊ กพลอตรอ้ ยละก้าไรสทุ ธขิ อง 22 บริษัทดงั นี
5.3 4.0 12.5 3.0 3.9 6.4 5.2 2.6 15.8 7.1 3.7
4.4 3.5 3.4 3.2 5.6 3.2 3.4 6.2 4.0 8.6 3.1
วิธีทา กอ่ นอื่นเรยี งล้าดบั ข้อมูลจากนอ้ ยไปหามากได้ดงั นี
2.6 3.0 3.1 3.2 3.2 3.4 3.4 3.5 3.7 3.9 4.0
4.0 4.4 5.2 5.3 5.6 6.2 6.4 7.1 8.6 12.5 15.8
มธั ยฐานไดแ้ ต่คา่ ของข้อมูลตา่้ แหน่งที่ 22 1 11.5 นั่นคือ 4.0 4.0 4.0
22
ฮินจ์ได้แก่ค่าของขอ้ มลู ตา้ แหนง่ ท่ี 11.51 1116 นั่นคอื
22
ฮนิ จล์ า่ ง เท่ากบั 3.4 และฮินจ์บน เทา่ กับ 6.2
H-spread เท่ากบั 6.2 3.4 2.8
29
1.5( H-spread )
3( H-spread )
ง
12.5 15.8
3( H-spread ) ( H-spread ) 3( H-spread )
1.5( H-spread ) 1.5( H-spread )
-5.0 -0.8 2.6 3.4 4.0 6.2 8.6 10.4 14.6
30
สาขาวิชาสถติ ิ คณะวทิ ยาศาสตร์ มหาวทิ ยาลยั ขอนแก่น Web Site
เลขที่ 123 ถนนมิตรภาพ อา้ เภอเมอื ง จงั หวดั ขอนแกน่
อาคารวทิ ยาศาสตร์ 06 ชนั 4 คณะวทิ ยาศาสตร์ สาขาวชิ าสถติ ิ
มหาวิทยาลัยขอนแก่น 40002
โทรศัพท์/โทรสาร : 043-202-375 31