การวดั และประเมินผลการเรียนรู้ 43
การวัดและประเมนิ ผลการเรียนรู้ 43
5. คาถามวัดการสงั เคราะห์
การสังเคราะห์ หมายถึง ความสามารถในการรวบรวมสิ่งต่างๆ ตั้งแต่ 2 ชนิดข้ึนไปเข้าด้วยกัน
เพอื่ ให้กลายเป็นสิ่งสาเร็จรปู ขึน้ ใหม่ ที่มคี ณุ สมบตั ิบางอย่างแปลกพิสดารไปจากส่วนประกอบย่อยๆ เดิม การ
สังเคราะห์เป็นพฤติกรรมท่ีต้องอาศัยความรู้ความจา ความเข้าใจ การนาไปใช้ และการวิเคราะห์เป็น
รากฐาน
คาถามด้านการสงั เคราะหม์ ี 3 แบบ คอื
5.1 การสังเคราะหข์ อ้ ความ เปน็ การนาความรแู้ ละประสบการณต์ ่าง ๆ ผสมผสานเพอ่ื ใหเ้ กิด
ขอ้ ความ หรอื ผลิตผลใหม่ๆ ทส่ี ามารถสือ่ ความคดิ ไปส่บู ุคคลอนื่ ๆ ได้ เชน่
ประโยคนคี้ วรแก้ไขอยา่ งไร จึงถกู ตอ้ งตามมาตรฐานการใชภ้ าษาทด่ี ี
“เราทุกคนตา่ งก็ต้องพึ่งพาอาศยั ซ่ึงกนั และกันในโลกนี้”
ก. เราทกุ คนกต็ ้องพ่งึ พาอาศัยกันและกนั ในโลกน้ี
ข. เราต่างตอ้ งพ่ึงพาอาศัยซงึ่ กันและกัน
ค. ในโลกน้ตี า่ งต้องพึ่งพาอาศัยซึ่งกันและกนั
ง. เราทกุ คนในโลกนต้ี ้องพง่ึ พาอาศยั ซง่ึ กนั และกัน
5.2 การสังเคราะห์แบบแผนงาน เป็นการกาหนดแนวทางและข้ันตอนการปฏิบัติงานใดๆ
ลว่ งหน้า เพือ่ ให้การดาเนนิ งานของกจิ การน้ันราบรื่น บรรลผุ ลตรงตามเกณฑแ์ ละมาตรฐานทก่ี าหนดไว้ เชน่
ในการทดลองหาความหนาแน่นของนา้ แข็ง เราต้องระวังอะไรเปน็ พิเศษ
ก. น้าหนักของนา้ แข็ง ข. ปริมาณของก้อนนา้ แข็ง
ค. อุณหภมู ิของนา้ แข็ง ง. โพรงอากาศในก้อนนา้ แข็ง
5.3 สังเคราะห์ความสมั พันธ์ หมายถึง การค้นหาความสัมพันธข์ องหน่วยย่อยต่างๆ ให้รวมเป็น
ส่ิงเดียวกันการสังเคราะห์ความสัมพันธ์มีลักษณะคล้ายการริเร่ิมสร้างสรรค์เป็นการนาเอาหลักการ หลักวิชา
หลายๆ เร่อื งมาผสมกันเพ่ือใหเ้ กิดหน้าทีใ่ หม่ เหมาะสมกบั การใชใ้ นสถานการณ์ใหม่ เชน่
จากการทดลองปรากฏวา่ ก + 3 = ข + 4
ฉะนั้นเราอาจสรุปได้วา่
ก. ก = ข ข. ก มากกว่า ข
ค. ก น้อยกวา่ ข ง. 2 ก เทา่ กบั 3 ข
6. คาถามวดั การประเมนิ ค่า
การประเมินค่า หมายถงึ การวินิจฉยั การตีคุณค่า เป็นราคาของส่ิงต่างๆ โดยสรุปอย่างมีหลักเกณฑ์
ว่าส่ิงนัน้ มีคุณคา่ ดี-เลว หรือเหมาะสมเชน่ ไร นับเป็นความสามารถของสมองดา้ นปัญญาขน้ั สดุ ท้าย ลักษณะ
สาคัญของการประเมนิ ค่า จะต้องพจิ ารณารอบคอบแล้ว นาไปเปรียบเทียบกับกฎเกณฑ์ต่างๆ วา่ สอดคลอ้ งกัน
หรอื ไม่เพยี งใด โดยใช้เกณฑ์ 2 ประเภท คือ ใช้เกณฑ์ภายนอกและใชเ้ กณฑภ์ ายใน
44 การวัดและประเมินผลการเรียนรู้ 44
การวัดและประเมนิ ผลการเรยี นรู้
6.1 การประเมินค่าโดยเกณฑภ์ ายใน เปน็ การวนิ ิจฉัยคุณคา่ ตามเกณฑภ์ ายในเรือ่ ง เช่น
ความสอดคล้องของเหตผุ ล ความถกู ต้องเหมาะสมของข้อมูล เปน็ ตน้ ตวั อย่าง เชน่
การทพี่ ระอาทติ ยข์ ึ้นทางตะวนั ออกไปตะวนั ตกทกุ วนั เหมาะสาหรับพิสูจน์ความจรงิ เรอื่ งใดได้ดีที่สุด
ก. โลกหมุนตลอดเวลา ข. โลกหมนุ ในทิศทางเดยี วกนั
ค. โลกหมนุ รอบดวงอาทติ ย์ ง. โลกหมุนด้วยความเรว็ คงที่
6.2 การประเมนิ ค่าโดยเกณฑภ์ ายนอก เป็นการวนิ ิจฉยั คณุ ค่าของสง่ิ ตา่ ง ๆ โดยใชเ้ กณฑ์อนื่
ๆ นอกเนื้อเร่อื งราวในขอ้ เท็จจริงนัน้ มาเป็นเกณฑ์พิจารณาวนิ ิจฉัย เช่น
วรรณคดเี ร่ืองใดมีเน้อื เรอื่ งใกล้เคียงสภาพความเปน็ จรงิ ของมนษุ ยม์ ากทสี่ ดุ ?
ก. สามกก๊ ข. พระอภยั มณี
ค. สงั ขท์ อง ง. ขนุ ชา้ งขนุ แผน
การสร้างแบบทดสอบ
วิธีการดาเนินการสร้างข้อสอบในการประเมินผลขึ้นอยู่กับประเภทของการประเมินผลซึ่งมี
วัตถุประสงค์และลักษณะการประเมินแตกต่างกัน กล่าวคือ การประเมินผลแบบอิงกลุ่มจะมุ่งเน้นการวัด
ความสามารถทางสมองเป็นส่วนใหญ่ แต่การประเมินแบบอิงเกณฑ์จะมุ่งเนน้ พฤติกรรมตามวัตถุประสงค์ ซ่ึง
เปน็ พฤติกรรมท่กี าหนด ดงั นั้นลักษณะของข้อสอบจึงแตกต่างกนั ด้วย
การสรา้ งแบบทดสอบแบบองิ กลมุ่
ข้อสอบท่ีใช้วัดแบบอิงกลุ่มจะเน้นการวัดความสามารถทางสมองทั้ง 6 ด้าน คือ ความรู้–ความจา
ความเขา้ ใจ การนาไปใช้ วเิ คราะห์ สังเคราะห์ และการประเมนิ คา่
ขนั้ ตอนสาคัญในการวางแผนสร้างแบบทดสอบประเภทน้มี ีดงั นี้
1. กาหนดวัตถุประสงค์ของการวัดว่าต้องการอะไรวัด วัดใคร นักเรียนช้ันใด ระดับใด เมื่อไร
เป็นตน้
2. ศึกษาเนื้อหาท้ังหมดทีจ่ ะนามาทดสอบ โดยพจิ ารณาจากขอบเขตของเนือ้ หาที่ตอ้ งการทดสอบว่า
ประกอบดว้ ยเน้ือหาอะไรบ้าง และแตล่ ะเน้ือเรอื่ งมขี อบเขตกวา้ งขวางเพยี งใด
3. ศกึ ษาจดุ มุ่งหมายของการสอนเนื้อหาเหล่านน้ั เพื่อเป็นส่ิงที่ชบี้ อกว่าข้อสอบนั้นจะเน้นพฤติกรรม
ด้านใด มากน้อยเพียงใด จึงสามารถวัดได้ตรงตามความมุ่งหมายการสอน
4. สรา้ งตารางวเิ คราะหห์ ลักสตู ร
การสร้างตารางวิเคราะห์หลักสูตร เป็นส่ิงจาเป็นอย่างยิ่งในการวางแผนสร้างข้อสอบ ครูที่ทาการ
สอนในวิชาน้ัน ๆ ผู้เชี่ยวชาญในสาขาวิชานั้น นักวัดผลจะร่วมกันสร้างตารางวิเคราะห์หลักสูตรข้ึนมา
สามารถนาไปใชใ้ นการเรยี นการสอน และใชเ้ ป็นแนวยึดในการเปน็ เน้อื หาการทดสอบ (Test Content) ถ้าครู
ออกข้อสอบตามตารางวิเคราะห์หลักสูตร จะช่วยให้ขอ้ สอบน้ันมคี ุณภาพวัดได้ครบทุกพฤตกิ รรมตามสัดส่วน
พอเหมาะตามจุดมุ่งหมาย (เยาวดี วิบลู ยศ์ รี, 2540, น. 30-32)
การวดั และประเมินผลการเรียนรู้ 45
การวดั และประเมนิ ผลการเรียนรู้ 45
การสรา้ งตารางวิเคราะห์หลักสตู ร
(1) ต้งั คนเพอ่ื ทาการวิเคราะห์ประมาณ 6-10 คน มีทัง้ นักวัดผล และผู้สอนในเร่ืองที่ออกข้อสอบ
(2) อ่านหลักสูตรในเร่ืองที่จะทาการวิเคราะห์ให้ละเอียด เพื่อพิจารณาเนื้อหาและความมุ่งหมาย
ของหลกั สูตรของวชิ าท่ีจะทาการวิเคราะห์
(3) พิจารณาจุดประสงค์การเรียนรู้ในหลักสูตรว่าต้องการให้ผู้เรียนเกิดพฤติกรรมใดบ้าง เช่น
พฤติกรรมทางสมองทั้ง 6 ด้าน คือ ความรู้–ความจา ความเข้าใจ การนาไปใช้ วิเคราะห์ สังเคราะห์ และการ
ประเมินค่า
(4) พิจารณาเนื้อหาในหลักสูตรโดยพิจารณาแบ่งเนื้อหาที่ต้องการสอนออกเป็นตอน ๆ ตามความ
เหมาะสม
(5) ผวู้ ิเคราะหห์ ลักสูตรแต่ละคน กาหนดน้าหนกั ความสาคัญระหวา่ งเนอ้ื หากบั พฤตกิ รรมที่ต้องการ
วดั โดยใหแ้ ตล่ ะช่องมีคะแนนเตม็ 10 คะแนน ลงในตารางวิเคราะหห์ ลักสตู ร (รายบุคคล) ดงั นี้
ตารางวเิ คราะหห์ ลักสูตร
(รายบุคคล)
พฤติกรรม
เนือ้ หา ความ ความ การ การ การสงั การ รวม อันดบั
ร-ู้ จา เขา้ ใจ นาไป วิเคราะห์ เคราะห์ ประเมนิ ยอ่ ย ความ
ใช้ สาคัญ
ค่า
1.
2.
3.
4.
5.
รวมยอ่ ย
อันดับความสาคัญ
(6) นาตารางวิเคราะห์หลักสูตรของทุกคนมาหาค่าเฉลี่ยของความคิดเห็นของทั้งกลุ่ม โดยนา
คะแนนของทุกคนมารวมกันแล้วหารด้วยจานวนคนท้งั กลุ่ม ทาเช่นน้ีจนครบทุกช่อง กจ็ ะได้ตารางวิเคราะห์
หลกั สูตรทีเ่ รยี กวา่ ตารางเฉลยี่ เป็นการยบุ ใหเ้ หลือตารางเดียวดังตัวอย่างต่อไปนี้
46 การวดั และประเมนิ ผลการเรียนรู้ 46
การวัดและประเมินผลการเรียนรู้
พฤติกรรม ตารางวิเคราะหห์ ลักสตู ร วิชาวิทยาศาสตร์ ชน้ั ป.6
เนื้อหา (ตารางเฉลยี่ )
1. สง่ิ มีชวี ติ
2. การช่ัง ตวง วัด ความ ความ การ การ การสัง การ รวม อนั ดบั
3. สสารและพลังงาน ร-ู้ จา เขา้ ใจ นาไป วิเคราะห์ เคราะห์ ประเมนิ ยอ่ ย ความ
4. แรงธรรมชาติ ใช้ สาคัญ
5. ผลงานทางวทิ ยฯ์ ค่า
7 7 8 7 7 9 45 1
6 8 9 6 6 8 43 3
8 8 8 6 6 8 44 2
7 7 8 7 6 5 40 4
7 7 6 5 5 6 36 5
รวมย่อย 35 37 39 31 30 36 208
อนั ดบั ความสาคัญ 4 2 1 5 6 3
(7) เมื่อได้ตารางวิเคราะห์หลักสูตรเฉล่ียแล้ว ทาการปรับตัวเลขในตารางเฉล่ียให้ได้ผลรวมท้ังส้ิน
เท่ากับ 100 หรือ 1000 โดยการเทียบบัญญัติไตรยางศ์ เพ่ือความสะดวกในการปรับตัวเลขให้ได้ผลรวม
เท่ากับจานวนข้อสอบท่ีต้องการ และช่วยให้เปรียบเทียบความสาคัญของแต่ละเนื้อหา และพฤติกรรมได้
อยา่ งชดั เจนขึน้ ดงั ตัวอย่างต่อไปน้ี
พฤติกรรม ตารางวเิ คราะห์หลกั สตู ร วชิ าวิทยาศาสตร์ ชนั้ ป.6
เนื้อหา (ตารางร้อย)
ความ ความ การ การ การสัง การ รวม อนั ดับ
ร-ู้ จา เขา้ ใจ นาไป วเิ คราะห์ เคราะห์ ประเมนิ ยอ่ ย ความ
ใช้ สาคัญ
ค่า
1. สิ่งมีชวี ติ 3 3 4 3 3 4 20
2. การชง่ั ตวง วัด 3 4 4 3 3 4 21
3. สสารและพลังงาน 4 4 4 3 3 4 22
4. แรงธรรมชาติ 3 3 4 3 3 3 19
5. ผลงานทางวิทย์ฯ 3 3 3 3 3 3 18
รวมย่อย 16 17 19 15 15 18 100
อนั ดับความสาคัญ
การวดั และประเมนิ ผลการเรียนรู้ 47
การวดั และประเมินผลการเรยี นรู้ 47
(8) ปรับตวั เลขในตาราง 100 หรือ ตาราง 1000 ใหไ้ ดผ้ ลรวมกบั จานวนขอ้ สอบท่ตี ้องการ โดย
การเปรยี บเทยี บบญั ญตั ิไตรยางค์
5. กาหนดรูปแบบของข้อสอบว่าจะเลือกใช้แบบใด การเลือกรูปแบบของข้อสอบแบบปรนัยนั้นมี
หลักอยู่ว่า ควรเลือกรูปแบบให้เหมาะสมกับวัตถุประสงค์ของการสอบเนื้อหาและจุดมุ่งหมายของหลักสูตรที่
ขอ้ สอบจะวัด กระบวนการตรวจให้คะแนน การดาเนินการสอบ ดงั นั้นผูส้ ร้างข้อสอบจงึ ควรศกึ ษาคุณสมบัติ
ของข้อสอบแต่ละแบบว่ามีลักษณะอยา่ งไร มีจุดเด่นดอ้ ยอยา่ งไรเพื่อจะได้เลือกใชอ้ ยา่ งเหมาะสม
6. ออกข้อสอบตามจานวนที่กาหนดไว้ โดยให้สอดคล้องกับตารางวิเคราะห์หลักสูตรแล้วนามาจัด
ฉบบั และเขียนคาช้แี จง ซงึ่ มรี ายละเอียดดังน้ี (สุรชัย มชี าญ, 2540, น. 29-34)
การเขียนคาชแี้ จงในแบบทดสอบ
ผู้สร้างข้อสอบบางคนมองข้ามความสาคัญของคาชี้แจงไป เช่น เขียนข้อสอบ โดยไม่มีคาช้ีแจง
หรือช้ีแจงวิธีสอบโดยใช้คาพูด ซ่ึงบางคร้ังอาจลืมพูดบางคาส่ังไป ทาให้ผู้สอบไม่เข้าใจวิธีการตอบ น้ันคา
ชี้แจงในแบบทดสอบจึงถือว่าเป็นส่วนสาคัญของแบบทดสอบผู้สร้างข้อสอบจะต้องเขียนให้ชัดเจน ซึ่งควร
ประกอบด้วยสง่ิ เหล่าน้ี
(1) วัตถุประสงค์ของการสอบ
(2) เวลาทีใ่ ช้ในการสอบ
(3) วิธกี ารตอบ
การจดั เรยี งขอ้ สอบในแบบทดสอบควรมีลักษณะ ดงั น้ี
(1) แยกกลมุ่ คาถามตามรปู แบบของคาถามแล้วเรยี งจากง่ายไปยาก คอื เรียงตามลาดับ ขอ้ ข้อสอบ
แบบถกู –ผิด ข้อสอบแบบจับคู่ เติมคา เลอื กตอบ และข้อสอบแบบอตั นัย
(2) ขอ้ สอบทีเ่ น้ือหาเดียวกัน ควรจดั ไว้ในกลมุ่ เดยี วกัน
(3) ในแต่ละกลุ่มที่แบ่งไว้ ให้จัดข้อสอบเรียงตามวัตถุประสงค์ของการประเมิน เร่ิมจากความรู้ -
ความจา ความเข้าใจ การนาไปใช้ วิเคราะห์ สงั เคราะห์ และการประเมินคา่
(4) ขอ้ สอบในแต่ละจุดประสงค์ ให้เรียงจากข้อง่ายไปหาขอ้ ยาก
(5) การเรียงข้อสอบในการจัดพิมพ์ ควรจัดหน้ากระดาษแบ่งออกเป็น 2 ซีก ซ้าย - ขวา เพื่อ
ขอ้ ความท่ีเป็นคาถามตอบ จะไดจ้ ดั พมิ พ์เปน็ บรรทัดสน้ั ๆ สะดวกในการอา่ น และประหยดั กระดาษ
7. นาข้อสอบท่ีสร้างขึ้นไปทดลองสอบ โดยคัดเลือกกลุ่มตัวอย่างที่จะทดลองข้อสอบให้เหมาะสม
ซงึ่ จะตอ้ งพิจารณาระดบั ช้นั วัย สถานะทางสงั คม จานวนนกั เรียน เป็นตน้
8. เมือ่ ทดลองสอบแลว้ นาผลการสอบมาวเิ คราะหค์ ณุ ภาพเพอ่ื คดั เลือกข้อทีด่ เี ก็บไว้และปรบั ปรุง
แก้ไขขอ้ สอบทีบ่ กพรอ่ งตอ่ ไป หรือข้อใดทค่ี ณุ ภาพตา่ มากอาจตดั ทิ้ง ดงั น้ันจึงควรออกขอ้ สอบให้มีจานวน
ข้อสอบมากกว่าท่ีต้องการ เพือ่ จะได้มขี อ้ สอบเพียงพอหลงั พิจารณาตัดทง้ิ แล้ว
การวัดและประเมินผลการเรียนรู้ 48
48 การวดั และประเมินผลการเรยี นรู้
9. จดั ทาขอ้ สอบฉบบั จรงิ หลงั จากคัดเลอื ก ปรับปรงุ และตัดท้ิงแล้ว ใหพ้ ิจารณาเรยี งข้อเสยี ใหม่
เชน่ เรยี งจากขอ้ ง่ายไปหาข้อยาก
10. พิมพ์แบบทดสอบจริง จัดรูปแบบให้เหมาะสม โดยคานึงถึงความสะดวกของผู้สอบเป็นอับดับ
หนง่ึ ส่วนความประหยัด และความสวยงาม รองลงมา
การสร้างขอ้ สอบแบบองิ เกณฑ์
การประเมินผลแบบองิ เกณฑ์ เป็นการวดั ผลตามจดุ ประสงค์เชิงพฤติกรรม ดังน้ันขอ้ สอบท่ีนามาใช้
จงึ จาเป็นต้องเปน็ ขอ้ สอบวัดพฤตกิ รรมว่า นกั เรยี นสามารถแสดงพฤติกรรมไดต้ ามท่กี าหนดไวห้ รอื ไม่
สิ่งทีต่ ้องการพจิ ารณาในการวดั พฤตกิ รรมตามวตั ถุประสงค์ คอื
ตามหลกั ของการวัดผลในแบบของการวัดผลตามวัตถุประสงค์เชิงพฤติกรรมนนั้ ถอื วา่
1. พฤติกรรมต่างๆ จะเกิดข้ึนได้ เม่ือมีการวางแผนเงื่อนไขหรือมีการเร้าเสียก่อนจึงจะเกิดขึ้น
(Conditioning) ดังนั้น ในการวัดผลตามจุดประสงค์เชิงพฤติกรรม จึงต้องเตรียมเง่อื นไขหรือสถานการณ์ท่ีจะ
ทาให้เกิดพฤติกรรมน้ันข้นึ ไว้กอ่ นเสมอ
2. พฤติกรรมท่ีเกิดข้ึนนั้น เป็นพฤติกรรมที่คาดหวังไว้ว่า เม่ือเรียนรู้ไปได้สมควรแก่เวลาและ
เรื่องราวแล้ว น่าจะเกิดพฤตกิ รรมอย่างน้ัน อย่างนี้ขึ้น พฤตกิ รรมนี้เองเป็นส่งิ ท่ีผู้ทาหน้าที่วัดผลเจตนาท่ีจะ
วดั เพอื่ ดวู า่ ผลการเรยี นของเดก็ บรรลเุ ป้าหมายทค่ี าดหวังไว้หรือไม่
พฤตกิ รรมทค่ี าดหวงั นี้ อาจพิจารณาแบง่ ออกได้เป็น 2 พวก คอื
(1) พฤติกรรมท่ีคาดว่าจะเกิดข้ึนในลาดับข้ันของการเรียนรู้พฤติกรรมน้ีหมายถึง พฤติกรรมท่ี
คาดว่าจะเกิดขึน้ หลงั เกิดการเรียนรู้ผา่ นมาถึงข้ันนแี้ ล้ว
(2) พฤติกรรมทค่ี าดหวังปลายทาง (Terminal Behavior) เป็นพฤติกรรมท่ีคาดว่าจะเกิดขึ้นใน
ข้ันสุดท้ายที่กระบวนการเรียนการสอนส้ินสุดลงแล้ว พฤติกรรมน้ีมักจะจัดไว้ในลักษณะจุดประสงค์การเรียน
การสอน หรือเปา้ หมายของการเรยี นการสอน
3. เกณฑ์ที่จะยอมรับ พฤติกรรมต่าง ๆ (Criterion) ที่เกิดข้ึนใต้เงื่อนไข หรือสถานการณ์ท่ีตั้งข้ึนมา
เพ่ือให้เกิดพฤติกรรมนั้น ยังมีปัญหาท่ีสาคญั ซึ่งจะเกิดข้ึน คือ พฤติกรรมท่ีเกิดขึ้นน้ันเป็นอย่างไร เกิดข้ึนอย่าง
แทจ้ รงิ หรอื เกดิ โดยบงั เอญิ เปน็ พฤติกรรมที่คงทนถาวรหรือไม่ เพยี งใด
เพื่อท่ีจะตัดสินใจในเร่ืองนี้ ผู้วัดผลตามจุดประสงค์เชิงพฤติกรรมจึงจาเป็นต้องต้ังเกณฑ์ ในการ
พิจารณาตดั สินใจยอมรับพฤตกิ รรมทีส่ งั เกตเหน็ น้นั เชน่
ใช้เวลาในการเกดิ เปน็ เกณฑ์ ตวั อยา่ งเช่น ต้องเกิดพฤตกิ รรมนีน้ านอยา่ งนอ้ ย 3 นาที
ใช้ความถ่ใี นการเกิดพฤติกรรมเป็นเกณฑ์ ตวั อยา่ งเช่น ต้องเกิดพฤติกรรมอยา่ งน้ีไม่น้อยกว่า 3 คร้ัง
ครัง้ ในจานวนการสงั เกต 5 คร้งั จงึ จะยอมรบั
ใช้ปรมิ าณของผลที่จะเกดิ จากพฤติกรรมน้ันๆ เป็นเกณฑ์ ตัวอยา่ งเช่น ต้องเขียนเรียงความได้ยาว
อย่างน้อย 20 บรรทัด หรือตอบถูกต้อง 4 ข้อ ในจานวนข้อสอบ 5 ข้อ หรือทาถูกต้อง 10 ข้อ ภายในเวลา
25 นาที เปน็ ต้น (สุมาลี จันทรช์ ลอ, 2542)
การวัดและประเมินผลการเรียนรู้ 49
บทท่ี 4
คุณภาพของแบบทดสอบ
คณุ ลักษณะท่ีดขี องแบบทดสอบ
ในการสร้างแบบทดสอบนั้น ครูผู้สร้างข้อสอบทุกคนควรจะได้รับการศึกษาและรู้จักลักษณะท่ีดีของ
แบบทดสอบ ทาให้สามารถตัดสินใจได้ว่า แบบทดสอบฉบับใดเป็นแบบทดสอบท่ีดีควรนามาใช้ ฉบับใดเป็น
แบบทดสอบที่ไม่ดี ซึ่งในการประเมินผลแบบทดสอบจะต้องประเมินโดยยึดลักษณะของแบบทดสอบทีด่ ีเป็น
สาคัญ แบบทดสอบที่ดีจะต้องประกอบด้วยลักษณะที่สาคัญ 11 ประการ คือ (ตาย เซี่ยงฉี, 2526 ; สิริพร
ทิพย์คง, 2545, น. 195 ; พชิ ติ ฤทธิจ์ รูญ, 2545, น. 135 – 161 ; ชวาล แพรตั กลุ , 2552, น. 81 - 90)
1. ความยาก (Difficulty)
2. อานาจจาแนก (Discrimination)
3. ความเชอื่ มน่ั หรอื ความเชือ่ ถอื ได้ (Reliability)
4. ความเท่ียงตรง (Validity)
5. ความเป็นปรนัย (Objectivity)
6. ความยตุ ิธรรม (Fairness)
7. สามารถนาไปใช้ได้ดี (Usability)
8. ถามลกึ (Searching)
9. จาเพาะเจาะจง (Definite)
10. ย่ัวยุ (Exemplary)
11. ประสทิ ธิภาพ (Efficiency)
1. ความยาก (Difficulty) ความยากเป็นคุณภาพของข้อสอบที่สะท้อนถึงความยากของข้อคาถาม
โดยพิจารณาจากสัดส่วนของนักศึกษาที่ตอบคาถามข้อนั้นได้ถูกต้อง ทั้งนี้ความยากที่เหมาะสมคือข้อสอบ ที่
นักเรียนทาถูกและทาผิดอยู่ในระดับเท่าๆ กัน น่ันคือ ถ้ามีนักเรียนเข้าสอบ 100 คน ก็ควรมีนักเรียนทาถูก
และทาผิดประมาณ 50 คน ถ้ามีนักเรียนทาถูกมากกว่าทาผิด แสดงว่าข้อสอบนั้นค่อนข้างง่ายขึ้นเรื่อย ๆ
จนถึงข้อคาถามท่ีทกุ คนทาถูกหมด ข้อสอบข้อน้ันจะง่ายมากเกนิ ไป ขณะเดยี วกันข้อสอบข้อใดที่มีนักเรียนที่
ถูกน้อยกว่านักเรียนท่ีผิด ข้อสอบนั้นก็จะยาก และจะยิ่งยากขึ้นเร่ือย ๆ จนถึงข้อคาถามท่ีทุกคนทาผิดหมด
แสดงว่าข้อคาถามดังกล่าวมีความยากมากเกินไป ข้อสอบท่ีดีจะต้องไม่ยากเกินไปและไม่ง่ายเกินไป ถ้าคิด
เป็นค่าดชั นคี วามยากก็ควรมคี า่ อยรู่ ะหวา่ ง 0.2 – 0.8 หรอื มนี กั เรยี นที่ทาขอ้ สอบนั้นถูกระหว่าง 20 – 80 %
2. อานาจจาแนก (Discrimination) เป็นคุณภาพของข้อสอบข้อหนึ่งท่ีสามารถจาแนกนักเรยี น
เก่งกับนักเรียนไม่เก่งออกจากกันได้ กล่าวคือ จานวนนักเรียนท่ีได้คะแนนสูง ต้องตอบข้อสอบข้อนั้นถูก
มากกว่าจานวนนักเรียนทไ่ี ด้คะแนนต่า ในกรณีที่จานวนนักเรียนเก่งกับไม่เก่งตอบข้อสอบขอ้ นั้นถูกพอๆ กัน
แสดงว่าขอ้ สอบข้อนั้นมีค่าอานาจจาแนกต่าหรอื ไม่มีเลย คือไม่สามารถแยกแยะนกั เรียนเก่งกับนักเรียนไมเ่ ก่ง
ออกจากกันได้ แล้วถ้าจานวนนักเรียนเกง่ กลับตอบข้อสอบนั้นถูกน้อยกว่านกั เรียนไมเ่ กง่ แสดงว่าขอ้ สอบข้อ
น้นั จาแนกผดิ ฉะน้นั ข้อสอบที่ดี ตอ้ งมีจานวนนักเรียนเก่งตอบถูกมากกว่าจานวนนักเรียนไม่เก่ง
50 การวดั กแาลระวปัดรแะลเมะปินผรละเกมานิรเผรลยี กนารู้รเรยี นรู้ 50
3. ความเช่อื ม่นั (Reliability) เปน็ คุณภาพของข้อสอบทั้งฉบับเม่ือใช้สอบแล้วผลท่ไี ด้เหมือนกันทุก
คร้ัง หรอื “สอบนกั เรียนกลุ่มเดมิ กค่ี รง้ั ๆ ดว้ ยข้อสอบชุดเดมิ ก็ได้คะแนนเท่าเดมิ ” หากได้ผลคล้ายๆ กนั มากก็
มีความเชื่อม่ันสูง หากผลท่ีได้ต่างกัน ก็มีความเช่ือม่ันต่า ข้อสอบที่ดีใช้สอบกี่คร้ังๆ ก็ต้องได้ผลเหมือนกัน
หรือใกล้เคยี งกันเสมอ
4. ความเท่ียงตรง (Validity) เป็นคุณภาพของข้อสอบท่ีวัดได้ตรงประเด็นท่ีต้องการวัด โดยวัดได้
ตรงกับเนื้อหาท่ีได้เรียน ตรงกับพฤติกรรมท่ีต้องการวัด เช่น เรียนวิธีการบวกเลข 2 หลัก ก็ต้องสอบเกี่ยวกับ
การบวกเลข 2 หลัก ถ้าให้นักเรียนบวกเลข 3 หลัก ก็ถือว่าไม่ตรง หรือถ้าต้องการวัดความรู้เก่ียวกับปัญหา
สังคม แต่ออกข้อสอบเป็นภาษาอังกฤษเก่ียวกับปัญหาสังคม ให้นักเรียนท่ีไม่ค่อยเข้าใจภาษาอังกฤษตอบ
ข้อสอบที่ใช้ก็วัดไม่ตรงประเด็นท่ีต้องการจะรู้ว่านักเรียนรู้เกี่ยวกับปัญหาสังคมหรือไม่ แต่กลับไปวัดว่า
นักเรียนเข้าใจภาษาอังกฤษหรือไม่มากกว่า เพราะนักเรียนอาจจะมีความรู้เกี่ยวกับสังคมดี แต่อ่านคาส่ังไม่รู้
เรื่อง ไม่รู้ว่าข้อสอบต้องการให้ตอบอะไร เป็นต้น ฉะนั้นข้อสอบที่ดีจะต้องเป็นข้อสอบท่ีวัดได้ประเด็นท่ี
ตอ้ งการวดั
5. ความเป็นปรนัย (Objectivity) ข้อสอบท่ีดีต้องมีความเป็นปรนัยสูง ซ่ึงจะต้องมีคุณสมบัติ 3
อยา่ ง คือ
5.1 ผู้สอบอ่านโจทย์แล้วตอ้ งเข้าใจคาถามตรงกนั
5.2 การตรวจกระดาษคาตอบนัน้ ไม่วา่ จะใหใ้ ครตรวจก็ตอ้ งใหค้ ะแนนเท่ากนั ทุกคน
5.3 ตอ้ งสามารถนาคะแนนมาแปลความหมายเป็นแบบเดียวกนั
ข้อสอบใดกต็ ามถา้ มีคุณสมบตั คิ รบ 3 ประการน้ี จงึ จะเรยี กวา่ ขอ้ สอบนน้ั มีความเปน็ ปรนยั
6. มคี วามยตุ ธิ รรม (Fairness) แบบทดสอบทีม่ คี วามยุตธิ รรม ไม่ลาเอยี ง หมายถงึ แบบทดสอบที่ให้
ความเสมอภาคแก่ผู้เข้าสอบทุกคน ไม่เปิดโอกาสให้คนเก่งเก็งข้อสอบได้ หรือเด็กอ่อนเดาได้ ไม่ลาเอียง
สาหรับเด็กกลุม่ หน่ึงกลุ่มใดโดยเฉพาะ ดังน้ัน ข้อสอบทีย่ ุติธรรมจะต้องจะต้องออกวัดให้ครอบคลุมหลักสูตร
โดยออกมากๆ ข้อ และสอบหลายๆ ครง้ั จงึ จะดี ตอ้ งถามใหล้ ะเอยี ดทกุ แง่ทกุ มมุ
7. สามารถนาไปใชไ้ ดด้ ี (Usability) ขอ้ สอบท่ีดีตอ้ งสามารถไปใช้ไดด้ ี คอื
7.1 ดาเนินการสอบได้ง่าย คือสามารถนาไปใช้สอบได้สะดวกไม่ยุ่งยากซับซ้อน ไม่ก่อให้เกิด
ปัญหาที่จะทาให้ไม่เขา้ ใจในกระบวนการสอบ ท้ังผู้ดาเนินการสอบ และนักเรียนทถี่ ูกทดสอบ
7.2 ใช้เวลาทดสอบพอดี คอื ไม่สัน้ หรือยาวนานจนเกนิ ไปถ้าใช้เวลานานเกนิ ไป จะทาให้นกั เรยี น
ที่ถูกทดสอบเหน่อื ยออ่ นและเบื่อหน่าย ขาดการจงู ใจใหต้ อบ พฤติกรรมที่แทจ้ รงิ จึงไม่แสดงออก แตถ่ ้าใชเ้ วลา
น้อยเกินไป ไม่เหมาะสมกับเนื้อหา นักเรียนที่สอบจะมีความเครียด และวิตกกังวลมากเกินไป มีผลต่อการ
แสดงพฤตกิ รรมท่แี ทจ้ ริงด้วย
7.3 ให้คะแนนได้ง่าย หมายถึง สามารถตรวจให้คะแนนได้สะดวกรวดเร็วและมีความยุติธรรม
มาก
7.4 แปลผลได้ถูกต้องและนาไปใช้ได้สะดวกเมื่อทาการจัดสอบ ตรวจให้คะแนนแล้วสามารถ
แปลความหมายได้อยา่ งถกู ตอ้ ง และสามารถนาผลการประเมนิ ไปใช้ได้อยา่ งมปี ระสทิ ธิภาพ
การวัดและประเมนิ ผลการเรยี นรู้ 5151
การวดั และประเมินผลการเรียนรู้
8. ถามลึก (Searching) เป็นลักษณะของข้อสอบที่ถามครอบคลุมพฤติกรรมหลายๆ ด้าน เช่น
เปน็ ขอ้ สอบที่ถามวัดความเข้าใจ การนาไปใช้ การวเิ คราะห์ การสงั เคราะห์ และการประเมินค่า ขอ้ คาถามท่ีดี
จะต้องถามให้ผู้สอบได้ใช้ความคิด ไม่ใช่ถามความรู้ ความจาในรายละเอียดตามตารา การถามให้ลึกจะต้อง
ถามตัง้ แต่ระดับความเขา้ ใจขึน้ ไป
9. จาเพาะเจาะจง (Definite) ขอ้ สอบที่ดตี ้องไม่ถามหลายแง่หลายมุม ข้อเดยี วต้องถามเพียงอยา่ ง
เดียว และคาถามท่ีใช้ต้องชัดเจน ไม่คลุมเครือจนเด็กแต่ละคนเข้าใจคาถามไปคนละทิศละทาง คาถาม
ประเภทวกวน สองแงส่ องมมุ ควรหลกี เล่ียงเปน็ อยา่ งย่ิง
10. ย่ัวยุ (Exemplary) เป็นลักษณะของข้อคาถามท่ีมีลักษณะท้าทายชวนให้เด็กคิดข้อสอบท่ีมี
ลักษณะเช่นนี้จะต้องมีการถามล่อ โดยเอาข้อสอบง่ายๆ ไว้ในตอนแรกๆ แล้วจึงค่อยๆ ถามให้ยากขึ้น
ตามลาดับ ข้อสอบลักษณะดังกล่าวนี้จะเป็นการเร้าให้เด็กเกิดความพยายามท่ีจะทาข้อสอบให้ได้ทั้งหมด
ข้อสอบท่ยี ากเกนิ ไปและงา่ ยเกินไป จะไม่ท้าทายความคดิ ของเดก็ นอกจากนีล้ ักษณะคาถาม ควรเปน็ เรือ่ งที่
ใกลต้ ัวเดก็ พาดพิงกบั ชวี ิตประจาวันของเดก็ และยงั อาจใช้รูปภาพประกอบ ซึ่งจะช่วยเร้าความสนใจของเด็ก
ไดเ้ ป็นอย่างดี
11. ประสิทธิภาพ (Efficiency) แบบทดสอบท่ีมีประสิทธิภาพ คือแบบทดสอบท่ีแสดงถึงการ
ประหยัดทางเศรษฐกิจ เชน่ ใชเ้ วลา แรงงาน และเงินน้อยท่สี ดุ แต่สามารถวดั ได้ถกู ตอ้ งมากที่สดุ
การวิเคราะห์ข้อสอบ
การวิเคราะห์ข้อสอบเป็นการตรวจสอบข้อคาถามแต่ละข้อว่ามีคุณภาพเหมาะสมตามเกณฑ์ของข้อสอบ
หรือไม่ โดยทั่วไปเราวิเคราะห์ข้อสอบเพื่อทราบคุณภาพของข้อคาถาม 2 ประการ คือ (ศิริชัย กาญจนวาสี,
2556, น. 221)
1. ขอ้ สอบ (หรือตวั เลือกน้นั ) มีระดบั ความยาก (p) เท่าใด
2. ข้อสอบขอ้ นัน้ มีอานาจจาแนก (r) เท่าใด
การวิเคราะห์ข้อสอบจะกระทาได้ก็ต่อเมื่อการเอาข้อสอบนั้นไปทดสอบกับนักเรียนมาแล้วเท่านั้น
ทัง้ นีเ้ นือ่ งจากจะต้องใช้ผลจากการทนี่ ักเรียนตอบข้อสอบมาเปน็ ขอ้ มลู ในการวเิ คราะห์ขอ้ สอบนัน้ เอง
วัตถปุ ระสงค์ของการวิเคราะหข์ อ้ สอบ
จุดประสงค์ที่สาคัญของการวิเคราะห์ข้อสอบ ก็เพ่ือช่วยให้ผู้สร้างข้อสอบเลือกข้อสอบที่ดีที่สุดจาก
ข้อสอบที่มีอยู่ และเพื่อช่วยในการปรับปรุงข้อสอบท่ีมีคุณภาพไม่ค่อยดีให้เป็นข้อสอบท่ีดีข้ึน การวิเคราะห์
ข้อสอบจะเป็นการจัดหาข้อมูลเพ่ือจุดประสงค์ ดังต่อไปนี้ (โกวิท ประวาลพฤกษ์ และสมศักด์ิ สินธุระเวชญ์,
2527, น. 263 ; ศริ ชิ ัย กาญจนวาสี, 2556, น. 221 - 222)
1. เพ่อื ตรวจสอบดูว่าข้อสอบใดบา้ งที่เปน็ ขอ้ สอบทีไ่ ม่ดี หรือเปน็ ขอ้ สอบที่มจี ุดบกพรอ่ ง
2. เพื่อพิจารณาหาความยากง่ายของข้อคาถาม ซึ่งขอ้ มลู น้จี ะชว่ ยใหส้ รา้ งขอ้ สอบสามารถเลือก
ข้อสอบท่ีมคี า่ ความยากเหมาะสมกบั จุดประสงคข์ องการทดสอบ
3. เพ่ือพจิ ารณาคา่ อานาจจาแนกของขอ้ สอบแตล่ ะขอ้
4. เพอื่ พิจารณาความสมั พนั ธ์ระหวา่ งขอ้ สอบแต่ละขอ้ กบั คะแนนรวม
5. เพอื่ จัดหาข้อมูลทีเ่ ป็นประโยชน์ตอ่ การแปลความหมายหรือการอภิปรายที่เกี่ยวกับการทดสอบ
52 การวดั กแาลระวปดั รแะลเมะปินผรละเกมานิรเผรลยี กนารู้รเรยี นรู้ 52
ประโยชน์ของการวิเคราะหข์ ้อสอบ
ประโยชน์สาคัญที่น่าจะได้รับจากการวิเคราะห์ข้อสอบ มีดังนี้ (ชวาล แพรัตกุล, 2552, น. 201 -
202 ; ศริ ชิ ัย กาญจนวาสี, 2556, น. 222)
1. ทาให้รู้ว่าข้อสอบแต่ละข้อมีคุณภาพอย่างไร ซึ่งจะช่วยให้คุณสามารถปรับปรุงข้อสอบได้ตรงจุด
ผลจากการวเิ คราะห์ข้อสอบจะบ่งบอกว่า ขอ้ สอบขอ้ น้นั มีจุดออ่ นที่ตรงไหน
2. ชว่ ยเปน็ แนวทางให้ครเู ขียนขอ้ สอบเกง่ ข้ึน การวิเคราะห์ข้อสอบจะแสดงใหเ้ หน็ ว่า องคป์ ระกอบ
ของข้อสอบส่วนไหนจะเป็นตัวทาให้ข้อสอบมีคุณภาพดีหรือด้อย ตัวเลขใดที่ได้จากการวิเคราะห์ข้อสอบจะ
ชว่ ยให้ครูระมัดระวังเรือ่ งภาษาทใี่ ช้ในการเขยี นตัวเลือกทั้งทเี่ ปน็ ตวั ถกู และตวั รวม
3. ชว่ ยประหยัดเวลา และแรงงานในการออกข้อสอบในระยะยาว เพราะครูสามารถเก็บข้อสอบที่
ดีๆ ไวใ้ ช้ในโอกาสตอ่ ไป
4. เป็นจุดเริ่มตน้ ของการสร้างข้อสอบคขู่ นาน (Parallel Test)
5. เป็นจุดเร่มิ ต้นของการสรา้ งธนาคารข้อสอบ (Item Bank)
6. เป็นจุดเริ่มต้นของการสร้างข้อสอบมาตรฐาน เพื่อใช้ในกลุ่มโรงเรียนที่ใกล้เคียงกัน หรอื อาจจะ
ปรบั ปรุงเป็นขอ้ สอบมาตรฐานระดับท้องถ่ิน หรือระดบั ชาตไิ ด้
การวเิ คราะห์ขอ้ สอบหาคา่ ความยากและอานาจจาแนก
ก. การวเิ คราะหข์ ้อสอบรายขอ้ ของขอ้ สอบแบบองิ กลมุ่
ขอ้ สอบแบบอิงกลมุ่ สามารถวิเคราะหร์ ายขอ้ ได้ ดงั นี้
1. ตรวจกระดาษคาตอบแลว้ รวมคะแนนจาแนกเปน็ รายบคุ คล
2. เรยี งกระดาษคาตอบตามลาดบั คะแนนจากมากไปน้อย คะแนนที่ซา้ กนั เอาไวด้ ว้ ยกัน
3. แบ่งกระดาษคาตอบออกเป็น 2 กลุ่มเท่าๆ กัน กลุ่มที่ได้คะแนนรวมมากให้ช่ือกลุ่มว่า กลุ่มสูง
(High : H) สว่ นกลุ่มท่ีไดค้ ะแนนนอ้ ยให้ชอื่ วา่ กลุ่มต่า (Low : L) โดยมีแนวทางในการแบง่ กระดาษคาตอบอยู่
วา่ ถ้าจานวนกระดาษคาตอบมนี ้อยใหแ้ บ่งกลุ่มสงู -กลุ่มต่า กลมุ่ ละ 50 % ถ้าจานวนกระดาษคาตอบมมี าก
ให้แบง่ กลุ่มสงู -กล่มุ ต่า กล่มุ ละ 27 % สว่ นทเ่ี หลืออกี 46 % ไมต่ ้องนามาวิเคราะห์
4. นบั จานวนนกั เรียนท่ตี อบถกู ของแตล่ ะขอ้ ของกลุม่ สูงและกลมุ่ ตา่ เขียนบนั ทกึ แยกกนั ดังตาราง
ขอ้ ที่ ก ข กลุ่มสูง (H) วา่ ง รวม กลุ่มต่า (L)
คงจ 0 20 ก ข ค ง จ วา่ ง รวม
1 0 0 (20) 0 0 4 2 (8) 3 3 0 20
2
3
.
.
หมายเหตุ ( ) คือ คาตอบถกู
การกวาัดรวแัดลแะลปะรปะรเะมเนิมผินลผกลการารเรเรียียนนรรู้ ู้ 5353
5. รวมจานวนที่ตอบถูกของแต่ละข้อของกลุ่มสูงและกลุ่มต่า หารด้วยจานวนกระดาษคาตอบของ
กลมุ่ สูงและกลุม่ ตา่ รวมกัน ค่าที่ได้จะเป็นดรรชนคี วามยากของขอ้ สอบ (Index of Item Difficulty) ขอ้ นน้ั
6. เอาจานวนนักเรียนที่ตอบถูกในกลุ่มสูงลบด้วยจานวนนักเรียนท่ีตอบถูกในกลุ่มต่า และหารด้วย
จานวนกระดาษคาตอบในกลุ่มสูงหรือต่า ค่าท่ีได้เป็นอานาจการจาแนก (Discrimination Power) ของ
ขอ้ สอบน้นั ซ่ึงเขยี นเป็นสตู รคานวณคา่ ดรรชนีความยาก (p) และอานาจจาแนก (r) ไดด้ ังนี้
HL
p = 2n
r = HL
n
เมือ่ H = จานวนนกั เรียนท่ีตอบถกู ในกลมุ่ สูง
L = จานวนนักเรียนทต่ี อบถูกในกลุ่มตา่
n = จานวนนกั เรยี นในกลมุ่ สูง หรือกลุม่ ต่า
ตวั อยา่ ง ข้อสอบความรู้ทั่วไปชดุ หนึ่ง นาไปทดสอบกบั นักเรียนจานวน 85 คน เม่ือตรวจใหค้ ะแนน
และนามาเรียงคะแนนจากมากไปหาน้อยแล้วแบ่งเป็น 2 กลุ่ม กลุ่มสูง 27% และกลุ่มต่า 27% ได้กลุ่มละ
23 คน จากนน้ั หาจานวนนักเรยี นทีต่ อบถกู ในแตล่ ะขอ้ ทั้ง 2 กลมุ่ แลว้ นามาวิเคราะห์คุณภาพไดด้ งั นี้
ขอ้ H L H+L H-L p r
13 4 7 -1 0.15 -0.04
2 17 11 28 6 0.61 0.26
3 15 9 24 6 0.52 0.26
4 12 9 21 3 0.46 0.13
5 13 6 19 7 0.41 0.30
6 20 9 29 11 0.63 0.48
7 23 20 43 3 0.93 0.13
8 15 13 28 2 0.61 0.09
9 11 10 21 1 0.46 0.04
เช่น ข้อ 1 จะหาค่า p และ r ไดโ้ ดยแทนคา่ H และ L ลงในสตู รจะได้
34
p= 2 23 = 0.15
r= 34 = -0.04
23
การวิเคราะห์ข้อสอบรายข้อโดยแบ่งข้อสอบเป็นกลุ่มสูงและกลุ่มต่าน้ีสามารถหาค่าดัชนีความยาก
และอานาจจาแนกได้โดยวิธีของ จุง เต ฟาน (Chung The Fan) กล่าวคือ หลังจากจานวนนักเรียนท่ีตอบถูก
ของแต่ละข้อในกลุ่มแล้ว นาแต่ละกลุ่มมาหาสัดส่วนด้วยการเอาจานวนคนที่ตอบถูกหารด้วยจานวนคน
ท้ังหมดของแต่ละกลุ่มจากนั้นนาไปเปิดหาค่า p และ r จากตารางวิเคราะห์ข้อสอบรายข้อสาเร็จรูปของ จุง
เต ฟาน (Chung The Fan Table)
54 การวดั กแาลระวปัดรแะลเมะปินผรละเกมานิรเผรลียกนารู้รเรียนรู้ 54
ก็จะได้ค่าตามต้องการ ผู้สนใจจะหาด้วยวิธีการน้ีต้องหาตารางสาเร็จรูปดังกล่าว ซ่ึงอธิบายวิธีการหาไว้
ชัดเจนแล้วและมขี ายอยู่ในท้องตลาดท่วั ไป
ลักษณะความยากของข้อสอบแตล่ ะข้อ
1. ค่า p (ระดบั ความยาก) มีคา่ ตง้ั แต่ .00 ถงึ 1.00
2. ถา้ นักเรยี นเลอื กตอบตัวเลอื กใดมาก แสดงว่าข้อสอบหรอื ตวั เลือกนัน้ งา่ ย ค่าของ p จะสงู
3. ถา้ นักเรยี นเลือกตอบตัวเลือกใดนอ้ ย แสดงว่าขอ้ สอบหรอื ตวั เลือกน้ันยาก คา่ ของ p จะต่า
4. ถ้านักเรียนทาขอ้ สอบข้อใดถกู 100% (ไม่ผิดเลย) แสดงวา่ ข้อสอบน้ันงา่ ยมาก (p = 1.00)
5. ถ้าข้อสอบใดไมม่ คี นตอบถกู เลย หมายความว่าข้อสอบนนั้ ยากมาก (p = .00)
6. ขอ้ สอบท่ีมคี ่า p = .50 ถือว่าข้อสอบนนั้ ยากพอเหมาะ หมายความวา่ เป็นข้อสอบทม่ี ีคนทาถูก
50% หรือคร่ึงหน่ึงของผู้เข้าสอบตอบถูก อย่างไรก็ดี ถ้าข้อสอบข้อ 1 และข้อ 5 ต่างก็มีค่า p เท่ากับ .50
ไม่ได้หมายความว่าผู้ท่ีตอบข้อ 1 ถูกจะต้องตอบข้อ 5 ถูกด้วย ผู้ท่ีตอบข้อ 5 ถูก อาจจะเป็นนักเรียนคนอื่น
แต่จะมจี านวนเท่ากบั คร่งึ หนึง่ ของผูส้ อบเชน่ กนั
7. การแปลความหมาย ระดับความยากของข้อสอบ
p .81 - 1.00 เป็นข้อสอบท่ีง่ายมาก
p .61 - .80 เป็นขอ้ สอบท่ีคอ่ นข้างงา่ ย
p .41 - .60 เปน็ ข้อสอบที่ยากง่ายพอเหมาะ
p .21 - .40 เป็นขอ้ สอบที่ค่อนขา้ งยาก
p .00 - .20 เปน็ ขอ้ สอบท่ียากมาก
ลกั ษณะคา่ อานาจจาแนกของข้อสอบแต่ละข้อ
1. คา่ อานาจจาแนก หรือค่า r มีตั้งแต่ -1.00 ถงึ + 1.00
2. ข้อสอบข้อใดที่นักเรียนกลุ่มเก่งทาถูกหมดทุกคน และนักเรียนกลุ่มอ่อนทาผิดหมดทุกคน ค่า r
จะมีค่า เทา่ กับ 1.00 จดั เป็นขอ้ สอบท่ีดีเยีย่ มเปน็ ทีต่ อ้ งการย่ิง
3. ข้อสอบข้อใดท่ีนักเรยี นกลุ่มเก่งทาผิดหมด แต่นกั เรยี นกลุ่มอ่อนทาถกู หมด r จะมีค่าเทา่ กับ -1.00
แสดงว่าข้อสอบขอ้ นีเ้ ปน็ ขอ้ สอบท่ไี ม่ดี เพราะเปน็ ขอ้ สอบท่ลี วงเด็กเก่ง ซ่ึงผดิ จดุ ประสงค์ เพราะในการทดสอบ
นนั้ ผู้ออกขอ้ สอบหวงั ว่านักเรยี นทเี่ ก่งจะตอ้ งทาข้อสอบได้ แตน่ กั เรียนอ่อนจะทาขอ้ สอบไม่ได้
4. ข้อสอบข้อใดมีนักเรียนกลุ่มเก่งและจานวนนักเรยี นกลมุ่ ออ่ นทาถูกเทา่ ๆ กัน ข้อสอบข้อนั้นจะมีค่า
r = .00 แสดงว่าข้อสอบน้ีเป็นข้อสอบท่ีไม่สามารถแยกนักเรียนเก่งออกจากนักเรียนอ่อนได้ น่ันคือ เราไม่
สามารถจะบอกไดว้ ่าคนทที่ าข้อสอบนถี้ ูกเป็นคนเกง่ และมีความรเู้ ร่อื งทถี่ ามจรงิ ๆ หรือตอบถกู เพราะการเดา
กากราวรดั วแดั ลแะลปะรปะรเะมเมินินผผลลกกาารรเรเรยี ยี นนรรู้ ู้ 5555
5. เกณฑ์ท่ีใช้พิจารณาค่าอานาจจาแนกของข้อสอบแบบนี้
r .40 ขึ้นไป ขอ้ สอบจาแนกดมี าก
r .30 ถงึ .39 ขอ้ สอบจาแนกดี
r .20 ถึง .29 ขอ้ สอบจาแนกพอใช้
r ต่ากว่า .20 ขอ้ สอบจาแนกไมไ่ ด้
r ตดิ ลบ ข้อสอบจาแนกผิด
การวเิ คราะหต์ วั ลวง
ลกั ษณะของตวั ลวงทด่ี จี ะตอ้ งลวงเด็กอ่อนมากกว่าเดก็ เก่ง น่ันคือกลมุ่ ต่า (L) ต้องเลอื กตอบตวั ลวง
มากกวา่ กลุ่มสูง ซ่ึงตรงกนั ข้ามกับตวั ถกู
HL
สาหรับสูตรการหาค่า p ของตัวลวง ใช้สูตรเดียวกับการหาค่า p ของตัวถูก คือ p= 2n
ส่วนสตู รการหาคา่ r ของตัวลวงใชส้ ตู ร ดังน้ี r = LH
n
การแปลความหมายตัวลวง
1. ค่า p จะเป็นตัวบ่งบอกให้ทราบว่า มีนักเรียนเลือกตอบตัวลวงเป็นสัดส่วนเท่าใด ถ้าค่า p ต่า
มาก แสดงวา่ ตัวลวงนน้ั ไมค่ ่อยมใี ครเลอื ก เหน็ สมควรจะต้องปรบั ปรงุ เพราะไม่เกิดประโยชนใ์ ดๆ ทีจ่ ะเขียน
ไว้เฉยๆ โดยไม่มีใครเลือกตอบ
2. ค่า r มีหลกั ในการพจิ ารณา ดังน้ี
- ถา้ คา่ r ตดิ ลบ แสดงวา่ ตัวลวงนั้นไมด่ ีตอ้ งแก้ไข
- ถ้าค่า r เป็นศูนย์ แสดงว่า ตวั ลวงน้นั ไมด่ ีต้องแก้ไข
- ถา้ คา่ r เปน็ บวก แสดงวา่ ตวั ลวงนน้ั เป็นตัวลวงทด่ี ี
การคดั เลือกข้อสอบ
ตามที่กล่าวแล้วว่าข้อสอบท่ีมีคุณภาพดี จะต้องมีดรรชนีความยากระหว่าง 0.2 ถึง 0.8 และมีค่า
อานาจการจาแนกตั้งแต่ 0.2 ข้ึนไป ฉะนั้นเม่ือนาค่าดรรชนีความยากและอานาจการจาแนกของข้อสอบแต่
ละขอ้ ทีว่ ิเคราะหไ์ ด้ไปสร้างเปน็ กราฟ กแ็ สดงใหเ้ หน็ คณุ ภาพของข้อสอบแต่ละข้อชดั เจนขึ้น ดังนี้
56 การวดั กแาลระวปดั รแะลเมะนิปผรละกเมานิรเผรลียนการู้รเรียนรู้ 56
P
1.0
0.8
0.6
คุณภาพขอ้ สอบดี
0.4
0.2
-1.00 - 2 -1 0 .1 .2 .3 .5 .6 .7 .8 .9 1.00
ข้อใดก็ตามที่มีดัชนีความยาก (p) และอานาจการจาแนก (r) อยู่ในกรอบสี่เหล่ียมข้างในภาพ ก็จะ
เปน็ ขอ้ สอบทีด่ ี
ข. การวเิ คราะห์ขอ้ สอบรายข้อของขอ้ สอบอิงเกณฑ์
ข้อสอบองิ เกณฑ์น้นั สร้างข้ึนเพอ่ื ต้องการวัดว่านักเรียนมีความสามารถทจี่ ะปฏบิ ัตอิ ะไรได้บ้าง หรอื มี
ความรู้ความสามารถอะไรบ้าง ฉะน้ันดัชนีความยากและอานาจการจาแนกของข้อสอบ จึงแทบจะไม่มี
ความสาคญั เลยกับการวิเคราะห์ขอ้ สอบอิงเกณฑ์ ข้อสอบอิงเกณฑ์จะยากหรือง่ายข้ึนอยู่กบั พฤตกิ รรมท่จี ัดให้
เรยี นรู้ และที่ต้องการใหว้ ัด ถ้าพฤติกรรมยากข้อสอบก็ยาก ถ้าพฤติกรรมงา่ ยข้อสอบกง็ า่ ย ในขณะเดียวกัน
เม่ือวัดออกมาแล้ว ก็ไม่ต้องการเปรียบเทียบกันภายในกลุ่มว่าใครจะมีความรู้ความสามารถมากกว่ากัน
หรือไม่ต้องการอยากรู้ว่าใครเก่ง ใครไม่เก่งข้อสอบอิงเกณฑ์ต้องการทราบเพียงรู้อะไร ไม่รู้อะไร เท่าน้ัน
การวิเคราะห์ข้อสอบอิงเกณฑ์ จึงวิเคราะห์หาประสิทธิภาพของข้อสอบรายข้อด้วยการวัดผลของการสอน
เรียกว่า ดัชนีประสิทธิภาพของข้อสอบรายข้อ และหาได้ด้วยความไวของข้อสอบที่มีต่อผลการสอน
(Sensitivity to Instructional Effects) ดงั นี้ (Cox and Vargas, 1966)
S= RA RB
เมื่อ S = T
RA = ความไวของข้อสอบที่มีต่อผลของวิธกี ารสอน
RB = จานวนนักเรยี นท่ีตอบถูกหลงั การสอน
T= จานวนนักเรียนทตี่ อบถูกกอ่ นการสอน
จานวนนักเรียนทงั้ หมด
การกวาดัรแวัดลแะลปะรปะรเะมเนิ มผนิ ลผกลากราเรรเยีรียนนรรู้ ู้ 5757
ตัวอย่าง สมมติว่าต้องการหาค่าประสิทธิภาพของการสอนวธิ ีกลุ่มสัมพันธ์ โดยการวัดด้วยข้อสอบ
อิงเกณฑ์ชุดหนึ่ง 5 ข้อ นักเรียนที่จะทดลองมี 10 คน ก่อนทดลองทา Pretest ด้วยข้อสอบ 5 ข้อ แล้วเร่ิม
ทดลองเป็นเวลา 1 เดือน จบแล้วทา Posttest ด้วยข้อสอบชุดเดิม การทดลองปรากฏการตอบของนักเรียน
ทงั้ 10 คน เป็นดังตาราง
ตาราง ผลการตอบของนักเรียนก่อนและหลงั การเรียนด้วยวธิ กี ลุม่ สมั พนั ธ์
ข้อ 1 2 3 A 4 5
คนท่ี B A B A B X BA BA
1 - - -XX X X- --
2 - - -XX X X- --
3 - - -XX X X- -X
4 - - -XX X X- -X
5 - - -XX X X- XX
6 - - -XX X X- XX
7 - - -XX X X- -X
8 - - -XX X X- --
9 - - -XX X X- -X
10 - - - X X X- -X
หมายเหตุ - หมายถงึ ตอบผิด (Incorrect)
X หมายถึง ตอบถกู (Correct )
ความไวของขอ้ สอบแตล่ ะขอ้ ทีม่ ีต่อผลของวิธกี ารสอนหาได้ ดงั นี้
00
S1 = 10 = 0.00
S2 = 10 0 = 1.00
10
10 10
S3 = 10 = 0.00
S4 = 0 10 = -1.00
10
72
S5 = 10 = 0.50
58 การวดั กแาลระวปดั รแะลเะมปินผระลเกมาินรเผรลียกนารรู้ เรียนรู้ 58
ผลการวเิ คราะหป์ ระสิทธิภาพของข้อสอบรายข้อปรากฏ ดงั น้ี
ข้อสอบข้อ 1 ยากเกนิ ไป ก่อนและหลงั สอนไม่มใี ครทาถูก แสดงวา่ การสอนไม่ดี
ขอ้ สอบข้อ 2 มปี ระสทิ ธภิ าพดที ้งั ขอ้ สอบและการสอนก่อนสอนตอบไมไ่ ด้ หลงั สอนทาได้ถกู หมด
ข้อสอบข้อ 3 ง่ายเกินไป กอ่ นสอนและหลังสอนทาไดถ้ ูกหมดทุกคน ใช้วัดประสิทธิภาพการสอนได้
ข้อสอบขอ้ 4 เป็นขอ้ ทีไ่ ม่ดีอย่างย่ิง กอ่ นสอนทาถกู หมด แตห่ ลงั สอนทาผิดหมด
ข้อสอบข้อ 5 เปน็ ขอ้ สอบท่ดี ี กอ่ นสอนมคี นทาถกู บา้ ง แต่หลงั สอนมีคนทาถกู เพม่ิ มากข้ึน ใชว้ ดั
ประสทิ ธิภาพการสอนได้
สรุปแล้วข้อสอบท่ีมีประสิทธิภาพดีจะต้องมี S ระหว่าง 0.05 – 1.00 ยิ่งมีค่าเป็นบวกมากก็ยังมี
ความไวที่จะวัดการสอนไดม้ ากกเทา่ น้ัน ส่วนข้อที่มี S เท่ากับ 0 และมีเคร่ืองหมายติดลบจะเป็นข้อสอบท่ไี ม่
มปี ระสทิ ธิภาพ
ขอ้ สงั เกตในการวิเคราะห์ขอ้ สอบรายขอ้
1. การออกข้อสอบเพื่อจะนามาวเิ คราะห์ ควรพยายามออกมากๆ ข้อ เพราะเม่อื วิเคราะห์แล้วบาง
ทกี ต็ ัดขอ้ ที่ใช้ไม่ไดอ้ อกไป ทาใหไ้ ม่ได้ขอ้ สอบครบตามจานวนทตี่ อ้ งการ
2. การวิเคราะหข์ อ้ สอบควรวเิ คราะหต์ ัวลวงดว้ ย
3. ขอ้ สอบท่ีผา่ นการวเิ คราะห์แล้ว ควรเปน็ ขอ้ สอบท่ีมคี ณุ ภาพตามหลกั การวดั ผลการศึกษา
4. พึงระลึกไว้เสมอว่า การวิเคราะห์ข้อสอบรายข้อนัน้ เปน็ การตรวจสอบคุณภาพของข้อสอบ 2 ประการ
คอื ระดบั ความยาก และอานาจการจาแนกเท่านน้ั
การสร้างธนาคารข้อสอบ (Item Bank)
เนื่องจากข้อสอบที่ดี และได้คุณภาพน้ันสร้างยาก ดังน้ันเม่ือวิเคราะห์ข้อสอบรายข้อและไดข้ ้อสอบ
ที่มคี ุณภาพแล้ว ก็ควรเกบ็ ขอ้ นัน้ ไวอ้ ยา่ งเป็นระบบ สามารถนามาใช้ปรบั ปรุงได้ การเก็บข้อมูลขอ้ สอบดังกล่าว
เรียกว่า การจัดสร้างธนาคารข้อสอบหรือคลังข้อสอบ (Item Bank) ฉะน้ัน ธนาคารข้อสอบหรือคลังข้อสอบ
กค็ ือ ที่เก็บรวบรวมข้อสอบที่ดีๆ ท่ีได้ผ่านการวิเคราะห์แล้ว และเลือกสรรวา่ เป็นข้อสอบที่ได้คุณภาพ พร้อม
ทง้ั มกี ารบนั ทึกประวัตขิ องข้อสอบไวด้ ้วย (ชวาล แพรตั กลุ , 2552, น. 229 - 233 ; ศริ ิชยั กาญจนวาสี, 2556,
น. 244 - 246)
วตั ถปุ ระสงค์ของการจดั ตงั้ ธนาคารขอ้ สอบ หรอื คลงั ขอ้ สอบ มดี ังน้ี
1. เพื่อเป็นศูนย์กลางรวบรวม และเพ่ิมพูนข้อสอบมาตรฐาน (Standardized Test) และขอ้ สอบที่
ดใี ห้มปี รมิ าณมากและคณุ ภาพดยี ิง่ ขึ้น
2. เพ่ือส่งเสรมิ การนาข้อสอบไปใช้ให้เกดิ ประโยชนใ์ นการเรียนการสอนให้มากทีส่ ุด และคมุ้ ค่าทีส่ ุด
3. เพอื่ สะดวกแก่การฝากการยืมข้อสอบไปใช้
4. เพ่ือเป็นศูนย์กลางส่งเสริมการนาเทคนิคใหม่ๆ ทางการวัดผลศึกษามาใช้และเผยแพร่วิทยาการ
ทางการวัดผลการศึกษา
5. เพ่อื ส่งเสริมการทดสอบให้มีประสทิ ธภิ าพ
การกวาดั รแวดัลแะลปะรปะรเมะเินมผนิ ลผกลากราเรรเยีรนยี นรู้รู้ 5959
กระบวนการในการสร้างธนาคารขอ้ สอบ
1. การทาบัตรข้อสอบรายข้อ (Item Card) โดยพิมพ์ตัวข้อสอบ คุณภาพของข้อสอบท่ีได้จาการ
วิเคราะห์ ความมุ่งหมายของการทาบัตรข้อสอบเพ่ือความสะดวกในการเก็บ การจัดประเภทและการแยก
คดั เลอื กข้อสอบ โดยทั่วไปบัตรขอ้ สอบรายข้อควรใชบ้ ตั รทีม่ ขี นาดกว้าง 4 - 6 นว้ิ ยาว 6 - 8 นวิ้
2. การแยกบัตรข้อสอบรายข้อไว้เป็นระบบ เช่น แยกวิชาตามสีของบัตร จัดเรียนตามลาดับ
เน้ือหาวิชา เป็นต้น
ตวั อย่างบัตรข้อสอบรายขอ้
ด้านหนา้
วิชา วิทยาศาสตร์ ชั้น ป. 3
พืชส่วนใหญ่ใชส้ ว่ นใดในการหายใจ
* ก. ใบ
ข. ราก
ค. ดอก
ง. ลาตน้
พฤติกรรม ความรู้-ความจา
ครัง้ ที่ ดา้ นหลัง 3 4 หมำยเหตุ
วนั ที่ 12 pr pr
ระดับช้นั 1 ก.ย. 2558
จำนวนนักเรียน ป. 3
วตั ถปุ ระสงค์ 45
ทดสอบยอ่ ย
ตัวเลือก p r pr
ก .50 .61
ข .20 -.21
ค .16 .60
ง .14 .20
60 การวัดกแาลระวปดั รแะลเมะปินผรละเกมาินรเผรลียกนารู้รเรียนรู้ 60
ประโยชน์ของธนาคารขอ้ สอบ
1. เป็นต้นกาเนิดของแบบทดสอบมาตรฐานของโรงเรียน หรือของเฉพาะท้องถิ่น (Local
Standardized Test) และอาจขยายใหเ้ ปน็ ระดับชาติ (National Standardized Test) ได้
2. ช่วยพัฒนาแนวคิดใหม่ๆ เกี่ยวกับการสร้าง การใช้ข้อสอบให้แก่ครู และช่วยให้ครูสามารถ
ปรับปรุงการออกขอ้ สอบใหม้ ีคณู ภาพยง่ิ ขึ้น
3. การเกบ็ รวบรวมข้อทดสอบที่ดๆี ได้คณุ ภาพของวชิ าใดวิชาหน่งึ ได้มากๆ ขอ้ จัดทาเป็นขอ้ สอบท่ีดี
ท้ังฉบบั สาหรับนาไปใชใ้ นการวดั ผลและประเมนิ ผลการเรยี นวิชานั้นๆ หรืออาจพัฒนาขอ้ สอบเปน็ ชุดๆ สกั 3
- 4 ชุด ซ่ึงเรียกว่า ข้อสอบคู่ขนาน (Parallel Test) ในการแยกข้อทดสอบเพ่ือสร้างแบบทดสอบคู่ขนานนั้น
ถอื หลักสาคญั ดงั น้ี
3.1 ขอ้ ทดสอบแต่ละชุดมีเน้ือหาของคาถามใกล้เคียงกัน
3.2 ขอ้ ทดสอบแต่ละชุดมจี ุดประสงคท์ ี่จะวดั อยา่ งเดยี วกนั
3.3 ขอ้ ทดสอบแต่ละชดุ มคี วามยากงา่ ย และอานาจจาแนกเทา่ ๆ กนั
แบบทดสอบหลายชุดมีลักษณะดังกล่าว เรียกว่า แบบทดสอบคู่ขนาน ซ่ึงจะต้องมีอย่างน้อย 2
ชุด และถือเปรยี บเสมอื นข้อทดสอบชดุ เดียวกัน จึงใชป้ ระโยชน์ในการแกไ้ ขปญั หาเก่ียวกบั การวัดผลการเรียน
บางประการไดเ้ ปน็ อยา่ งดี เช่น ปญั หาข้อสอบร่ัว เป็นตน้
ความเช่ือมน่ั (Reliability)
ความเช่ือม่ันของแบบทดสอบ เป็นความคงท่ีของคะแนนท่ีได้จากการให้นักเรียนกลุ่มเดียวกัน ทา
แบบทดสอบนั้นในเวลาที่ต่างกัน หรือทาแบบทดสอบท่ีมีลักษณะเหมือนกัน ตามความหมายน้ี แบบทดสอบ
ที่มีความเช่ือม่ันสูงจะใช้สอบกี่ครั้งๆ นักเรียนคนนั้นก็จะได้คะแนนคงเดิม ซ่ึงเป็นความม่ันคงแน่นอนของ
คะแนนท่ีสอบด้วยคะแนนน้ัน หรือความเช่ือม่ันของแบบทดสอบเกี่ยวข้องกับความคงเส้นคงวาของคะแนนที่
ได้จากแบบทดสอบเม่อื ทาการทดสอบดว้ ยแบบทดสอบฉบบั นนั้ หลายๆ ครง้ั
ชนิดของความเชอ่ื ม่ัน
ความเชือ่ มนั่ อาจแยกได้เป็น 3 ชนดิ คอื (วรรณี แกมเกต,ุ 2551, น. 231 - 232)
1. ความเชอื่ มน่ั เชิงคงตัว (Reliability of Stability)
2. ความเชื่อม่ันเทา่ เทียมกนั (Reliability of Equivalence)
3. ความเชอ่ื ม่นั เชิงความสอดคลอ้ งภายใน (Reliability of Internal Consistency)
ความเช่ือมั่นแต่ละชนิดมีวิธีการหาแตกต่างกัน รวมท้ังข้อจากัดท่ีแตกต่างกันด้วย ก่อนใช้จึงต้อง
พิจารณาถึงข้อจากัดต่างๆ ให้ดี
1. การหาความเชอื่ ม่นั เชงิ ความคงตวั
การหาความเช่ือม่ันเชิงความคงตัวนี้ มีช่ือท่ีรู้จักกันทั่วไปว่าเป็นวิธีการสอบซ้า (Test-retest
Method) วธิ ีนห้ี าไดโ้ ดยเอาข้อสอบท่สี ร้างขนึ้ ไปสอบ นกั เรียนกลมุ่ เดียวกันสองคร้งั ในเวลาที่แตกตา่ งกนั
การกวาดั รแวดัลแะลปะรปะรเมะเนิ มผินลผกลากราเรรเยีรนยี นรู้รู้ 6161
แล้วนาคะแนนของนักเรียนแต่ละคนท่ีได้ในการสอบสองคร้ังไปหาสัมประสิทธิ์สหสัมพันธ์ด้วยวิธี Pearson
Product Moment คา่ สมั ประสทิ ธิ์สหสมั พันธ์ท่ีได้เปน็ ค่าความเช่ือถือเชิงความคงตัว
ตัวอย่าง แบบทดสอบชุดหนง่ึ นาไปสอบวัดนักเรยี น 10 คน 2 ครัง้ สอบครั้งแรกและครง้ั หลงั หลัง
ห่างกัน 4 สัปดาห์ ผลการสอบได้ ดังนี้
คนที่ สอบครง้ั ท่ี 1 สอบครั้งที่ 2
18 9
27 7
36 7
46 6
55 6
66 6
75 4
85 5
94 5
10 4 6
วธิ คี านวณ นาผลการสอบคร้ังแรกและครั้งทสี่ องทาเป็นตาราง
คนที่ ครง้ั ท่ี 1 (X) คร้ังที่ 2 (Y) X2 Y2 XY
18 9 64 81 72
27 7 49 49 49
36 7 36 49 42
46 6 36 36 36
55 6 25 36 30
66 6 36 36 36
75 4 25 16 20
85 5 25 25 25
94 5 16 25 20
10 4 6 16 36 24
ผลรวม 56 61 328 389 354
จากตาราง n = 10 XY = 354
X = 56 X2 = 328
Y = 61 Y2 = 389
62 การวดั กแาลระวปดั รแะลเมะปินผระลเกมานิรเผรลยี กนารรู้ เรียนรู้ 62
หาคา่ สมั ประสิทธส์ิ หสมั พนั ธ์ดว้ ยสตู ร Pearson Product Moment (Pearson, 1985)
nxy x y
rxy = {nx2 (x)2}{ny2 (y)2}
10 354 56 61
แทนคา่ ในสูตร = {10328 (56)2}{10389 (61)2}
3540 3416
= {3280 3136}{3890 3721}
ดงั นน้ั ความเชอ่ื มนั่ ของแบบทดสอบฉบบั น้มี คี ่าเทา่ กับ 0.794
2. การหาความเชือ่ ม่ันเท่าเทียมกนั
การหาความเชื่อมั่นเท่าเทียมกันเป็นการหาค่าสัมประสิทธ์ิของความคล้ายกัน วิธีการคานวณหาค่า
โดยใช้นักเรียนกลุ่มเดียวกัน สอบข้อสอบสองชุดในเวลาไล่เล่ยี กัน ข้อสอบท้ังสองชุดจะมีลักษณะเหมือนกัน
(Equivalent form) วัดสิ่งเดียวกันมีความยากง่ายพอๆ กัน จานวนข้อเท่ากัน เป็นต้น เม่ือได้คะแนนจาก
การสอบแล้ว ก็นามาคานวณหาค่าสัมประสิทธ์ิสหสัมพันธ์แบบ Pearson Product Moment เช่นเดียวกับ
วิธีการสอบซา้ ดังกล่าวแล้ว คา่ ทไ่ี ดก้ จ็ ะเป็นค่าความเชอ่ื ม่นั เท่าเทียมกันของขอ้ สอบชุดน้ัน
วธิ ีนีค้ วรคานงึ ถงึ คอื เวลาทใ่ี ชส้ อบระหว่างข้อสอบท้ังสองชุด ถา้ ห่างกนั มากจะทาให้คา่ ความเชอ่ื ม่ัน
ต่าและอีกประการหนง่ึ คือ การสร้างขอ้ สอบให้มลี กั ษณะเหมอื นกันนนั้ ทาได้ยาก
3. การหาความเช่อื มัน่ เชงิ ความคงที่ภายใน
การหาความเชื่อม่ันเชงิ ความคงทภ่ี ายในมีวิธกี ารหา ดงั นี้
3.1 แบบแบ่งคร่ึงขอ้ สอบ (Split–half Method) เน่อื งจากมีปญั หาในการหาความเช่ือมั่นเชิง
ความคงตัวกับความเชื่อม่ันคล้ายกัน เพราะยุ่งยากในเรื่องระยะเวลาห่างของการสอบคร้ังแรกกับครั้งหลัง
และการสร้างข้อสอบสองชุดให้มีลักษณะคล้ายกัน จึงแก้ปัญหาด้วยการหาความเช่ือมั่นเชิงความคงท่ีภายใน
ด้วยการแบ่งคร่ึงข้อสอบ วิธีน้ีนาข้อสอบไปสอบนักเรียนคร้ังเดียว แล้วแบ่งข้อสอบท้ังหมดออกเป็นสองชุด
โดยแบ่งคร่ึง เช่น มีข้อสอบอยู่ 100 ข้อ อาจจะแบ่งชุดท่ี 1 ข้อท่ี 1-50 และชุดที่ 2 ข้อที่ 51-100 หรือจะ
แบ่งโดยข้อคู่ข้อค่ีก็ได้ คือแบ่งเป็นข้อคู่ชุดหนึ่งกับข้อค่ีอีกชุดหน่ึง วิธีแบ่งแบบข้อคู่ข้อค่ีน้ีได้รับความนิยม
ท่ัวไป จากนั้นคาแนะนาของแต่ละคนที่ได้จากแต่ละคร่ึงไปหาค่าสัมประสิทธิ์สหสัมพันธ์ระหว่างคะแนนของ
ขอ้ หมายเลขค่ี กับคะแนนของข้อหมายเลขคู่แบบ Pearson Product Moment คา่ สัมประสิทธิ์สหสัมพันธ์
ท่ีหาได้เป็นค่าสัมประสิทธิ์สหสัมพันธ์ หรือความเช่ือมั่นของแบบทดสอบฉบับย่อย ท่ีแยกออกเป็น 2 ส่วน
หรอื ความเชื่อม่นั ของแบบทดสอบทั้งฉบับ (100 ข้อ) จะต้องนาค่าสมั ประสิทธิ์สหสัมพันธท์ ่ีได้มาคานวณโดยใช้
สูตรของ Spearman Brown (Wainer & Thissen, 2001) ดังนี้
การกวาดัรวแัดลแะลปะรปะรเะมเนิ มผนิ ลผกลากราเรรเยีรียนนรรู้ ู้ 6363
2r1 1
22
rtt = 1 r1 1
22
rtt = ค่าความเชอื่ มน่ั ของแบบทดสอบทงั้ ฉบบั
r11 = คา่ ความเชอ่ื มนั่ ของแบบทดสอบครง่ึ ฉบบั
22
ตวั อย่าง ข้อสอบชุดหนึ่ง 20 ข้อใช้สอบนักเรียน 10 คน เมื่อแบ่งเป็นข้อคู่ และขอ้ ค่ีแล้ว ปรากฏ
วา่ แตล่ ะคนได้คะแนน ดงั นี้
คนที่ 1 2 3 4 5 6 7 8 9 10
ข้อคู่ (X) 7 886 5 5 4 3 5 7
ขอ้ ค่ี (Y) 7 987 6 7 5 4 6 8
n = 10 , X = 58 , Y = 67 , X2 = 362 , Y2 = 469 , XY = 410
ด้วยสตู ร นาคะแนนของข้อคู่ และข้อคี่ไปหาค่าสัมประสิทธิ์สหสัมพันธ์แบบ Pearson Product Moment
rxy = n xy x y
{n x2 ( x)2}{n y2 ( y)2}
rxy = (10 410) (58 67)
(10 362) (58)2 )((10 469) (67)2 )
rxy = 0.94
นาคา่ ท่ีไดแ้ ทนคา่ ในสูตร Spearman Brown จะไดค้ ่าความเชอ่ื มั่นของข้อสอบท้ังฉบับ ดังน้ี
2 0.94
rtt = 1 0.94 = 0.97
การหาความเชื่อม่ันของแบบทดสอบโดยวิธีแบ่งคร่ึงแบบทดสอบนี้ เราใช้แบบทดสอบเพียงฉบับ
เดียว และนาไปใช้ทดสอบเพียงคร้ังเดยี ว วิธีน้ีสะดวกกว่า 2 วิธีแรก เพราะการทดสอบ 2 คร้ัง และการทา
แบบทดสอบครู่ขนานให้มีความยากง่ายเท่ากนั นน้ั มกั มีปญั หาในทางปฏิบัติมาก แต่การสรา้ งแบบทดสอบข้ึน
ชุดเดยี ว แล้วทดสอบครั้งเดยี วทาให้มีความผดิ พลาดในการดาเนินการสอบนอ้ ยลง
64 การวดั กแาลระวปัดรแะลเมะินปผรละกเมาินรเผรียลนกราู้รเรียนรู้ 64
2. แบบใช้สูตร Kuder– Richardson การหาค่าความเชื่อม่ันแบบนี้ คูเดอร์และริชาร์ดสัน ได้
เสนอไว้ในปี ค.ศ. 1937 มีหลายสูตร สูตรที่นิยมใช้ทั่วไปมี 2 สูตร คือ สูตรท่ี 20 และ 21 (Kuder &
Richardson , 1937) ดงั นี้
สูตร KR - 20
k
rtt = k 1 1 pq
S2t
เมอ่ื k = จานวนขอ้ ของข้อสอบ
p = สดั ส่วนของผูต้ อบถูก
q = สัดส่วนของผตู้ อบผิด = 1 – p
S2t = ความแปรปรวนของคะแนนรวม
สูตร KR - 21
k
rtt = k 1 1 x(k x)
kS2t
เม่อื k = จานวนข้อของข้อสอบ
X = คะแนนเฉลีย่ ของคะแนนรวม
S2t = ความแปรปรวนของคะแนนรวม
ตัวอยา่ ง ข้อสอบชุดหนง่ึ มี 5 ขอ้ นาไปทดสอบนกั เรยี น 10 คน ให้คะแนนสอบแบบศนู ย์หนง่ึ คือ
ตอบถกู ให้ 1 ตอบผิดให้ 0 ไดผ้ ลการสอบ ดังน้ี
การหาค่าความเชือ่ มนั่ โดยวิธีของ Kuder Richardson
ข้อ
คนที่ 12 3 45 คะแนนรวม (X)
1 11 1 11 5
2 01 0 10 2
3 10 1 11 4
45 11 11 00 01 10 33
6 01 1 01 3
7 11 1 10 4
8 11 1 01 4
9 11 0 11 4
10 0 0 0 1 0 1
รวม 7 8 5 7 6
qp .70 .80 .50 .70 .60 x = 3.30
pq .30 .20 .50 .30 .40 S2t = 1.21
.21 .16 .25 .21 .24 pq = 1.07
การวดั และประเมินผลการเรยี นรู้ 6565
การวัดและประเมนิ ผลการเรยี นรู้
X = X
n
33
= 10 = 3.3
S2t = X2 x 2
n n
121 33 2
10 10
= = 12.1 -10.89 = 1.21
แทนค่าสตู ร KR - 20 k pq
S2t
rtt = k 1 1 = 5 5 1 11..0271
1
= 0.15
แทนคา่ ในสูตร KR - 21 X(k X)
k kS2 t
rtt = k 1 1
= 5 5 1 3.3(5 3.3) = 0.09
1 5 1.21
สูตรของ Kuder - Richardson 21 (KR - 21) ใช้สะดวกมาก เพราะต้องการเพียงค่าเฉล่ีย ค่า
ความแปรปรวน (Variance : S2) และจานวนข้อสอบก็สามารถหาความเช่ือม่ันได้ ค่าความเช่ือม่ันท่ีได้เป็น
ค่าโดยประมาณอยา่ งคร่าวๆ
คา่ ความเช่ือม่ันที่ได้จากการคานวณ มีค่าต้ังแต่ – 1.00 ถึง + 1.00 ถ้าค่าความเชื่อมั่นสูงถึง .80
.90 ขน้ึ ไป แสดงวา่ แบบทดสอบนนั้ เช่อื ม่ันได้มาก และตรงข้าม ถา้ ค่าความเชอ่ื ม่นั ของแบบทดสอบตา่
ใกลเ้ คียง 0 หรอื มีคา่ เปน็ ลบ แสดงวา่ แบบทดสอบนนั้ ขาดความเช่ือมั่น
วิธีการเพิม่ ความเชอ่ื มน่ั ใหแ้ ก่แบบทดสอบ
การเพิ่มความเชื่อม่ันให้แก่แบบทดสอบมีวิธี ดังนี้ (Crocker and Algina, 1986 ; Mehrens and
Lehmann, 1984)
1. สร้างข้อสอบให้ตรง หรืสอดคล้องกับตารางวเิ คราะหห์ ลักสูตร ซงึ่ จะชว่ ยให้แบบทดสอบมคี วาม
เทย่ี งตรงสูง ย่อมทาใหม้ ีความเช่ือม่นั สูงดว้ ย
2. สร้างข้อทดสอบใหม้ ีคา่ ระดบั ความยากปานกลาง
3. ออกขอ้ ทดสอบให้มีจานวนขอ้ มากๆ หรอื เพม่ิ จานวนข้อ เหมาะกบั ระดบั ความสามารถของผูส้ อบ
4. กาหนดเวลาในการสอบใหเ้ หมาะสมกับลกั ษณะข้อสอบ
5. ใชภ้ าษาทีช่ ัดเจน กะทัดรัด เข้าใจงา่ ย
6. แบบทดสอบปรนัย ซึง่ จะให้คา่ ความเชอ่ื ม่นั สูงกว่าแบบทดสอบอัตนัย
66 การวดั กแาลระวปดั รแะลเะมปนิ ผระลเกมาินรเผรลียกนารรู้ เรยี นรู้ 66
การเพ่มิ จานวนขอ้ สอบเพื่อเพม่ิ ความเช่ือมนั่ ใหส้ ูงขึน้
การเพิ่มจานวนข้อทดสอบเข้าไป จะทาให้แบบทดสอบนั้นมีความเช่ือม่ันสูงขึ้น แต่มีเงื่อนไขว่าข้อ
ทดสอบท่ีจะนามาเพ่ิมข้ึน ต้องเป็นข้อสอบชนิดเดียวกัน และมีเนื้อหาวัดสมรรถภาพสมองอย่างเดียวกันกับ
ฉบบั เดมิ
การเพ่ิมจานวนข้อสอบเพื่อเพ่ิมความเชื่อมั่นน้ัน เราจะเพิ่มเข้าไปจานวนก่ีข้อ และเม่ือเพิ่มเข้าไป
แล้วจะทาให้ความเชือ่ มนั่ สูงขึ้นเป็นเทา่ ไร ปญั หาน้อี าจแก้ได้โดยใชส้ ูตรสาเร็จ ดงั นี้ (Gulliksen, 1950)
Kr
rxy = 1 (K 1)r
เมอื่ rxy = คา่ ความเช่อื มน่ั หลังจากเพ่มิ ข้อสอบแล้ว
r = ค่าความเช่ือมนั่ ของแบบทดสอบฉบบั เดิม
K = อัตราส่วนระหว่างจานวนข้อทดสอบของฉบับใหม่ กับจานวนข้อทดสอบของฉบบั เดิม
ตวั อย่าง แบบทดสอบฉบบั หน่ึงมี 60 ข้อ ค่าความเชื่อม่ันเป็น .45 ถา้ เพ่ิมข้อทดสอบเขา้ ไปอีก 30 ข้อ
แบบทดสอบฉบบั ใหมจ่ ะมีคา่ ความเช่อื มนั่ เท่าไร
Kr
จากสตู ร rxy = 1 (K 1)r
ในทีน่ ้ี r = .45 K= 90 = 1.5
60
1.5 .45
rxy = 1 (1.5 1).45
ดังนัน้ แบบทดสอบฉบับใหม่ จะมคี ่าความเช่ือม่ันเปน็ .55
ความคลาดเคลือ่ นมาตรฐานของการวดั
ความคลาดเคลื่อนมาตรฐานของการวัด เป็นความเปลี่ยนแปลงภายในตัวของเด็กนักเรียน อัน
เน่ืองมาจากการวัดซึ่งทาให้คะแนนท่ีได้จากการทดสอบคลาดเคล่ือนไปจากคะแนนจริง (ความรู้จริง) ของเด็ก
นกั เรียน คะแนนทีค่ ลาดเคลอ่ื นไปจากคะแนนจรงิ นน้ั บางครั้งอาจมากกวา่ คะแนนจริง หรอื บางครัง้ อาจนอ้ ย
กว่าคะแนนจริง เราอาจเขยี นเป็นสมการไดว้ า่ (Spearman, 1913)
คะแนนจากการสอบ = คะแนนจริง คะแนนความคลาดเคล่อื น
ความคลาดเคล่ือนมาตรฐานของการวดั คานวณไดจ้ ากสูตร
SEm = St 1rtt
SEm = ความคลาดเคล่ือนมาตรฐานของการวดั
St = ส่วนเบีย่ งเบนมาตรฐานของคะแนนรวม
rtt = สมั ประสทิ ธิข์ องความเชือ่ มั่น
การกวาดัรวแดัลแะลปะรปะรเะมเนิ มผินลผกลากราเรรเียรยีนนรรู้ ู้ 6767
ตัวอย่าง แบบทดสอบฉบบั หนึ่งมีคา่ ความเช่ือมั่น .85 และส่วนเบย่ี งเบนมาตรฐานของคะแนนการ
สอบเปน็ 15 จงหาคา่ ความคลาดเคลอ่ื นมาตรฐานการวดั
จากสูตร S = St 1rtt
St = 15 , rtt = .85
ในทนี่ ้ี SEm = 15 1.85
= 15 .15
= 5.8
ดงั นน้ั ค่าความคลาดเคล่ือนมาตรฐานของการวดั = 5.8
จากตัวอย่างนี้ สมมติว่า ก. สอบได้ 48 คะแนน ก็หมายความว่าคะแนนจริงของ ก. จะอยู่ระหว่าง
48 5.8 หรืออยรู่ ะหว่าง 42.2 ถึง 53.8 คะแนน ท่ีเป็นเช่นน้ี เนอ่ื งจากนักวัดผลเช่ือวา่ คะแนนท่ี ก. สอบ
ได้ 48 คะแนน ย่อมประกอบด้วยข้อผิดพลาดซึ่งอาจจะมาจากเครื่องมือ ซ่ึงได้แก่ แบบทดสอบนั้นยังไม่ดี
พอ หรือสง่ิ อ่นื ๆ ท่ีเก่ียวข้อง ดงั น้ันนกั วดั ผลจงึ พยายามหาระยะของความผิดพลาด เพ่ือกะว่าความสามารถ
จริงๆ ของ ก. จะตกอยู่ช่วงไหนโดยใช้ค่าความคลาดเคลื่อนมาตรฐานของการวัดเป็นตัวกะระยะของความ
ผดิ พลาด
ความเทีย่ งตรง (Validity)
ความแม่นตรง หรือความเท่ียงตรงของข้อสอบเป็นเรอื่ งของความต้องการหรือต้ังใจจะให้ข้อสอบนั้น
วัดอะไร (Anastasi, 1968, p. 99) ข้อสอบท่ีสรา้ งขน้ึ แต่ละชนิดจะมีวตั ถุประสงค์ท่ีตอ้ งการใช้วัดต่างกัน บาง
ชนิดต้องการวดั วา่ ในปัจจุบนั นักเรยี นที่มีความรคู้ วามสามารถเท่าใด แต่บางชนิดก็ตอ้ งการจะคาดคะเนผลใน
อนาคต เป็นต้น ฉะน้ันคาวา่ ความแม่นตรง หรือความเที่ยงตรงของข้อสอบจึงหมายถึงรวมๆ ว่า “วัดตาม
ส่งิ ทต่ี ้องการให้วัด”
ชนดิ ของความเทยี่ งตรง
สมาคมจิตวิทยาแห่งอเมริกาได้แบ่งความเที่ยงตรงของข้อสอบที่ใช้ในการวัด และประเมินผล
การศึกษาออกเปน็ 3 ชนดิ ดงั นี้ (ศริ ชิ ยั กาญจนวาสี, 2556, น. 99 ; ;วรรณี แกมเกตุ, 2551, น. 225 - 226)
1. ความเที่ยงตรงตามเน้ือหา (Content Validity) คาว่าเน้ือหาหมายถึง เนื้อหาวิชา และ
จดุ ประสงค์ของการสอนรวมกนั ฉะนน้ั ความเที่ยงตรงตามเนื้อหาจงึ หมายถงึ ขอ้ สอบท่ีสามารถวดั ได้ตรงตาม
เน้ือหาวชิ า และพฤตกิ รรมที่ต้องการใหเ้ ปลยี่ นแปลงภายในเงือ่ นไขหนงึ่ ๆ หรือกลา่ วสั้นๆ ว่า “วัดไดต้ รงตาม
เนื้อหาทีต่ อ้ งการให้วดั ”
ในการท่ีจะสร้างข้อสอบให้มีความเที่ยงตรงเชิงเนื้อหา จาเป็นจะต้องสร้างข้อสอบทั้งฉบับให้ได้
น้าหนักหรอื เป็นสัดส่วนตามตารางวิเคราะห์หลกั สตู ร
การหาความเที่ยงตรงตามเนื้อหานี้ไม่สามารถแสดงตัวเลขบอกระดับของความเท่ียงตรงออกมาได้
โดยทวั่ ไปจะใช้การพจิ ารณาความเท่ยี งตรงตามเนอื้ หาเป็น 2 ลักษณะ คือ
68 การวดักแาลระวปดั รแะลเะมปนิ รผะลเกมาินรเผรลยี กนารรู้ เรยี นรู้ 68
1. พิจารณาดูวา่ คาถามแตล่ ะขอ้ วัดเนือ้ หาทตี่ ้องการ วดั ไดแ้ ทจ้ ริงเพยี งไร
2. พิจารณาแบบทดสอบโดยตลอดท้ังฉบับ โดยดูว่าคาถามท้ังหมดสามารถวัดเน้ือหาได้ครบทุก
เนอ้ื หาหรือไม่ และมจี านวนข้อท่ถี ามแตล่ ะเน้ือหาเหมาะสมกบั สดั ส่วนในตารางวิเคราะหห์ ลกั สตู รหรอื ยัง
ในการพิจารณาความเที่ยงตรงเชิงเนื้อหาน้ัน นิยมให้ผู้เช่ียวชาญ หรือผู้ชานาญในสาขาวิชานั้นๆ
หลายๆ คน เป็นผู้ร่วมพิจารณาตัดสินว่า ในด้านเน้ือหาวิชาและพฤติกรรมแต่ละอย่างควรจะวัดพฤติกรรม
ย่อยๆ ได้ อย่างไรก็ตามการที่บุคคลหน่ึงบอกว่าแบบทดสอบฉบับนี้มีความเท่ียงตรงสูงก็ไม่จาเป็นท่ีคนอื่น
จะต้องเห็นด้วยเสมอไป ท้ังนี้เพราะแต่ละคนมีเกณฑ์ในการพิจารณาต่างกัน ดังตัวอย่างแบบประเมินความ
เที่ยงตรงเชงิ เน้อื หา ต่อไปนี้
ตัวอย่างของแบบประเมินความเท่ยี งตรงเชิงเน้อื หา
เนอ้ื หา : จุดประสงค์ ข้อสอบ ผลการพิจารณา รวม IOC
การเรยี นรู้ +1 0 -1 (ดชั นีความสอดคล้อง)
การบวกเลข 2 หลกั 1. 13+17 มคี ่าเท่าไร 5 - - 5 1.00
: นักเรยี นสามารถหา 2. 9+12 มคี ่าเทา่ ไร 41- 4 0.80
ผลบวกของจานวน 3. 10+13+16 มคี ่าเท่าไร 1 - 4 -3 -0.60
สองจานวนทไ่ี ม่เกิน 2 4. 19+105 มคี ่าเท่าไร 1 2 2 -1 -0.20
หลกั ไดถ้ ูกต้อง 5. 11+12-15 มคี ่าเท่าไร - - 5 -5 -1.00
เกณฑ์ทใี่ ช้ในการตัดสนิ ค่า IOC ระหวา่ ง 0.50 – 1.00 แสดงว่า ใช้ได้
ค่า IOC ระหวา่ ง 0.01 – 0.49 แสดงวา่ ปรับปรุง
ค่า IOC ระหว่าง 0.00 – -1.00 แสดงวา่ ตดั ทง้ิ
2. ความเทยี่ งตรงเชิงโครงสร้าง (Construct Validity) คาวา่ โครงสรา้ งหมายถงึ ความสามารถ
ทางสมอง เช่น ความจา ความเข้าใจ การนาไปใช้ การวิเคราะห์ การสังเคราะห์ และการประเมินค่า
ความเที่ยงตรงเชิงโครงสร้างต่างจากความเที่ยงตรงเชิงเนื้อหา เพราะความเท่ียงตรงเชิงเนื้อหายึดเนื้อหาเป็น
เกณฑ์ ส่วนความเที่ยงตรงเชิงโครงสร้างจะยึดคณุ ลักษณะต่างๆ หรือความสามารถทางสมองเปน็ เกณฑ์ การ
สร้างเคร่อื งมือใหม้ ีความเที่ยงตรงเชิงโครงสร้าง จงึ จาเปน็ จะต้องรู้วา่ ความสามารถทางสมองท่ีต้องการวัดน้ัน
คืออะไร หากต้องการวัดความสามารถทางสมองดา้ นความเข้าใจ การนาไปใช้ ฯลฯ ก็จะต้องออกขอ้ สอบให้
สอดคล้องกับน้าหนักในตารางวิเคราะห์หลักสูตรในด้านพฤติกรรม จึงจะนับได้ว่าแบบทดสอบนั้นมีความ
เทย่ี งตรงได้เช่นเดียวกับการหาความเทยี่ งตรงเชิงเนื้อหา ดังตัวอยา่ งแบบประเมินความเทย่ี งตรงเชิงโครงสร้าง
ตอ่ ไปนี้
การกวาัดรวแดัลแะลปะรปะรเะมเนิ มผนิ ลผกลากราเรรเยีรียนนรรู้ ู้ 6969
ตัวอย่างของแบบประเมินความเท่ียงตรงเชิงโครงสรา้ ง
ข้อสอบ พฤติกรรม ผลการพิจารณา รวม IOC
+1 0 -1 (ดัชนคี วามสอดคล้อง)
1. ใบไม้ เปรยี บเหมือนบุคคลใด ความเขา้ ใจ – 500 5 1.00
ก. นายแพทย์ แปลความ 410
ข. ครู
ค. วศิ วกร
ง. พ่อครวั
2. ถา้ อากาศเยน็ ลงอยา่ งกะทันหนั การวเิ คราะห์ – 4 0.80
เดก็ ๆ จะปว่ ยเป็นอะไรกนั มาก ความสมั พันธ์
ก. ท้องเสีย
ข. ปวดศีรษะ
ค. ไขห้ วดั
ง. ตาแดง
จ. ตวั รอ้ น
3. ความเทีย่ งตรงเชิงสมั พันธ์กับเกณฑ์ (Criteria Relation)
ความเที่ยงตรงชนิดน้ีให้ความหมายได้ว่าเป็นการพิจารณาข้อสอบที่สร้างน้ัน เม่ือนาไปสอบวัด
แล้ว คะแนนที่ได้มีความสัมพันธ์กับเกณฑ์ภายนอกท่ีกาหนดไว้หรือไม่ ซึ่งอาจจะเป็นผลการเรียนในอนาคต
หรอื คะแนนรวมของผลการเรยี นกไ็ ด้ ความเทีย่ งตรงเชงิ สัมพนั ธก์ ับเกณฑ์ 2 ชนิด คอื
3.1 ความเท่ียงตรงเชิงสภาพ หมายถึง ความสอดคล้องของค่าวัดที่ได้จากแบบทดสอบกับ
สภาพความเปน็ จรงิ ของเด็กในปัจจบุ นั นน่ั คือจะเปน็ การตรวจสอบความเทีย่ งตรงของแบบทดสอบทส่ี รา้ งโดย
ใชส้ ถานภาพอันแทจ้ ริงของเด็กในปัจจุบนั มาเป็นตัวเกณฑ์ในการเปรียบเทียบ เม่ือครูไดส้ อนไปตามทฤษฏีที่
วางไว้แล้ว นักเรียนปฏิบัติได้จริงหรือไม่ ดังนั้นในเชิงปฏิบัติ การหาความเที่ยงตรงเชิงสภาพก็จะนาเอา
คะแนนที่ได้จากการสอบไปเปรียบเทียบหาความสอดคล้องกับความสามารถท่ีแท้จริง เช่น คะแนน
ภาคปฏบิ ัติ เป็นต้น คา่ สหสมั พันธ์ที่ได้นจี้ ะเปน็ ค่าที่บอกระดับความเทย่ี งตรงเชิงสภาพ นอกจากนี้ในการหา
ความเทยี่ งตรงเชงิ สภาพ ยังอาจพจิ ารณาดูว่าแบบทดสอบท่สี รา้ งข้ึนนั้นสามารถจาแนกนกั เรียนทเ่ี ก่งกับอ่อน
คอื คนเก่งได้คะแนนสูง คนออ่ นได้คะแนนต่าได้หรือไม่ คอื ถ้าแบบทดสอบใดสามารถใหค้ ะแนนกระจายก็
แสดงว่าแบบทดสอบนั้นมีความเที่ยงตรงเชิงสภาพสูง หากแบบใดไม่สามารถจาแนกคะแนนระหว่างนักเรียน
เกง่ กบั นกั เรียนอ่อนได้ กแ็ สดงว่าแบบทดสอบนัน้ ขาดความเที่ยงตรงเชิงสภาพ
70 การวดั กแาลระวปดั รแะลเะมปนิ ผระลเกมาินรเผรลียกนารรู้ เรียนรู้ 70
3.2 ความเท่ียงตรงเชิงพยากรณ์ หมายถึง ความสอดคล้องระหว่างผลของการสอบกบั ความสาเร็จ
ในอนาคตของนักเรยี น โดยพิจารณาดูว่าแบบทดสอบท่ีสรา้ งขึน้ น้ีสามารถจะพยากรณ์ได้ตามวัตถุประสงค์จริง
หรอื ไม่ ผลการสอบสามารถใชพ้ ยากรณ์การกระทาในอนาคตได้แม่นยาเพยี งใด วิธกี ารหาความเที่ยงตรงชนิด
นี้จะใช้วิธีการหาความสัมพันธ์ของคะแนนสอบของข้อสอบท่ีสร้างกับคะแนนสอบท่ีเรียนในอนาคต เช่นนา
คะแนนสอบเข้ามหาวิทยาลัย ไปหาความสัมพันธก์ ับคะแนนเฉล่ียท่ีเรียนในมหาวิทยาลัย ค่าความสัมพันธ์ท่ี
ไดเ้ ป็นค่าความเทีย่ งตรงเชิงพยากรณ์ของข้อสอบ ใช้สอบเขา้ มหาวทิ ยาลยั เป็นต้น
ความเทีย่ งตรงตามสภาพกบั ความเที่ยงตรงเชิงพยากรณ์ตา่ งกนั ตรงที่ระยะเวลาทีใ่ ช้ กลา่ วคอื ความ
เท่ียงตรงเชิงพยากรณ์ดูพฤติกรรมเชิงอนาคตเป็นเกณฑ์ ส่วนความเที่ยงตรงเชิงสภาพน้ันดูพฤติกรรมใน
ปัจจบุ ันเป็นเกณฑ์ การหาค่าความเท่ียงตรงทั้งสองชนิดน้ี กระทาไดโ้ ดยหาค่าสมั ประสิทธิ์สหสมั พนั ธ์ระหว่าง
คะแนนสอบกับเกณฑ์ท่ีใช้ จะเป็นความเที่ยงตรงตามสภาพหรือความเท่ียงตรงเชิงพยากรณ์ ก็สุดแท้แต่
เกณฑท์ ใ่ี ช้ดังกลา่ วแลว้
สรปุ ไดว้ ่า การหาคุณภาพของข้อสอบและแบบทดสอบนั้นจะตอ้ งทาการวิเคราะห์คุณภาพทงั้ เป็นราย
ข้อและท้งั ฉบบั โดยการวิเคราะห์หาคุณภาพเป็นรายข้อได้แก่ การหาความยาก ค่าอานาจจาแนก และการหา
ความเท่ียงตรง ส่วนการวิเคราะห์คุณภาพทั้งฉบับได้แก่ การหาความเชื่อม่ัน นอกจากนั้นข้อสอบที่ดีจะต้องมี
ความเปน็ ปรนยั มปี ระสิทธิภาพในการนาไปใช้ได้เป็นอย่างดี
การวดั และประเมินผลการเรยี นรู้ 71
บทที่ 5
สถิตเิ บื้องตน้ สำหรับกำรวดั และประเมินผลกำรเรยี นรู้
การวัดและประเมินผลการเรยี นรมู้ คี วามจาเป็นนาทางสถติ ิมาใช้ในการจัดกระทาข้อมูล การวเิ คราะห์
และแปลผลของการวัดและประเมิน เพ่ือให้สามารถอธิบายลักษณะของคะแนนท่ีเก็บรวบรวมมาได้อย่าง
ถูกตอ้ งแมน่ ยา และสะดวกในการสรุปผล
การนากระบวนการทางสถติ ิมาใชใ้ นการประเมนิ ผล ผู้ประเมินจะต้องเขา้ ใจวธิ กี าร และสามารถเลอื ก
สถติ ิทีเ่ หมาะสมมาใชไ้ ดต้ รงตามวัตถุประสงค์ของการประเมิน
กำรแจกแจงควำมถี่ (Frequency Distribution)
การแจกแจงความถี่ หมายถึง การจัดข้อมูลท่ีเป็นตัวเลข หรือคะแนนให้เป็นหมวดหมู่ เพ่ือความ
สะดวกในการพิจารณาลักษณะของข้อมูล ทาโดยเรียงคะแนนจากน้อยไปมาก หรือมากไปน้อย แล้วทาการ
ขีดรอยคะแนนแล้วนับวา่ แต่ละคะแนนมซี ากนั กีจ่ านวน (สมนึก ภัททยิ ธนี, 2551, น. 233)
ตวั อยำ่ ง จากผลการสอบวชิ าคณติ ศาสตร์ ของนกั เรียน ป.5 จานวน 30 คน เป็นดงั นี
23 26 25 23 24 23 25 24 22 24
24 22 21 24 25 22 26 27 25 24
26 24 25 24 21 26 24 25 23 24
คะแนนทงั 30 ตวั นี เรยี กวา่ คะแนนดิบ (raw score) สามารถนามาแจกแจงความถี่ได้ ดงั นี
คะแนน (x) รอยคะแนน (Tally) ควำมถี่ (f) ควำมถ่ีสะสม
27 / 1 (Cumulative Frequency)
26 //// 4
25 6 30
24 //// / 10 29
23 //// //// 4 25
22 3 19
21 //// 2 9
รวม /// 30 5
// 2
72 การวัดและประเมินผลการเรียนรู้ 72
การวัดและประเมินผลการเรยี นรู้
กำรวัดแนวโน้มเข้ำสสู่ ว่ นกลำง (Measure of Central Tendency)
การวัดแนวโน้มเข้าสู่ส่วนกลาง เป็นการหาค่าสถิติเพื่อบอกลักษณะท่ีเป็นตัวแทนของข้อมูลทังหมด
ค่าสถติ ิท่นี ยิ มนามาใช้ ไดแ้ ก่ (วรรณี แกมเกตุ, 2551, น. 320 - 321)
1. ค่าเฉลยี่ หรอื มัชฌิมเลขคณิต (Mean : x )
2. มธั ยฐาน (Median : Mdn.)
3. ฐานนิยม (Mode : Mo.)
1. ค่ำเฉล่ีย หรือมชั ฌมิ เลขคณิต (Mean) หมายถึง ผลรวมของคะแนนทังหมด หารด้วยจานวน
ขอ้ มูลทังหมด การหาค่าเฉลีย่ มวี ิธีหา ดงั นี
1.1 ถา้ ข้อมูลมีจานวนน้อย หาค่าเฉลี่ยจากคะแนนดิบโดยใชส้ ตู ร
∑X
x = N
X คือ ค่าเฉล่ีย
X คอื คะแนนดิบแตล่ ะตัว
X คอื ผลรวมของคะแนนดิบทงั หมด
N คือ จานวนคะแนน หรือจานวนขอ้ มูลทงั หมด
เชน่ ถ้าขอ้ มลู ชดุ หนึง่ ประกอบด้วย 5, 8, 6, 4 และ 12
5 + 8 + 6 + 4 +12
ค่าเฉล่ยี = 5 = 7 คะแนน
1.2 ในกรณีที่ขอ้ มูลซากันมาก ตอ้ งแจกแจงความถ่ี และหาคา่ เฉลีย่ จากสูตร
∑fx
X = N
X คอื ค่าเฉลีย่
f คือ ความถี่
x คอื คะแนนดบิ
fx คอื ผลคูณของ f กบั x แต่ละคะแนน
fx คอื ผลรวมทังหมดของ fx
N คือ จานวนข้อมูลทงั หมด
การกวาัดรแวดัลแะลปะรปะรเมะเินมผินลผกลากราเรรเียรยีนนรรู้ ู้ 7373
ตวั อยำ่ ง จงหาค่าเฉล่ียของคะแนนจากตารางขา้ งล่างนี
Xf fx
11 2 22
93 27
87 56
65 30
53 15
20 150
วิธีทำ สูตร X = ∑fx = 150 = 7.5 คะแนน
N 20
2. มัธยฐำน (Median) หมายถึง คะแนนที่อยู่กึ่งกลางของคะแนนทังหมด เมื่อเรียงตามลาดับแล้ว
การหาคา่ มธั ยฐานทาได้ ดงั นี
2.1 ถา้ ขอ้ มูลมีจานวนนอ้ ย พบว่า เม่อื เรยี งคะแนนจากมากไปนอ้ ยหรือนอ้ ยไปหามากแลว้ มัธย
n1
ฐานจะอยู่ท่คี ะแนนลาดับท่ี 2
ดังนัน ตาแหน่งท่ีของมัธยฐาน = n + 1 เม่ือ n คือ จานวนข้อมูลทังหมด ตัวอย่างเช่น
2
ขอ้ มูลชุดหน่ึงประกอบดว้ ย 11, 9, 10, 12, 7, 8, 7 หาค่ามธั ยฐานไดด้ งั นี
เรียงลาดับของขอ้ มูลจากนอ้ ยไปหามากได้ 7, 7, 8, 9 , 10 , 11 , 12
n1 7+1
ตาแหนง่ ทีข่ องค่ามัธยฐาน คือ 2 = 2 = 4
ดงั นัน ค่ามธั ยฐาน คือ ข้อมูลตาแหนง่ ที่ 4 (จากนอ้ ยไปหามาก) = 9 คะแนน
ถา้ หากขอ้ มูลเป็น 7, 8, 9, 10, 11, 12
9 +10
ตาแหน่งที่ของมธั ยฐาน คือ ขอ้ มูลตาแหนง่ ท่ี 3.5 ตรงกบั คะแนน 2 = 9.5 คะแนน
2.2 ถ้ามูลมีจานวนมากจะต้องนาคะแนนมาสรา้ งตารางแจกแจงความถี่สะสม เน่ืองจากตาแหน่ง
มัธยฐานเป็นตาแหน่งที่อยู่ตรงกลางของข้อมูล กล่าวคือ ณ ตาแหน่งมัธยฐานจะมีข้อมูลตังแต่ต่าสุดจนถึง
ตาแหน่งนัน 50% และจากตาแหน่งมัธยฐานถึงข้อมูลสูงสุดอีก 50% ดังนัน เราจึงอาจหาค่ามัธยฐานได้ตรง
ตาแหนง่ ความถส่ี ะสม คิดเปน็ ร้อยละ 50 ของจานวนขอ้ มลู ทงั หมด สตู รสาหรบั หาค่ามัธยฐาน เป็นดงั นี
74 การวดั กแาลระวปดั รแะลเะมปนิ ผระลเกมานิรเผรลยี กนารรู้ เรียนรู้ 74
Mdn. = Lo + i n F
2 fm
Mdn. = ค่ามัธยฐาน
LO = ขดี จากัดล่างทแ่ี ท้จรงิ ( Real Lower Limit ) ของช่วงคะแนนในชนั
ท่มี มี ัธยฐานตกอยู่
n = ∑f หรือ จานวนความถ่ที งั หมด
i = ค่าอันตรภาคชัน
F = ความถสี่ ะสมจากคะแนนตา่ สุด ถงึ คะแนนทีเ่ ปน็ ขดี จากดั บนทแ่ี ท้จรงิ
(Real Upper Limit) ของคะแนนในชนั ก่อนชันทีม่ ีมัธยฐาน
fm = ความถ่ีของชนั คะแนนทมี่ มี ธั ยฐานและพบวา่ คะแนนมัธยฐานจะอยใู่ นชันทีม่ ี
N
ความถสี่ ะสม = 2
ตัวอยำ่ ง จงหาค่ามัธยฐาน จากตารางแจกแจงความถ่ีต่อไปนี
X f cf
80 – 84 9 50
75 – 79 11 41
70 – 74 10 30
65 – 69 6 20
60 – 64 6 14
55 – 59 5 8
50 – 54 3 3
1. หาความถ่ีสะสมของชว่ งคะแนนแตล่ ะชนั เขียนลงในช่อง cf (Cumulative Frequency)
2. ตาแหน่งท่ขี องมธั ยฐานจะอยูท่ ่คี วามถ่ีสะสม n = 50 = 25 ซ่ึงอยู่ระหว่างความถ่ี
22
สะสม 20 – 30 ( ดใู นตารางชอ่ ง cf )
3. จากสูตร Mdn. = LO + i n F
2 fm
ในทีน่ ี LO = 69.5 n = 50 , i = 5 , F = 20 , fm = 10
5201020
Mdn
= 69.5 + 5 = 69.5 + 5 0.5 = 69.5+2.5
สรุปได้ว่า Mdn = 72
การกวาัดรวแัดลแะลปะรปะรเะมเินมผนิ ลผกลากราเรรเยีรียนนรรู้ ู้ 7575
3. ฐำนนิยม (Mode) หมายถึง คะแนนท่ีมีความถ่ีสูงท่ีสุดในข้อมูลชุดหนึ่งๆ อาจทาได้หลายวิธี
เชน่
3.1 จากคะแนนดิบ (Raw Score) หรือคะแนนที่ไม่ได้จัดกลุ่ม คะแนนตัวที่ซากันมากที่สุดก็คือ
ค่าฐานนิยม เชน่
ข้อมูลชุดท่ี 1 ได้แก่ 3, 5, 5, 5, 5, 9, 11, 13, 16, 18 คะแนนที่ซากันมากที่สุด
คือ 5 เปน็ ค่าฐานนิยม
ข้อมูลชุดท่ี 2 ได้แก่ 3, 5, 5, 3, 5, 6, 3, 6, 7 คะแนนที่ซากันมากท่ีสุดคือ 3 และ 5 ดังนัน
ฐานนิยมจงึ เท่ากับ 3 กบั 5
ข้อมูลชดุ ท่ี 3 ได้แก่ 3, 5, 6,7 คะแนนท่ีซากันไม่มี ดงั นนั ฐานนิยมของขอ้ มลู ชดุ นีไม่มี
ข้อมูลชดุ ที่ 4 ได้แก่ 3, 3, 3, 3, 3, 3, 3 คะแนนซากนั ทกุ ตัว ดังนันฐานนิยมของขอ้ มูลชดุ นี
ไดแ้ ก่ 3
3.2 จากคะแนนที่จดั กลมุ่ จุดกลางของคะแนนในชนั ท่ีมีความถม่ี ากทสี่ ดุ ก็คอื ฐานนิยม
3.3 จากคา่ เฉลยี่ ( X ) และค่ามัธยฐาน (Mdn) โดยใชส้ ตู ร
Mode = 3Mdn. - 2 X
ตัวอย่างเช่นจากคะแนนผลการเรียนวิชาคณิตศาสตร์ชัน ป. 6 พบว่า มีค่าเฉล่ียเป็น 42
คะแนน มธั ยฐานเป็น 43.25 คะแนน หาฐานนยิ มโดยใชส้ ูตร ดงั นี
Mode = 3 (43.25) – 2 (42)
= 45.75 คะแนน
กำรใช้คำ่ เฉลย่ี มธั ยฐำน และฐำนนยิ ม
การเลือกใช้ คา่ เฉล่ีย มัธยฐาน และฐานนิยม สามารถสรุปได้ ดังนี (โกวิท ประวาลพฤกษ์ และ
สมศกั ดิ์ สนิ ธรุ ะเวชญ์, 2527, น. 204 – 205 ; สมนกึ ภัททยิ ธนี, 2551, น. 246)
ค่ำเฉลี่ย
1. เม่ือตัวเลขของขอ้ มูลทีน่ ามาวเิ คราะหอ์ ยใู่ นมาตรอันตราภาคและมาตรอตั ราส่วน
2. ควรนามาใชใ้ นกรณที ก่ี ารแจกแจงของคะแนนมลี กั ษณะเป็นโค้งปกติ
มธั ยฐำน
1. เม่อื ต้องการบอกคะแนนตรงกลาง หรอื จดุ กลางของข้อมลู ทังชุด
2. ใช้เปน็ ค่าตัวกลางในการวัดแนวโน้มเข้าสู่ส่วนกลางในกรณีท่ีข้อมูลมกี ารกระจายไม่สม่าเสมอเกิด
ช่องว่างของการแจกแจงความถ่ีมาก หรอื การกระจายของคะแนนเบไ้ ปทางคะแนนมาก หรือเบไ้ ปทางคะแนน
นอ้ ย
ฐำนนิยม
1. เม่ือตอ้ งการศึกษาแนวโน้มเข้าสสู่ ่วนกลางของคะแนนชุดนันๆ เพยี ง คร่าวๆ และรวดเรว็
2. เมื่อต้องการศึกษาแนวคาตอบ โดยท่ีมีผู้แสดงความคิดเห็นในเรื่องหน่ึงเร่ืองใดมากที่สุด เช่น สี
ของรองเทา้ หรอื แบบเสือทเ่ี ปน็ นิยมของนกั เรียนกล่มุ นันๆ เป็นตน้
3. เมื่อตวั เลขของข้อมูลท่นี ามาวิเคราะหอ์ ยู่ในมาตรนามบัญญตั ิ
76 การวดั และประเมินผลการเรียนรู้ 76
การวัดและประเมนิ ผลการเรียนรู้
กำรวดั กำรกระจำย
การวัดการกระจายเป็นวิธกี ารวเิ คราะหข์ ้อมูล เพ่ือให้ทราบความแตกตา่ งของคะแนนในชุดข้อมูลว่า
มีความแตกต่างมากน้อยเพียงใด ถ้าคะแนนในข้อมูลชุดนันแตกต่างกันมาก ก็กล่าวได้ว่าข้อมูลชุดนันมีการ
กระจายมาก ถ้าข้อมลู แตกตา่ งกนั น้อยกก็ ล่าวไดว้ า่ มีการกระจายน้อย เชน่
การวดั ระดบั ความสงู ของนกั เรยี น 3 กลุ่มๆ ละ 5 คน มหี นว่ ยวดั เป็นเซนติเมตร ไดค้ ่า ดงั นี
กลุ่มท่ี 1 = 75 87 115 118 130
กลุ่มที่ 2 = 100 102 105 108 110
กลุ่มที่ 3 = 105 105 105 105 105
ค่าเฉลีย่ ของขอ้ มูลทัง 3 ชดุ เทา่ กัน คือ 105 เซนติเมตร ถ้าแปลความหมายจากคา่ เฉลย่ี เพยี งอยา่ ง
เดียวจะแปลได้ว่า นักเรียนทัง 3 กลุ่ม มีระดับความสูงเท่ากัน แต่ถ้าพิจารณาจากความแตกต่างกันภายใน
ของข้อมลู แต่ละชดุ จะพบวา่ ไม่เหมอื นกัน คอื กลมุ่ ท่ี 1 มีระดับความสงู แตกต่างกันมาก กลุม่ ที่ 2 ใกล้เคยี ง
กัน ส่วนกลุ่มที่ 3 เท่ากันหมด ดังนันการแปลความหมายลักษณะข้อมูลโดยใช้ค่าเฉลี่ยอย่างเดีย วจึงไม่
เพยี งพอ จาเป็นตอ้ งพิจารณาการกระจายของขอ้ มลู ควบคู่ไปด้วย
การวัดการกระจายอาจพิจารณาไดห้ ลายวิธี ดังนี (สมนกึ ภทั ทิยธนี, 2551, น. 246 - 249)
1. พสิ ยั (Range) คอื ความแตกตา่ งระหว่างคะแนนสงู สดุ กบั คะแนนต่าสุดในคะแนนชุดนนั
พสิ ัย = คะแนนสูงสุด - คะแนนต่าสดุ
เชน่ คะแนนของนักเรียน 6 คน เป็น ดงั นี 10, 8, 6, 2, 3, 7
พิสัย = 10 - 2 = 8
ค่าพิสัยใช้บอกลักษณะการกระจายอย่างหยาบและไม่แน่นอน เนื่องจากพิจารณาจากคะแนน
เพียงแค่ 2 ตวั ถ้ามีคะแนนทีส่ ูงหรอื ตา่ ผดิ ปกติเพียงคา่ เดยี วก็จะทาใหก้ ารกระจายคลาดเคลื่อนไปดว้ ย
2. ส่วนเบี่ยงเบนมำตรฐำน (Standard deviation : S, SD) เป็นการวัดการกระจายมักใช้เม่ือ
วัดแนวโนม้ เขา้ สู่ส่วนกลางด้วยคา่ เฉลี่ยมีวิธกี ารหาได้หลายวิธี ดงั นี (อวยพร เรอื งตระกลู , 2541)
2.1 ถา้ ข้อมูลมจี านวนน้อย และไมไ่ ดจ้ ัดกลมุ่ ใชส้ ตู ร ดงั นี
S= x x2 หรือ S = X2 X2
N N
N
ตัวอยำ่ ง จงหาสว่ นเบีย่ งเบนมาตรฐานจากข้อมูลตอ่ ไปนี
48, 46, 44, 42, 39, 35, 35, 33, 31, 37
วิธีท่ี 1 X = x
N
= 48 46 44 42 39 35 35 33 31 37
10
= 39
การวัดและประเมินผลการเรยี นรู้ 77
การวัดและประเมินผลการเรียนรู้ 77
สรา้ งตารางเพื่อหาคา่ ตา่ งๆ ดังนี (x- x )2
x x- x 81
48 9 49
46 7 25
44 5 9
42 3 0
39 0 16
35 -4 16
35 -4 36
33 -6 64
31 -8 41
37 -2 300
แทนคา่ สตู ร S = x x 2 = 5.48
N
= 300
10
สว่ นเบ่ียงเบนมาตรฐาน = 5.477225
วธิ ีที่ 2 x2
x 2,304
48 2,116
46 1,936
44 1,764
42 1,521
39 1,225
35 1,225
35 1,089
33 961
31 1,369
37 15,510
390
78 การวัดและประเมินผลการเรียนรู้ 78
การวัดและประเมินผลการเรียนรู้
แทนคา่ สูตร S = x2 x 2
N N
15,510 390 2
10 10
=
สว่ นเบย่ี งเบนมาตรฐาน = 5.48
2.2 ถ้าขอ้ มลู มีจานวนมากและต้องจดั กลมุ่ ใชส้ ูตรดังนี
S = f x x 2 หรอื
N
S= ∑fx2 - ∑fx 2
N N
ตัวอยำ่ ง จงหาสว่ นเบย่ี งเบนมาตรฐานจากข้อมลู ต่อไปนี x2 fx2
x f fx 400 1,200
20 3 60 361 2,888
19 8 152 324 3,240
18 10 180 289 3,468
17 12 204 256 2,048
16 8 128 225 1,350
15 6 90 196 588
14 3 42 14,782
50 856
แทนค่าในสตู ร S = fx2 fx2
N N
S= 14,782 856 2
50 50
S = 1.595 หรอื 1.60
ส่วนเบี่ยงเบนมาตรฐาน = 1.60 แปลความหมายได้ว่า ข้อมูลมีการกระจายของคะแนน
หา่ งจากคา่ เฉลย่ี โดยเฉล่ยี เท่ากบั 1.60
การวดั และประเมินผลการเรยี นรู้ 79
การวดั และประเมนิ ผลการเรียนรู้ 79
3. ควำมแปรปรวน (Variance : S2) เป็นการวัดการกระจายในรูปพืนท่ี เป็นค่ำกำลังสองของ
ส่วนเบี่ยงเบนมำตรฐำน นิยมใช้เม่ือ หาค่าแนวโน้มเข้าสู่ส่วนกลางด้วยค่าเฉล่ียเช่นเดียงกับส่วนเบี่ยงเบน
มาตรฐาน มีสูตรดงั นี (อวยพร เรอื งตระกลู , 2541)
3.1 ถ้าขอ้ มูลมจี านวนนอ้ ยใชส้ ตู ร ดงั นี
S2 =
xx 2 หรอื
N
2
S2 = x2 x
N N
3.2 ถา้ ข้อมลู มจี านวนมากจะตอ้ งจดั กลุ่มใชส้ ูตร ดงั นี
S2 =
f xx2 หรือ S2 = fx2 fx2
N N N
ตวั อยำ่ ง ถา้ ขอ้ มลู ชดุ หนึ่งคานวณคา่ S ได้ = 1.5
ดังนัน S2 = 2.25
สหสมั พนั ธ์ (Correlation)
ถ้าตอ้ งการศึกษาความสมั พันธร์ ะหวา่ งขอ้ มูล 2 ชุด ทม่ี าจากกลุม่ ตวั อย่างเดยี วกนั วา่ มคี วามสมั พนั ธ์
กันมาก – น้อยเพียงใด เช่น ความสัมพันธ์ระหว่างการขาดเรียนกับคะแนนผลสะสมของนักเรียนหรือ คะแนน
สอบคัดเลอื กเขา้ เรียนกับสัมฤทธ์ิผลทางการเรยี นของนักเรยี นความสมั พันธ์ของส่ิงเหล่านี เรียกว่า สหสัมพันธ์
ระดับความสัมพันธ์ของข้อมูล 2 ชุด หรือตวั แปร 2 ตัว มีมาก – น้อยเพียงใด และมีความสัมพันธ์ในทิศทาง
ใดแสดงได้ด้วยค่าสัมประสิทธิ์สหสัมพันธ์ (Coefficient of Correlation) โดยมีรายละเอียด ดังนี (โกวิท
ประวาลพฤกษ์ และสมศกั ดิ์ สินธรุ ะเวชญ์, 2527, น. 212 – 217 ; สมนึก ภทั ทิยธนี, 2551, น. 254 - 258)
กำรคำนวณหำคำ่ สมั ประสทิ ธิส์ หสมั พันธ์
1. สหสัมพันธ์จำกตำแหน่งของคะแนน (Correlation from Ranks) วิธีคิดคานวณนีได้จาก
ผลต่างของตาแหน่งของคะแนน 2 ชุด ที่เรยี งลาดับท่ี (Rank) จากคะแนนต่าสุดไปถึงคะแนนสูงสุด ถ้าข้อมูล
ตาแหน่งซากนั ก็ให้ถือตาแหน่งของคะแนนแตล่ ะคะแนน
สัมประสิทธิ์สหสมั พนั ธ์จากผลตา่ งของคะแนน สูตรมีดังนี
rs = 1- 6 D2
nn2 1
เมือ่ rs คอื สมั ประสทิ ธ์ิสหสมั พนั ธ์จากผลตา่ งของตาแหน่งของคะแนน
D2 คอื ผลบวกของกาลงั สองของผลต่างของตาแหน่งของคะแนนแตล่ ะคู่
N คอื จานวนคน
การวดั และประเมนิ ผลการเรยี นรู้ 80
80 การวัดและประเมินผลการเรียนรู้
ตัวอยำ่ ง นกั เรยี น 15 คน สอบวชิ าคณติ ศาสตร์และวทิ ยาศาสตร์ ปรากฏผลดงั นี
คนท่ี 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
คะแนน
คณิตศำสตร์ (X) 9 11 14 17 19 22 24 27 25 23 20 18 15 13 10
คะแนน 10 14 16 24 21 22 19 26 28 30 18 12 27 23 8
วทิ ยำศำสตร์ (Y)
หาค่าสัมประสิทธิ์สหสัมพันธ์ของคะแนนทังสองวิชา โดยการจัดตาแหน่งของคะแนนของแต่ละวิชา
ของนักเรียนแต่ละคน โดยให้คะแนนคณิตศาสตร์แทนด้วย X และคะแนนวิทยาศาสตร์แทนด้วย Y แล้วหา
ผลต่างของ X และ Y ลงตารางชอ่ ง D ดังต่อไปนี
นกั เรยี นคนที่ คะแนน X คะแนน Y ตำแหน่งลำดับ X ตำแหน่งลำดบั Y D D2
1 9 10 15 14 1 1
2 11 14 13 12 1 1
3 14 16 11 11 0 0
4 17 24 9 5 4 16
5 19 21 7 8 -1 1
6 22 22 5 7 -2 4
7 24 19 3 9 -6 36
8 27 26 1 4 -3 9
9 25 28 2 2 00
10 23 30 4 1 39
11 20 18 6 10 -4 16
12 18 12 8 13 -5 25
13 15 27 10 3 7 49
14 13 23 12 6 6 36
15 10 8 14 15 -1 1
6x204 D 0 D2 204
rs=1- 6 D2 = 1 - 15224
n n2 1
= 1 - 1224 = 1 – 0.36
3360
rs = 0.64
การวดั และประเมนิ ผลการเรยี นรู้ 81
การวัดและประเมินผลการเรียนรู้ 81
2. สหสัมพนั ธจ์ ำกผลคูณของคะแนน (Product Moment Correlation) ใชแ้ ทนด้วยสัญลักษณ์
rxy แสดงถึง ความสมั พนั ธ์ระหว่างคะแนน x และคะแนน y เม่อื x,y เปน็ คะแนนดิบของข้อมลู แต่ละชุด
สูตรของ Pearson (Person, 1895) คือ
N xy x y
N x2 x2 N y2 y2
rxy =
เมื่อ x คอื คะแนนดิบแต่ละตวั ของขอ้ มูลชดุ ที่ 1
y คอื คะแนนดิบแตล่ ะตวั ของขอ้ มลู ชุดท่ี 2
ตัวอยำ่ ง การหาค่าสหสมั พันธจ์ ากผลคูณของคะแนน จากผลการสอบ 2 ครัง ของนักเรียน 10 คน ได้ผลดงั นี
นักเรียน 1 2 3 4 5 6 7 8 9 10
คะแนน x 37 41 48 32 36 30 40 45 59 34
คะแนน y 75 78 88 80 78 71 75 83 74 74
หาคะแนน rxy โดยใชส้ ตู รของเพยี ร์สนั ดังนี
rxy = N xy x y
N x2 x2 N y2 y2
วธิ ีทำ X2 Y2
นกั เรยี นคนท่ี X Y XY
1 37 75 1369 5625 2775
2 41 78 1681 6084 3198
3 48 88 2304 7744 4224
4 32 80 1024 6400 2560
5 36 78 1296 6084 2808
6 30 71 900 5041 2130
7 40 75 1600 5625 3000
8 45 83 2025 6889 3735
9 34 74 1156 5476 2516
10 39 74 1521 5476 2886
n = 10 ∑X = 382 ∑Y= 776 ∑X2= 14,876 ∑Y2= 60,444 ∑XY = 29,832
10 29832 382 776
1014876 3822 10 60444 7762
rxy =
= 0.745
rxy = 0.75
การวัดและประเมนิ ผลการเรียนรู้ 82
82 การวัดและประเมนิ ผลการเรยี นรู้
กำรแปลควำมหมำยสหสัมพนั ธ์จำกสัมประสทิ ธส์ิ หสมั พันธ์
1. สัมประสิทธสิ์ หสัมพันธ์ มีคา่ ระหว่าง -1.00 ถึง 1.00 (อาจเปน็ ค่าบวกหรอื ลบก็ได้)
2. การพิจารณาค่าสัมประสิทธิ์สหสัมพันธ์ว่าอยู่ในระดับใด ให้พิจารณาแต่เฉพาะตัวเลขอย่างเดียว
ส่วนเครือ่ งหมายบวกหรอื ลบ เปน็ การแสดงลักษณะความสัมพันธร์ ะหวา่ งขอ้ มลู เทา่ นัน
3. ค่าสัมประสิทธิ์มีค่าเป็น + (บวก) หมายความว่า ข้อมูลทังสองมีความสัมพันธ์ลักษณะตามกัน
และถา้ ค่าสมั ประสทิ ธมิ์ คี า่ เป็น – (ลบ) หมายความวา่ ขอ้ มลู ทังสองมีความสมั พนั ธ์ลกั ษณะตรงข้ามกนั
4. การพจิ ารณาตัดสินค่าสมั ประสิทธ์ิสหสัมพนั ธว์ ่าอยู่ในระดับสงู กลาง ต่า อาจพิจารณากว้างๆ ดงั นี
4.1 ค่าสัมประสิทธ์สิ หสัมพันธใ์ กล้ 1.00 (ประมาณ 0.71- 0.90) แสดงว่ามคี วามสัมพันธ์อย่ใู น
ระดบั สงู ถ้าสูงกว่า 0.90 ขึนไป ถอื ว่าสงู มาก
4.2 คา่ สัมประสทิ ธส์ิ หสัมพันธ์ใกล้ 0.50 (ประมาณ 0.30 ถึง 0.70) แสดงว่ามีความสัมพนั ธ์อยู่
ในระดบั ปานกลาง
4.3 ค่าสัมประสิทธ์ิสหสัมพันธ์ใกล้ 0.00 (ประมาณ 0.29 ลงมา) แสดงว่ามีความสัมพันธ์อยู่ใน
ระดบั ตา่
4.4 ถ้าขอ้ มูลทัง 2 ชุด มีลกั ษณะท่ีเหมือนกันทุกประการในทศิ ทางเดยี วกัน ค่าสหสัมพันธ์จะ
มีค่าเป็น 1.00 เรียกว่ามีความสัมพันธ์อย่างสมบูรณ์ (Perfect Relationship) แต่ถ้าข้อมูล 2 ชุด มีลักษณะ
ตรงกันขา้ มกันทกุ กรณี คา่ สหสัมพนั ธ์จะเท่ากบั -1.00
4.5 คา่ สมั ประสทิ ธ์สหสัมพนั ธ์เป็น 0.00 แสดงว่าข้อมูลทงั 2 ชุดนัน ไมม่ คี วามสมั พนั ธก์ ันเลย
เปอรเ์ ซ็นตไ์ ทล์
ตาแหนง่ เปอร์เซน็ ต์ไทล์ (Percentile) หมายถงึ ตาแหน่งที่แสดงให้ทราบวา่ มีจานวนคะแนนที่ตา่ กว่า
คะแนนตวั นันอย่รู ้อยละเท่าไร เชน่ นายแดงสอบได้ 75 คะแนน ตรงกับเปอรเ์ ซ็นตไ์ ทล์ ที่ 60 หมายความ
ว่า มีนักเรียนไดค้ ะแนนตา่ กว่า 75 คะแนน อยู่ร้อยละ 60
นายดา สอบได้ 81 คะแนน ตรงกับเปอร์เซ็นต์ไทล์ ที่ 72 หมายความว่ามีนักเรียนท่ีได้คะแนนน้อย
กวา่ นายดาหรอื หรอื น้อยกวา่ 81 คะแนนอยู่ร้อยละ 72 หรือคดิ เปน็ 72 คนจากคนทงั หมด 100 คน
นายเขยี วสอบได้ 63 คะแนน ตรงกับเปอรเ์ ซ็นต์ไทล์ที่ 56 หมายความว่า มนี กั เรียนที่ไดค้ ะแนนนอ้ ย
กว่านายดาหรอื นอ้ ยกว่า 56 คะแนนอยู่ร้อยละ 56 หรือคดิ เปน็ 56 คนจากคนทงั หมด 100 คน
การกวาัดรวแัดลแะลปะรปะรเะมเินมผนิ ลผกลการาเรรเรียียนนรรู้ ู้ 8383
การคานวณหาค่าเปอรเ์ ซ็นต์ไทล์ ทาไดด้ งั นี (ชวาล แพรตั กลุ , 2552, น. 268 – 269)
1. เรียงคะแนนหรอื จดั ชนั ของคะแนนจากมาก–นอ้ ย โดยใหค้ ะแนนนอ้ ยอยู่ลา่ ง (ดูตารางชอ่ งที่ 1)
2. หาความถข่ี องคะแนนหรอื ชว่ งคะแนน (ตารางชอ่ งที่ 2)
3. หาความถีส่ ะสม (Cumulative frequency: cf) ของคะแนน (ดูตารางชอ่ งที่ 3)
4. หาความถขี่ องครง่ หนึ่งของแต่ละคะแนนหรือชว่ งคะแนน ( 1 f ) (ดูตารางชอ่ งที่ 4)
2
5. หาความแตกตา่ งระหวา่ ง cf กับ 1 f ของคะแนนแต่ละชนั (ดตู ารางช่องท่ี 5)
2
6. นาค่า cf - 1 f มาคูณกับ 100 ได้แล้วนาไปใส่ไว้ในช่อง 100 (cf - 1 f ) (ดูตารางช่องท่ี
2n n2
6) ผลการคานวณ เป็นตาแหนง่ เปอรเ์ ซ็นต์ไทล์ของแต่ละคะแนน
ตัวอย่ำง
(1) (2) (3) (4) (5) (6)
X f cf 1f cf - 1 f 100(cf – 1 f)
n2
2 2
35 1 85 0.5 84.5 99.41
33 2 84 1.0 83.0 97.65
32 2 82 1.0 81.0 95.29
31 3 80 1.5 78.5 92.35
30 3 77 1.5 75.5 88.82
28 4 74 2.0 72.0 84.71
27 5 70 2.5 67.5 79.41
26 7 65 3.5 61.5 72.35
24 9 58 4.5 53.5 62.94
23 12 49 6.0 43.0 50.59
20 11 37 5.5 31.5 37.06
19 8 26 4.0 22.0 25.88
18 6 18 3.0 15.0 17.65
17 4 12 2.0 10.0 11.76
16 3 8 1.5 6.5 7.65
14 2 5 1.0 4.0 4.71
13 2 3 1.0 2.0 2.35
8 1 1 0.5 0.5 0.59
n = 85
84 การวัดกแาลระวปดั รแะลเะมปนิ รผะลเกมาินรเผรลียกนารรู้ เรียนรู้ 84
จากตัวอย่างคะแนน 30 คะแนน ตรงกับตาแหนง่ เปอร์เซ็นต์ไทล์ที่ 88.82 หมายความวา่ มีคน
ท่ีไดค้ ะแนนต่ากว่า 30 คะแนน อยู่ 89 คนจากคนทงั หมด 100 คน
คะแนนมำตรฐำน (Standard Score)
คะแนนมาตรฐาน หมายถึง คะแนนดบิ ที่แปลงรูปใหม้ ีหน่วยวัดเท่ากัน เพ่ือใหส้ ามารถนาเปรียบเทยี บ
หรอื รวมกันอย่างมีความหมาย ทังนีเพราะคะแนนดิบหรอื คะแนนสอบแตล่ ะวชิ า ไมส่ ามารถนามารวมกนั หรือ
เปรียบเทียบกันได้ เน่ืองจากสาเหตุบางประการ เช่น คะแนนเต็มไม่เท่ากัน ข้อสอบต่างชุดกัน การ
กระจายของคะแนนตา่ งกัน เปน็ ตน้
คะแนนมาตรฐานท่ีใช้อยู่มหี ลายประเภท เชน่ คะแนนมาตรฐานซี (Z - Score) คะแนนมาตรฐาน
ที (T - Score), CEEB - Score, AGCT Score, ITED - Score เป็นตน้
ประโยชนข์ องคะแนนมาตรฐาน
1. ใช้ในการเปรียบเทียบข้อมูลต่างชุดกัน โดยเปล่ียนคะแนนดิบของแต่ละชุดให้เป็นคะแนน
มาตรฐาน แล้วนามาเปรียบเทียบกัน
2. การหาคะแนนรวมโดยการทดสอบ เนื่องจากแตล่ ะวิชานาหนักคะแนนไม่เท่ากนั นามารวมกัน
ไมไ่ ด้ จาเป็นตอ้ งเปลี่ยนเป็นคะแนนมาตรฐานเสยี กอ่ น แล้วจงึ นามารวมกัน
การแปลงคะแนนดบิ เป็นคะแนนมาตรฐานดังกลา่ ว จะต้องอาศยั พืนฐานท่สี าคัญ คือ ค่าเฉลย่ี ( X)
และส่วนเบ่ียงเบนมาตรฐาน (S) ดังนี (โกวิท ประวาลพฤกษ์ และสมศกั ดิ์ สินธรุ ะเวชญ์, 2527, น. 326 - 327)
1. คะแนนมำตรฐำนซี (Z - Score) เป็นคะแนนมาตรฐานท่มี ีคา่ เฉลย่ี เปน็ 0 และสว่ นเบ่ียงเบน
มาตรฐานเป็น 1 การปรับคะแนนดิบเป็นคะแนนมาตรฐานซี (Z - Score) ซ่ึงคิดคานวณได้จาก ความ
แตกต่างระหว่าง คะแนนดิบของคะแนนแต่ละบุคคลกับคะแนนเฉล่ีย ( X) ของคะแนนกลุ่มนัน หารด้วย
ค่าส่วนเบี่ยงเบนมาตรฐาน (S) หรือคานวณได้จากสตู ร ดงั นี
Z - Score = X X
S
ตัวอย่ำง ผลการสอบวิชาภาษาไทยของนักเรียน ชัน ป. 6 จานวน 40 คน หาค่าเฉลี่ยได้
71 คะแนน และส่วนเบี่ยงเบนมาตรฐาน 18 ธงชัยสอบได้ 85 คะแนน มาลีสอบได้ 49 คะแนน จึง
เปลย่ี นคะแนนของธงชัยและมาลเี ปน็ คะแนนซี (Z - Score)
วธิ ีทำ จากสูตร Z - score = X X
S
85 71
Z - score ของธงชยั 18 = 0.78
Z - score ของมาลี 49 71 = -1.22
18
การวดั และประเมินผลการเรยี นรู้ 85
การวดั และประเมนิ ผลการเรียนรู้ 85
2. คะแนนมำตรฐำนที (T - Score หรือ Standard T Score) เป็นคะแนนแปลงรูปชนิดที่มี
ค่าเฉลย่ี (X) เปน็ 50 สว่ นเบ่ยี งเบนมาตรฐาน (S) เป็น 10 สามารถหาคะแนนจากคะแนน Z - Score ไดด้ ังนี
T -score = 10 Z + 50
เชน่ มาลสี อบได้คะแนน Z = -1.22
T-score ของเขาจะได้เทา่ กับ (10 x -1.22)+50 = 37.8 คะแนน
3. คะแนนมำตรฐำน (CEEB - Score)
CEEB ย่อมาจาก Collage Entrance Examination Board T Score เป็นคะแนนชนิด
หนึ่งท่ีขยายเฉลี่ย ( X) และส่วนเบ่ียงเบนมาตรฐาน (SD) ให้มากขึน คือ X =500 และ S =100 ใช้
สตู รปรบั จากคะแนน Z - Score ดงั นี
CEEB – Score = 100Z +500
เชน่ นักเรยี นคนหนึง่ สอบวชิ าภาษาไทยคดิ เปน็ คะแนนซี (Z - Score) ได้ 1.50
CEEB - Score ของเขาจะได้เทา่ กับ (100x1.50) + 500 = 650 คะแนน
4. คะแนนมำตรฐำน (AGCT – Score)
AGCT ย่อมาจาก Army General Classification Test จัดเป็นคะแนนแปลงรูปหรือคะแนน
มาตรฐานอีกชนิดหน่ึง ซ่ึงเปลี่ยนแปรรปู คะแนนโดยให้ค่าเฉล่ียเป็น 100 และค่าสว่ นเบ่ียงเบนมาตรฐานเป็น
20 ใชส้ ตู รปรบั จากคะแนน Z - Score ดังนี
AGCT-score = 20 Z +100
เชน่ นักเรยี นสอบวชิ าภาษาไทยคิดเปน็ คะแนนซี (Z - Score) ได้ 1.50
AGCT - Score ของเขาจะเทา่ กบั (20x1.50) + 100 = 130 คะแนน
5. คะแนนมำตรฐำน (ITED - Score)
ITED ย่อมาจาก Iowa Test of Educational Development คะแนนมาตรฐานอีกประเภท
หนง่ึ ทีใ่ ชค้ ่าเฉลย่ี เป็น 15 และสว่ นเบี่ยงเบนมาตรฐานเปน็ 5 ใช้สูตรปรับจากคะแนน Z-score ดงั นี
ITED - Score = 5Z + 15
6. คะแนนทปี กติ (Normalized T - Score)
คะแนนทีปกติ หมายถึง คะแนนท่ีได้จากข้อมูลท่ีมีการกระจายเป็นโค้งปกติ คะแนนทีปกติ
เหมือนกับคะแนนที (T - Score) ต่างกันตรงที่คะแนนทีปกตินัน คะแนนมีการแจกแจงความถ่ีเป็นโค้งปกติ
(Norm Curve)
การแปลงคะแนนดิบเป็นคะแนนทีปกติตามวิธีดาเนนิ การ ดังนี (ชวาล แพรตั กุล, 2552, น. 268
– 270)
86 การวดั และประเมนิ ผลการเรียนรู้ 86
การวัดและประเมินผลการเรียนรู้
1. เรียงคะแนนหรอื จัดชนั ของคะแนนจากมาก – นอ้ ย โดยใหค้ ะแนนนอ้ ยอย่ลู ่าง (ดูตารางช่องที่ 1)
2. หาความถี่ของคะแนนหรือช่วงคะแนน (ตารางช่องที่ 2)
3. หาความถสี่ ะสม (cf = cumulative frequency) ของคะแนน (ดตู ารางช่องที่ 3)
4. หาความถี่ของครง่ หนึง่ ของแต่ละคะแนนหรอื ชว่ งคะแนน ( 1 f ) (ดตู ารางชอ่ งท่ี 4)
2
5. หาความแตกต่างระหว่าง cf กับ 1 f ของคะแนนแต่ละชัน (ดตู ารางช่องที่ 5)
2
6. นาค่า cf - 1 f มาคูณกับ 100 ได้แล้วนาไปใสไ่ ว้ในช่อง 100 (cf - 1 f ) (ดูตารางชอ่ งท่ี 6)
2n n2
ผลการคานวณ เป็นตาแหน่งเปอรเ์ ซ็นต์ไทล์ของแต่ละคะแนน
7. นาค่าตัวเลขที่ได้ในช่อง 6 ไปเปิดหาคะแนนทีจากตาราง ดังนันจึงทาการเปลยี่ นค่าเปอร์เซนไทล์
เป็นคะแนนทีปกติ (ดงั แสดงไว้ในหนา้ ต่อไป)
(1) (2) (3) (4) (5) (6) (7)
X f cf 1f cf - 1 f 100(cf – 1 f) T - Score
n2
2 2
35 1 85 0.5 84.5 99.41 75
33 2 84 1.0 83.0 97.65 70
32 2 82 1.0 81.0 95.29 67
31 3 80 1.5 78.5 92.35 64
30 3 77 1.5 75.5 88.82 62
28 4 74 2.0 72.0 84.71 60
27 5 70 2.5 67.5 79.41 58
26 7 65 3.5 61.5 72.35 56
24 9 58 4.5 53.5 62.94 53
23 12 49 6.0 43.0 50.59 50
20 11 37 5.5 31.5 37.06 47
19 8 26 4.0 22.0 25.88 44
18 6 18 3.0 15.0 17.65 41
17 4 12 2.0 10.0 11.76 38
16 3 8 1.5 6.5 7.65 36
14 2 5 1.0 4.0 4.71 33
13 2 3 1.0 2.0 2.35 30
8 1 1 0.5 0.5 0.59 25
n = 85
การกวาดั รแวัดลแะลปะรปะรเมะเินมผินลผกลากราเรรเียรียนนรรู้ ู้ 8787
T-score
ตำรำง สาหรับเปลีย่ นค่าเปอร์เซ็นไทล์ เปน็ คะแนนทีปกติ มีดงั นี
Percent T-score Percent T-score Percent 68
.0032 10 13.57 39 96.41 69
.0048 11 15.87 40 97.13 70
.007 12 18.41 41 97.72 71
.011 13 21.19 42 98.21 72
.016 14 24.20 43 98.61 73
.023 15 27.43 44 98.93 74
.034 16 30.85 45 99.18 75
.048 17 34.46 46 99.38 76
.069 18 38.21 47 99.53 77
.097 19 42.07 48 99.56 78
.13 20 46.02 49 99.74 79
.19 21 50.00 50 99.81 80
.26 22 53.98 51 99.865 81
.33 23 57.93 52 99.903 82
.47 24 61.79 53 99.931 83
.62 25 65.54 54 99.952 84
.82 26 69.15 55 99.966 85
1.07 27 72.59 56 99.977 86
1.39 28 75.80 57 99.984 87
1.79 29 78.81 58 99.9890 88
2.28 30 81.59 59 99.9928 89
2.87 31 84.13 60 99.9952 90
3.59 32 86.43 61 99.9952
4.46 33 88.49 62
5.46 34 90.32 63
6.68 35 91.52 64
8.08 36 93.32 65
9.68 37 94.52 66
11.51 38 95.54 67
88 การวดักแาลระวปัดรแะลเะมปนิ รผะลเกมานิรเผรลยี กนารรู้ เรียนรู้ 88
ขอ้ สังเกตท่ีเกย่ี วกับคะแนนทีปกติ (Normalized T - Score)
1. คะแนนทีปกติ คิดคานวณจากตาแหน่งท่ีสอบได้ของนักเรียนมิได้คิดจากคะแนนดิบเหมือน
คะแนนที (T - Score)
2. คะแนนทปี กตสิ ูงสุด จะเป็นเท่าไหร่ขนึ อยกู่ ับจานวน (n) ถา้ จานวนคนมากคะแนนทสี งู สดุ จะสงู
คะแนนตา่ สุดจะลดลง
3. คะแนนทีปกติสงู สุดบวกกับคะแนนทีต่ ่าสดุ จะเทา่ กบั 100 (โดยประมาณ)
การวดั และประเมนิ ผลการเรยี นรู้ 89
บทที่ 6
การประเมนิ ผลการเรยี นรตู้ ามสภาพจริง
การประเมินผลการเรียนรู้ตามสภาพจริงเป็นการใช้เทคนิคประเมินผลท่ีใช้วิธีการหลากหลาย มีความ
สอดคล้องเหมาะสม และคลอบคลุมสิ่งท่ีตอ้ งการประเมิน เป็นการประเมนิ ในขณะที่ผู้เรียนลงมือปฏิบตั ิ จนได้
ผลงานที่สาเร็จสมบูรณ์ ซึ่งการประเมินผลการเรียนรู้ตามสภาพจริงนี้จะต้องสอดคล้องกับจุดประสงค์การ
เรียนรู้ โดยกาหนดเกณฑ์และภาระงาน (Task) เพื่อให้ผู้เรียนได้แสดงความสามารถหรือแสดงผลงานการ
ปฏิบัติ (Performance) และเกณฑ์ท่ีจะนามาใช้ประกอบการพิจารณาประเมินผลตามสภาพจริงนั้น
ประกอบด้วย เกณฑร์ ะดับคณุ ภาพและเกณฑก์ ารพิจารณาการตัดสนิ การประเมินผลการเรยี นรตู้ ามสภาพจริง
ในชัน้ เรยี นสามารถแสดงเป็นแผนผงั มโนทัศน์ ได้ดงั น้ี
-
-
แนวทางการสรา้ งเครอ่ื งมือการประเมนิ ผลการเรยี นร้ตู ามสภาพจริง
การสร้างเคร่ืองมือประเมินตามสภาพจริงในชั้นเรียนน้ัน มีข้ันตอนการสร้างดังต่อไปนี้ (ส.วาสนา
ประวาลพฤกษ์, 2544, น. 1)
1. วิเคราะห์จุดประสงค์การเรียนรู้ เป็นจุดประสงค์เชิงพฤติกรรม (Behavioral Objective)ท่ีระบุ
พฤติกรรมที่ต้องการให้เกิดข้ึนอย่างชัดเจน สามารถวัดหรือสังเกตเห็นได้ท้ังด้านความรู้ความเข้าใจทักษะ
กระบวนการ และดา้ นจิตใจ เชน่
1.1 บอกหลักเกณฑ์วธิ ีการเขียนเร่อื งจากภาพได้ (ท.2.1.1) (ความรู้ ความเขา้ ใจ)
1.2 เขียนเร่อื งจากภาพที่กาหนดได้ (ท.2.1.1) (ทักษะ/กระบวนการ)
1.3 มมี ารยาทในการเขียนและนิสัยรักการเขยี น (ท.2.1.2) (จติ ใจ)
90 การวัดกแาลระวปดั รแะลเะมปนิ ผระลเกมานิรเผรลียกนารรู้ เรยี นรู้ 90
2. ออกแบบกิจกรรมการเรียนรู้หรือภาระงานการปฏิบัติ (Performance Tasks) เป็นงานหรือ
กิจกรรมท่ีผู้เรียนเป็นผู้ปฏิบัติจริง อาจกาหนดขึ้นโดยครู นักเรียนหรือร่วมกันกาหนด โดยมีเง่ือนไข (Condition)
เป็นตัวกาหนดให้ผู้เรียนเกิดการเรียนรู้จนสามารถสรุปเป็นภาระงานได้จนสาเร็จ ภาระงานที่ปฏิบัติสามารถ
นาเสนอในลักษณะต่างๆ ดงั น้ี
2.1 ผลผลติ หรอื ผลงาน เช่น จดหมาย เรยี งความ ภาพวาด ช้ินงาน ฯลฯ
2.2 ผลการกระทา หรือ พฤติกรรม เช่น การรายงานปากเปลา่ การโตว้ าที การอ่าน ทานองเสนาะ
การเล้ยี งลูกฟุตบอล การรับลกู มอื ฯลฯ
2.3 กระบวนการ เชน่ การทดลอง การเขยี น การอ่าน การคดิ แก้ปัญหา ฯลฯ
ตวั อย่างท่ี 1 การออกแบบภาระงานการปฏบิ ตั ิ
ภาระงานทีป่ ฏบิ ัติ : การเขยี นเร่ืองจากภาพ
เงอ่ื นไขที่กาหนด
สมมตวิ า่ นักเรียนได้รับการคัดเลือกให้เปน็ ตัวแทนของโรงเรียนเขา้ ร่วมการแข่งขนั เรียงความในระดบั เขต
พื้นท่กี ารศกึ ษา นักเรียนจบั สลากเลือกหวั ข้อการเขยี นเรยี งความได้ “การเขยี นเรือ่ งจากภาพ” นกั เรียนจะเลือก
เขยี นเรือ่ งจากภาพอะไร เพราะเหตใุ ดนักเรียนมวี ธิ กี ารเขียนเร่อื งอย่างไร ใหเ้ ขียนเรื่องไม่เกนิ 1 หน้ากระดาษ
พร้อมทั้งตง้ั ชื่อเรอ่ื ง
3. เลือกวิธีการและเครอื่ งมอื วดั และประเมนิ ผล
เป็นการเลือกวิธีการวัดและประเมินผลให้สอดคล้องกับจุดประสงค์การเรียนรู้ที่กาหนดไว้ โดย
วิธีการเลือกวิธีการวัดผล และประเมินผลท่ีดีที่สุด เหมาะสมกับภาระงานท่ีกาหนด และให้มีความชัดเจน
สามารถมองภาพการปฏิบัติงานของผู้เรียนมากที่สุด
ตวั อยา่ งที่ 2 การกาหนดวิธีการและเคร่อื งมือวดั และประเมินผล วิธกี ารวัด/เครือ่ งมอื วดั ผล
จดุ ประสงคก์ ารเรียนรู้ ผลงาน/พฤตกิ รรม/กระบวนการ การสงั เกต
1. บอกหลักเกณฑ์ วิธีการเขียน คาตอบของผู้เรยี น
เร่ืองจากภาพได้ (แบบสงั เกตการณต์ อบคาถาม)
2. เขยี นเรอ่ื งจากภาพได้ เรอื่ งทเ่ี ขยี น การตรวจผลงาน
3. มีมารยาทในการเขียนและ พฤติกรรมขณะเขยี นเรื่อง (แบบบนั ทึกคะแนน)
นิสัยรักการเขียน การสังเกต
(แบบสงั เกตพฤตกิ รรม)
ภาราสดแกภภภภภดด
การกวาัดรวแดัลแะลปะรปะรเะมเินมผนิ ลผกลากราเรรเียรยีนนรรู้ ู้ 9191
4. สร้างเครอ่ื งมือวัดและประเมินผลการเรยี นรู้
ในข้ันตอนนี้ ครูจะต้องศึกษาเกี่ยวกับเคร่ืองมือการวัดและประเมินผลการเรียนรู้ให้เหมาะสมกับ
ลกั ษณะของข้อมูลหรือพฤตกิ รรมท่ีตอ้ งการเก็บ โดยจะต้องกาหนดหลักเกณฑ์การประเมนิ ตามสภาพจริงเพื่อเป็น
แนวทางในการประเมิน การสร้างเครื่องมือเพื่อเก็บรวบรวมข้อมูลหรือแบบบันทึกต่าง ๆ ของการประเมินตาม
สภาพจริง มรี ายละเอียดดังต่อไปนี้
4.1 กาหนดเกณฑ์การประเมินผลตามสภาพจริง (Rubrics)
ในการสร้างเคร่ืองมือวัดและประเมินผลนั้นเม่ือครูกาหนดบัตรงานหรือใบงาน ที่ระบุคาส่ังให้
นักเรียนปฏิบัติโดยอาจปฏิบัติเป็นรายบุคคลหรือกลุ่มก็ได้ ครูจะต้องกาหนดเกณฑ์ระดับคุณภาพและเกณฑ์การ
พิจารณาตัดสินผลงานที่เกิดจากการปฏิบัติของผู้เรียน เกณฑ์นี้จะเป็นระดับคะแนนและคาอธิบายระดับคะแนน
ซงึ่ เรียกว่า การให้คะแนนแบบรูบริคส์ (Rubrics scoring) ซ่ึงหมายถึง กฎหรอื กติกา (Rule) ที่ใช้เป็นแนวทางในการ
ให้คะแนน (Scoring Guide) ท่ีผู้ประเมินสามารถบอกหรืออธิบายคะแนนท่ีให้ได้ หรือ เพ่ือให้ง่ายข้ึน เราอาจใช้คา
ว่ารูบรคิ ส์ แทนคาอธิบายตวั เลขหรอื คะแนนสาหรบั การประเมินตามสภาพจริงก็ได้
สาหรับการกาหนดรูบริคส์ เพอื่ เป็นเกณฑ์การประเมนิ ประกอบดว้ ย
1) รายการประเมิน หรือหลักเกณฑ์การพิจารณา (Criteria) เป็นส่วนท่ีระบุถึงรายการที่จะใช้
พิจารณาชน้ิ งานหนึง่ ๆ เปน็ องค์ประกอบท่วี เิ คราะหจ์ ากชนิ้ งานน้นั
2) คาอธิบายคุณภาพของรายการประเมินในแต่ระดับคุณภาพ เช่น ดีมาก ดี พอใช้ ต้องปรับปรุง
โดยใช้คาอธิบายระดับคณุ ภาพให้ชัดเจน กระชับที่สุด เปน็ คาอธิบายที่จะสามารถบอกให้รู้ได้ว่าทาไมจึงดีมาก หรือ
ตอ้ งปรับปรุง (อาจใช้ระดับตวั เลข เชน่ 4, 3, 2, 1, 0)
การประเมินตามสภาพจริงโดยใช้ Rubrics น้ัน มีแนวคิดการให้คะแนนเป็น 2 รูปแบบ คือ
(ทวิ ตั ถ์ มณโี ชติ, 2549, น. 39)
4.1.1 เกณฑ์การให้คะแนนแบบภาพรวม (Holistic Rubrics) เป็นแนวทางการให้คะแนน
โดยพิจารณาจากภาพรวมของชิ้นงานแล้วให้เป็นคะแนน หรืออาจจะจัดชิ้นงานให้เป็นระดับคุณภาพ เช่น
แบ่งออกเป็น 3 ระดับ (ดี พอใช้ ปรับปรงุ ) หรือ 4 ระดับ (ดีมาก ดี พอใช้ ปรบั ปรุง) หรือ อาจใช้เปน็ จานวน
ตวั เลข 3, 2, 1, หรือ 4, 3, 2, 1 กไ็ ด้ ตามความเหมาะสม การให้คะแนนจะพจิ ารณาผลรวมหรอื รวมทง้ั หมด
92 การวดักแาลระวปดั รแะลเะมปินรผะลเกมานิ รเผรลียกนารรู้ เรียนรู้ 92
ตัวอยา่ งท่ี 3 การประเมินความสามารถในการพดู นาเสนอข้อมลู
การพูด ระดับคะแนน
นา
เสนอ 43 2 10
ขอ้ มลู
พูดตรง มี 3 รายการ ม2ี รายการจาก มี 1 รายการจาก มี 1 รายการจาก
ประเดน็ จากระดบั คณุ ภาพ ระดับคณุ ภาพระดบั 4 ระดบั คุณภาพระดบั 4 ระดบั คุณภาพระดับ 4
ลาดบั เนื้อหา ระดบั 4 คะแนน คะแนนหรือมี 3 รายการ คะแนนหรือมี 2 รายการ คะแนนหรือมี 1 - 4
ระ ัดบ ุคณภาพ มคี วามตอ่ เนอ่ื ง หรอื มี 4 รายการ จากคุณภาพระดับ 4 จากคุณภาพระดับ 4 รายการจากคณุ ภาพ
แสดงแนวคิด จากคณุ ภาพระดบั 4 คะแนน แตค่ ณุ ภาพบาง คะแนน แต่คณุ ภาพบาง ระดับ 4 คะแนน แต่
ชัดเจน คะแนน แตค่ ุณภาพ รายการตอ้ งปรบั ปรุงบ้าง รายการตอ้ งปรับปรงุ บา้ ง คณุ ภาพบางรายการ
ออกเสยี ง บางรายการตอ้ ง หรอื มี 4 รายการจาก หรอื มี 3 รายการจาก ต้องปรับปรุงอย่างมาก
ถกู ตอ้ งชดั เจน ปรับปรงุ คุณภาพระดบั 4 คะแนน คุณภาพระดับ 4 คะแนน
แต่คุณภาพหลายรายการ แต่คณุ ภาพหลายรายการ
ต้องปรบั ปรงุ อยา่ งมาก ตอ้ งปรบั ปรุงอย่างมาก
หรอื อาจกาหนดคะแนนและเขียนคาอธิบายความหมายของคะแนนแต่ละคะแนนอย่างละเอียดซึ่ง
นิยมใช้คาขยายช่วยเพื่อให้เห็นถึงความแตกต่างของคะแนน เช่น มาก-น้อย-ค่อนข้าง-เสมอ-บ่อย-บ้าง-
บางคร้ัง-สว่ นใหญ่-สว่ นน้อย-ทุกครัง้ -บางคร้ัง ฯลฯ
ตัวอยา่ งท่ี 4 การประเมนิ การรบั -ส่งลกู ฟตุ บอลเป็นกลมุ่
คะแนน ความหมายของคะแนน
2 - เรียงลาดับการรับ และส่งลูกฟุตบอลได้ถูกต้อง เร่ิมต้ังแต่การยืน การวางมือ การส่งลูก
ฟตุ บอลท้งั หลงั เท้าด้านใน หลงั เท้าดา้ นนอก และใหค้ วามร่วมมือในการทางานกลมุ่ ดี
1 - เรยี งลาดับการรบั และส่งลกู ฟุตบอลได้ถกู ต้อง แต่ไมค่ ่อยใหค้ วามรว่ มมือในกลุ่ม
0 - เรียงลาดบั การรับ และส่งลกู ฟุตบอลไดด้ บี างรายการ และให้ความร่วมมือกับกลมุ่ ดี
- เรยี งลาดบั การรับ และสง่ ลกู ฟตุ บอลไม่ถกู ตอ้ ง และไมค่ ่อยให้ความรว่ มมอื ในกลุ่ม
- เรียงลาดับการรบั และส่งลูกฟุตบอลไมไ่ ด้