The words you are searching are inside this book. To get more targeted content, please make full-text search by clicking here.

หนังสือวิธีการและเครื่องมือประเมินการเรียนรู้ของผู้เรียน เหมาะสำหรับครูผู้สอน อาจารย์มหาวิทยาลัย นักศึกษาวิชาชีพครูสำหรับการศึกษาทำความเข้าใจเกี่ยวกับความรู้พื้นฐานทางด้านการทดสอบ การวัด และการประเมินผลการเรียนรู้ของผู้เรียน

Discover the best professional documents and content resources in AnyFlip Document Base.
Search

หนังสือวิธีการและเครื่องมือประเมินการเรียนรู้ของผู้เรียน

หนังสือวิธีการและเครื่องมือประเมินการเรียนรู้ของผู้เรียน เหมาะสำหรับครูผู้สอน อาจารย์มหาวิทยาลัย นักศึกษาวิชาชีพครูสำหรับการศึกษาทำความเข้าใจเกี่ยวกับความรู้พื้นฐานทางด้านการทดสอบ การวัด และการประเมินผลการเรียนรู้ของผู้เรียน

Keywords: เครื่องมือประเมินการเรียนรู้,การทดสอบ การวัด และการประเมินผลการเรียนรู้

90 วิธีการและเครอ่ื งมือประเมนิ การเรียนร้ขู องผเู้ รยี น 90

จากขอ้ มูลในตารางแทนคา่ สูตรคานวณค่าความยากและอานาจจาแนกของขอ้ สอบขอ้ ที่ 1 ดงั น้ี

p  SH  SL  (2NX min ) r  SH  SL
2N(X max  X min ) N(X max  X min )

 285  148  (2)(10)(8)  285 148
2(10)(44 - 8) 10(44 - 8)

 433 160  137
(20)(36) 360

 273  0.38
720

 0.38

สาหรับเกณฑใ์ นการพิจารณาคุณภาพของขอ้ สอบอตั นยั ใชเ้ กณฑเ์ ดียวกบั ขอ้ สอบเลือกตอบหลาย
ตวั เลือก คือ ขอ้ สอบท่ีมีคุณภาพจะมีค่าความยากอยรู่ ะหวา่ ง 0.20 ถึง 0.80 และค่าอานาจจาแนกมีค่าต้งั แต่
0.20 ข้ึนไป

กำรคัดเลือกข้อสอบจำกผลกำรวเิ ครำะห์ข้อสอบ
เมื่อวิเคราะห์ขอ้ สอบไดค้ ่าความยากง่ายและอานาจการจาแนกแลว้ ควรนามาจดั ทากราฟ ซ่ึงจะ
แสดงการกระจายของขอ้ สอบและช้ีใหเ้ ห็นวา่ ขอ้ สอบขอ้ ใดบา้ งที่อยใู่ นเกณฑใ์ ชไ้ ดห้ รือใชไ้ มไ่ ด้

ภำพที่ 3.8 กราฟพิจารณาการคดั เลือกขอ้ สอบจากผลการวเิ คราะห์ขอ้ สอบรายขอ้
ระดบั ควำมยำก (p)

1.00 ง่ำยเกนิ ไป แต่จำแนกได้

ง่ำยเกนิ ไป

0.8 จำแนกตำ่

0.6 ยำก ่งำยพอเหมำะ
0.4 เป็ นข้อสอบทใ่ี ช้ได้แ ่ตจำแนกไ ้ดต่ำ

0.2 ยำกเกนิ ไป แต่จำแนกได้ อำนำจจำแนก (r)
0.4 0.6 0.8 1.00
ยำกเกนิ ไป
จำแนกตำ่

0 0.2

91 ผูช้ ่วยศาสตราจารย์ ดร.จตุภูมิ เขตจัตุรสั 91

สำหรับแบบวดั
ส่วนใหญ่แบบวดั จะมุ่งตรวจสอบรายขอ้ เพื่อดูอานาจจาแนกวา่ จาแนกคนกลุ่มสูงและกลุ่มต่าได้
หรือไม่ โดยใชส้ ถิติทดสอบที (t-test) ในการทดสอบ ส่วนความยากจะไม่มีการตรวจสอบ
ตวั อยา่ งเช่นการพจิ ารณาอานาจจาแนกของแบบวดั เจตคติวา่ ขอ้ ความแต่ละขอ้ มีอานาจจาแนกผู้
ที่มีเจตคติสูงกบั มีเจตคติต่าแตกต่างกนั หรือไม่ นน่ั คือพยายามหาว่าขอ้ ความขอ้ น้ัน ถา้ ใครตอบใน
ระดับสูงแสดงว่ามีเจตคติสูง ถ้าใครตอบระดับต่าจะเป็ นคนมีเจตคติต่าจริงหรือไม่นั่นเอง การจะ
สามารถบอกได้ดงั กล่าวมาแลว้ จะตอ้ งเอาขอ้ ความท้งั หลายไปเก็บขอ้ มูลผลการวดั จากกลุ่มตวั อย่าง
เมื่อวดั เสร็จแลว้ นามาตรวจให้คะแนนแต่ละขอ้ สาหรับขอ้ ความทางลบตอ้ งมีการให้คะแนนในลกั ษณะ
ตรงกนั ขา้ มกบั ขอ้ ความทางบวก (Re-scale) แลว้ รวมคะแนนเป็นของแต่ละคน

ตวั อยา่ งเช่น ขอ้ ความ (items) มี 100 ขอ้ มีระดบั การวดั 4 ระดบั คนท่ีไดเ้ จตคตินอ้ ยท่ีสุดจะได้
คะแนน 100 คะแนนสูงสุด 400 เอาคะแนนแต่ละคนเรียงกนั ตามลาดบั แลว้ ตดั กลุ่มไดค้ ะแนนสูง
25% และกลุ่มไดค้ ะแนนต่า 25% จากน้นั เอาแต่ละขอ้ มาแจกแจงความถ่ีวา่ แต่ละขอ้ แต่ละระดบั ว่ามี
จานวนคนกลุ่มสูงตอบเท่าไร คนกลุ่มต่าตอบเทา่ ไร ดงั ตวั อยา่ งการคานวณภาพที่ 3.9
ภำพท่ี 3.9 แสดงการจาแนกคะแนนกลุ่มสูงและกลุ่มต่าที่ทาแบบวดั เจตคติในขอ้ ท่ี I
กลุ่มสูง กลุ่มต่า
XfXf
5 20 5 -
4 38 4 2
3 12 3 18
2 5 2 30
1 - 1 25
75 75
X = 3.97 X = 1.96

S2 = 0.70 S2 = 0.69

เมื่อไดก้ ารแจกแจงแลว้ คานวณหาคะแนนเฉล่ียของกลุ่มสูงและกลุ่มต่า หาความแปรปรวน
ของกลุ่มสูงและกลุ่มต่า แลว้ ใชส้ ูตรการหาอานาจจาแนกตามแนว Edwards โดยใช้ t-test และถือวา่
ถา้ t มีค่ามากกวา่ 1.75 ข้ึนไปเป็นขอ้ ที่มีอานาจจาแนกใชไ้ ด้ (Edwards, 1957)
XH -XL
t= S2H +-1S.n92L6L
จากตวั อยา่ ง t= 3n.9H7 0.69 = 2.01 /0.14 = 14.38
0.70 75
75 +

ดงั น้นั ขอ้ น้ีใชไ้ ด้ เพราะ t มากกวา่ 1.75 (t > 1.75)

92 วิธีการและเครอื่ งมือประเมินการเรยี นรูข้ องผเู้ รยี น 92

สำหรับแบบประเมินทกั ษะกำรปฏิบัติ
กมลวรรณ ตังธนกานนท์ (2559) ได้นาเสนอวิธีการตรวจสอบคุณภาพเครื่องมือประเภท
ประเมินทกั ษะการปฏิบตั ิ ดงั น้ี
1) ดัชนีควำมยำกของงำน (task difficulty index) ดชั นีน้ีเทียบเท่ากบั ดชั นีความยากของขอ้ สอบ
ซ่ึงค่าเท่ากบั สัดส่วนของผูต้ อบขอ้ สอบขอ้ น้นั ไดถ้ ูกตอ้ ง สาหรับดชั นีความยากของงานในการประเมิน
ทกั ษะการปฏิบตั ิ พจิ ารณาจากสัดส่วนของค่าเฉลี่ยคะแนนรายขอ้ หรืองานแต่ละงานของผูร้ ับการประเมิน
กบั คะแนนที่เป็ นไปไดส้ ูงสุดในแต่ละขอ้ หรือแต่ละงาน โดยทว่ั ไปแลว้ ค่าดชั นีความยากที่ยอมรับไดอ้ ยู่
ระหวา่ ง 0.3 – 0.9 (Johnson, Penny, and Gordon, 2009) เช่น ในการประเมินทกั ษะการปฏิบตั ิท่ีใชเ้ กณฑ์
การใหค้ ะแนนแบบรูบริก 4 ระดบั ในการประเมิน ผรู้ ับการประเมิน 8 คน ดงั ตารางท่ี 3.11
ตำรำงที่ 3.11 ตวั อยา่ งผลการประเมินทกั ษะการปฏิบตั ิเพ่อื ใชค้ านวณดชั นีความยากของงาน
คนที่ ผลกำรประเมนิ
1 1 คะแนน
2 1 คะแนน
3 1 คะแนน
4 2 คะแนน
5 2 คะแนน
6 3 คะแนน
7 3 คะแนน
8 3 คะแนน
รวม 16 คะแนน
ค่ำเฉลยี่ 16/8 = 2

ดงั น้นั ดชั นีความยากของงานน้ี เป็ นสัดส่วนของค่าเฉลี่ยรายขอ้ หรืองานแต่ละงานของผรู้ ับการ
ประเมิน กบั คะแนนที่เป็นไปไดส้ ูงสุดในแตล่ ะขอ้ หรือแต่ละงาน จึงมีคา่ เทา่ กบั 2/4 เทา่ กบั 0.5

2) ดัชนีอำนำจจำแนก (discrimination index) ในการประเมินทกั ษะการปฏิบตั ิผูป้ ระเมิน
สามารถคานวณค่าดชั นีอานาจจาแนกของงานแต่ละงานไดจ้ ากคา่ สัมประสิทธ์ิสหสมั พนั ธ์แบบพอยตไ์ บ

ซีเรียล (point biserial correlation coefficient) จากสูตร
rpb = Xp – Xq √
St

เม่ือ rpb หมายถึง ค่าสมั ประสิทธ์ิสหสัมพนั ธ์แบบพอยตไ์ บซีเรียล
Xp หมายถึง ค่าเฉล่ียคะแนนประเมินของผูร้ ับการประเมินท่ีไดผ้ ลประเมินในระดบั สูง
Xq หมายถึง คา่ เฉลี่ยคะแนนประเมินของผูร้ ับการประเมินท่ีไดผ้ ลประเมินในระดบั ต่า
p หมายถึง คา่ สัดส่วนผรู้ ับประเมินที่ไดผ้ ลประเมินในระดบั สูง
q หมายถึง คา่ สัดส่วนผรู้ ับประเมินท่ีไดผ้ ลประเมินในระดบั ต่า
St หมายถึง ส่วนเบี่ยงเบนมาตรฐานของคะแนนประเมินของผรู้ ับการประเมินทุกคน

93 ผู้ช่วยศาสตราจารย์ ดร.จตุภมู ิ เขตจัตรุ ัส 93

5.2 กำรตรวจสอบคุณภำพเครื่องมือท้งั ฉบับ
กำรตรวจสอบควำมตรง (Validity)
ควำมตรงตำมเนื้อหำ (Content Validity) เป็ นคุณลกั ษณะของขอ้ สอบ พฤติกรรม ประเด็นท่ีมุ่ง
วดั และประเมินน้นั สามารถวดั ตวั แทนของมวลเน้ือหา มวลพฤติกรรม มวลทกั ษะการปฏิบตั ิท่ีมุ่งวดั
ประเมินได้ครอบคลุมหรือไม่ และมีความสอดคลอ้ งกบั จุดมุ่งหมายหรือไม่อย่างไร สาหรับขอ้ สอบ
เน้ือหาท่ีสอนและเน้ือหาท่ีสอบจะตอ้ งสัมพนั ธ์กนั เพราะขอ้ สอบจะตอ้ งเป็ นตวั แทนของเน้ือหาที่สอนไป
ขอ้ สอบจะตอ้ งเป็ นตวั แทนของเน้ือหาท่ีเรียนและเป็ นตวั แทนจุดมุ่งหมายของการสอน สาหรับแบบวดั
จะตอ้ งครอบคลุมพฤติกรรมท่ีเป็ นตวั แทนของตวั แปรที่มุ่งวดั น้ัน และสาหรับแบบประเมินทกั ษะการ
ปฏิบตั ิเกณฑก์ ารใหค้ ะแนนจะตอ้ งมีความสอดคลอ้ งกบั ระดบั ของทกั ษะการปฏิบตั ิน้นั
ความตรงตามเน้ือหาวดั ดว้ ย ดชั นีความสอดคลอ้ ง (Index of Item-Objective Congruence: IOC)
(ศิริชยั กาญจนวาสี, 2548) โดยผเู้ ชี่ยวชาญอยา่ งนอ้ ย 3 ท่าน เป็ นผูเ้ ช่ียวชาญดา้ นเน้ือหา ดา้ นการปฏิบตั ิ
ในเน้ือหา และด้านวดั ประเมินผล เป็ นผูพ้ ิจารณาว่าประเด็นที่มุ่งทดสอบวดั ประเมินได้ตรงตาม
จุดประสงคห์ รือนิยามเชิงปฏิบตั ิการของตวั แปรหรือไม่ ระดบั ความสอดคลอ้ งที่ผเู้ ช่ียวชาญตอ้ งพิจารณา
แบง่ เป็น 3 ระดบั คะแนน ดงั น้ี
ถา้ แน่ใจวา่ ตรง/สอดคลอ้ ง/ ใหร้ ะดบั คะแนนเป็น “+1”
ถา้ แน่ใจวา่ ไมต่ รง/ไม่สอดคลอ้ ง/ ใหร้ ะดบั คะแนนเป็น “-1”

ถา้ ไม่แน่ใจวา่ ตรง/สอดคลอ้ งหรือไม่ ใหร้ ะดบั คะแนนเป็น “ 0 ”
ΣR
ดชั นีความสอดคลอ้ ง (IOC) = N

เมื่อ IOC หมายถึง ดชั นีความสอดคลอ้ ง มีค่าอยรู่ ะหวา่ ง -1 ถึง +1

Σ R หมายถึง ผลรวมของการพจิ ารณาของผเู้ ชี่ยวชาญ

N หมายถึง จานวนผเู้ ช่ียวชาญ
ตวั อยา่ งเช่น ถา้ ผูเ้ ช่ียวชาญ 5 ท่านพิจารณาขอ้ สอบขอ้ ท่ี i ผลการพิจารณาไดผ้ ลเรียงตามลาดบั ดงั น้ี +1,
+1, 0, -1, +1 จากน้นั นาคา่ การพจิ ารณามาหา ค่าดชั นีความสอดคลอ้ ง
(1) + (1) + (0) + (-1) + (+1) = 2
2
ดงั น้นั IOC = 5 = 0.4

จากค่า IOC ที่คานวณไดน้ ้ี แสดงวา่ ขอ้ สอบขอ้ ที่ i วดั ไม่สอดคลอ้ งกบั จุดประสงคก์ ารเรียนรู้
เกณฑก์ ารพิจารณาคา่ IOC ตอ้ งมีคา่ มากกวา่ หรือเทา่ กบั 0.5 ข้ึนไป
เมื่อพิจารณาแบบทดสอบท้งั ฉบบั จะพิจารณาค่า IOC รายขอ้ แลว้ บอกช่วงของดชั นีความ
สอดคลอ้ งเช่น แบบทดสอบวดั ผลสัมฤทธ์ิท่ีพฒั นาข้ึนมีความตรงตามเน้ือหาโดยพิจารณาจากขอ้ สอบ
รายขอ้ มีดชั นีความสอดคลอ้ ง (IOC) อยรู่ ะหวา่ ง 0.8 – 1.0

94 วิธีการและเครื่องมอื ประเมนิ การเรยี นรขู้ องผู้เรยี น 94

สำหรับแบบทดสอบ การตรวจสอบความตรงตามเน้ือหาเป็ นการตรวจสอบว่าขอ้ สอบของ
แบบทดสอบที่สร้างข้ึนน้นั วดั ไดต้ รงตามจุดประสงคก์ ารเรียนรู้หรือไม่ ดงั ตารางที่ 3.12
ตำรำงที่ 3.12 ตวั อยา่ งการออกแบบการตรวจสอบความตรงตามเน้ือหาของขอ้ สอบวดั ผลสมั ฤทธ์ิ
ควำมคดิ เหน็ ของ ข้อเสนอแนะ
จดุ ประสงค์กำรเรียนรู้ ข้อสอบ ผู้เชี่ยวชำญ
+1 0 -1

เมื่อกาหนดตวั เลขไม่เกิน 2 หลกั มาให้ 15 + 18 มีค่าเท่าไร
2 จานวนบวกกนั ผเู้ รียนสามารถบวก ก. 22

ไดถ้ ูกตอ้ ง ข. 23
ค. 33
ง. 35
จ. ไม่มีขอ้ ใดถูก

สำหรับแบบวดั การตรวจสอบความตรงตามเน้ือหาเป็ นการตรวจสอบความสอดคลอ้ งระหวา่ ง
พฤติกรรมบง่ ช้ีกบั นิยามเชิงปฏิบตั ิการ (operational definition) ของตวั แปรท่ีตอ้ งการวดั
ตำรำงที่ 3.13 ตวั อยา่ งการออกแบบการตรวจสอบความตรงตามเน้ือหาของแบบวดั นิสัยทางการเรียน
ตวั แปร นยิ ำมเชิงปฏิบตั ิ พฤตกิ รรมบ่งชี้ ควำมเหน็
ผู้เชี่ยวชำญ
-1 0 +1
นิสยั ทางการเรียน คุณลกั ษณะที่แสดงออกถึง
(study habit) ความประพฤติที่ดีในการ (1) มีสมาธิจดจ่อในส่ิงท่ีเรียนในช้นั ไดด้ ี
เรียนท่ีผเู้ รียนกระทาอยา่ ง
สม่าเสมอจนเคยชิน ไดแ้ ก่ (2) จดบนั ทึกการเรียนไดด้ ี
พฤติกรรมในการเรียน และ (3) ทบทวนบนั ทึกการเรียนอยา่ ง
พฤติกรรมการสอบ
สม่าเสมอ
(4) คน้ หาประเด็นที่ยงั ไม่เขา้ ใจ แลว้ ถาม

ครู หรือผปู้ กครอง หรือคน้ หา
แหลง่ ขอ้ มลู ที่จะช่วยใหไ้ ดค้ าตอบท่ี
ชดั เจน
(5) ทาการบา้ นท่ีไดร้ บั มอบหมายทุกชิ้น
อยา่ งต้งั ใจและส่งทนั กาหนดเวลา
(6) วางแผนเวลาการอ่านหนงั สือไดอ้ ยา่ ง
ลงตวั และเหมาะสม

(7) จดั การเวลาในการสอบไดด้ ี

(8) ใชก้ ลยทุ ธ์การเรียนท่ีปรับเปลย่ี นให้
เหมาะสมไปตามแตล่ ะวชิ า

(9) ฝึ กทาขอ้ สอบเก่า

(10) มีเทคนิคในการทาขอ้ สอบ

95 ผู้ชว่ ยศาสตราจารย์ ดร.จตุภูมิ เขตจตั ุรสั 95

สำหรับแบบประเมินทักษะกำรปฏิบัติ การตรวจสอบความตรงตามเน้ือหาเป็ นการตรวจสอบ
ความสอดคลอ้ งระหวา่ งมิติหรือองคป์ ระกอบที่ประเมินกบั วตั ถุประสงคห์ รือนิยามขององคป์ ระกอบน้นั
และหากเป็นเกณฑก์ ารใหค้ ะแนนแบบรูบริกส์ ก็มกั จะใหผ้ ูเ้ ชี่ยวชาญตรวจสอบความสอดคลอ้ งระหวา่ ง
มิติหรือองคป์ ระกอบของเกณฑก์ ารใหค้ ะแนนแบบรูบริกส์ และคาอธิบายลกั ษณะการปฏิบตั ิหรือผลการ
ปฏิบตั ิของเกณฑแ์ ต่ละระดบั คะแนนของมิติน้นั ดว้ ย โดยใหค้ ะแนนผลการตดั สินคือ
ใหค้ ะแนน +1 หมายถึง มิติหรือองคป์ ระกอบที่ประเมินสอดคลอ้ งกบั วตั ถุประสงคห์ รือนิยาม
ขององคป์ ระกอบน้นั
ใหค้ ะแนน 0 หมายถึง ไม่แน่ใจวา่ มิติหรือองคป์ ระกอบท่ีประเมินสอดคลอ้ งกบั วตั ถุประสงค์
หรือนิยามขององคป์ ระกอบน้นั
ให้คะแนน -1 หมายถึง มิติหรือองค์ประกอบท่ีประเมินไม่สอดคลอ้ งกบั วตั ถุประสงค์หรือ
นิยามขององคป์ ระกอบน้นั
ตวั อยา่ งการตรวจสอบความตรงตามเน้ือหาของเครื่องมือประเมินทกั ษะการปฏิบตั ิ แสดงดงั
ตำรำงท่ี 3.14 ตวั อยา่ งการออกแบบการตรวจสอบความตรงตามเน้ือหาของเกณฑก์ ารใหค้ ะแนนแบบ
รูบริกส์ ทกั ษะการเป่ าขลุ่ย
องค์ประกอบ ระดบั เกณฑ์ ควำมคดิ เห็นของผ้เู ชี่ยวชำญ
คุณภำพ -1 0 +1
ท่ำนั่งและกำรจบั ขลุ่ย ดี นง่ั ตวั ตรง ศีรษะตรง หนา้ มองตรง จบั ขลุ่ยดว้ ยมือ
หมายถึง ท่านทางการ ขวาอยดู่ า้ นบน มือซา้ ยอยดู่ า้ นล่าง ปิ ดนิ้วที่รูเสียงได้
นง่ั พจิ ารณาส่วนหลงั สนิท
และศีรษะ การใชม้ ือ ปานกลาง นงั่ ตวั ตรง ศีรษะเอียงทางใดทางหน่ึง จบั ขลุ่ยดว้ ย
จบั ขลุ่ย และการใช้ มือขวาอยดู่ า้ นบน มือซา้ ยอยดู่ า้ นล่าง ปิ ดนิ้วที่รู
นิ้วปิ ดรูเสียง เสียงไม่ค่อยสนิท
ควร นงั่ หลงั งอ ศีรษะเอียง จบั ขล่ยุ ดว้ ยมือซา้ ยอยู่
ปรับปรุง ดา้ นบน มือขวาอยดู่ า้ นลา่ ง ปิ ดนิ้วที่รูเสียงไม่สนิท
กำรเป่ ำไล่เสียง ดี เปิ ด-ปิ ดนิ้วไดถ้ ูกตอ้ ง มีความคลอ่ งแคล่ว ชดั เจน
หมายถึง ความ เสียงไม่เพ้ียน สามารถบอกช่ือตวั โนต้ ที่เป่ าได้
คล่องแคลว่ ในการ ปานกลาง เปิ ด-ปิ ดนิ้วได้ แตข่ าดความคล่องแคล่ว เสียงเพ้ียน
เป่ าและการเปิ ด-ปิ ด สามารถบอกช่ือของเสียงตวั โนต้ ไดบ้ างตวั
นิ้ว ควร เปิ ด-ปิ ดนิ้วไม่ค่อยถกู ตอ้ ง ขาดความคลอ่ งแคล่ว
ปรับปรุง เสียงเพ้ียน คลมุ เครือ ไมส่ ามารถบอกชื่อของเสียง
ตวั โนต้ ท่ีเป่ าได้
คุณภำพเสียง ดี เสียงท่ีเป่ าออกมาสม่าเสมอ เสียงใส ชดั เจน ไม่
หมายถึง ความ เพ้ยี น ควบคุมลมและการหายใจได้
ถกู ตอ้ งชดั เจนและ ปานกลาง เสียงที่เป่ าออกมาขาดๆ หายๆ ไมส่ ม่าเสมอ ยงั มี
สม่าเสมอของเสียงท่ี เสียงเพ้ยี น
เป่ าออกมา ควร เสียงที่เป่ าออกมาขาดๆ หายๆ และเสียงเพ้ียน
ปรับปรุง
ที่มา: กมลวรรณ ตงั ธนกานนท,์ 2559

96 วิธีการและเครื่องมอื ประเมนิ การเรยี นรขู้ องผูเ้ รยี น 96

ควำมตรงตำมเกณฑ์สัมพันธ์ (Criterion-Related Validity) เป็ นคุณภาพของเครื่องมือที่
พฒั นาข้ึนโดยนาผลการวดั ไปหาความสัมพนั ธ์กับเกณฑ์ของเครื่องมืออ่ืนท่ีน่าเชื่อถือและสัมพนั ธ์
เก่ียวขอ้ ง เช่น เกณฑ์มาตรฐานของเครื่องมือ เกณฑ์ผลสัมฤทธ์ิในปัจจุบนั เกณฑเ์ กี่ยวกบั ผลการทางาน

หลงั จากเรียนสาเร็จไปแล้ว ความตรงประเภทน้ีจาแนกออกเป็ น 2 ชนิด คือ ความตรงตามสภาพ
(Concurrent Validity) และ ความตรงเชิงทานาย (Predictive Validity) โดยมีรายละเอียดดงั น้ี
(1) ควำมตรงตำมสภำพ เป็ นความตรงท่ีเอาผลการวดั ของเครื่องมือที่สร้างข้ึนไปหา
ความสัมพนั ธ์กบั เกณฑ์ในสภาพปัจจุบนั เช่น คะแนนของแบบทดสอบที่วดั ความรู้เก่ียวกบั ว่ายน้าไปหา
ความสัมพนั ธ์กบั คะแนนการปฏิบตั ิว่ายน้าในปัจจุบนั ถา้ ผลปรากฏว่ามีความสัมพนั ธ์กนั สูง ก็แสดงว่า
แบบทดสอบวัดความรู้เกี่ยวกับว่ายน้ ามีความตรงตามสภาพสูง กล่าวคือ คนท่ีว่ายน้ าเป็ นจะทา
แบบทดสอบวดั ความรู้ได้ และคนท่ีวา่ ยน้าไม่เป็นจะทาแบบทดสอบวดั ความรู้ไมค่ อ่ ยไดห้ รือไม่ได้ เป็นตน้
การคานวณคา่ ความตรงตามสภาพ จาแนกวธิ ีคานวณตามชนิดของเครื่องมือ ดงั น้ี
ก. ควำมตรงตำมสภำพของแบบทดสอบองิ กลุ่ม เป็ นการหาความตรงตามสภาพของ
แบบทดสอบวดั ผลสัมฤทธ์ิท่ีใชใ้ นการสอบผเู้ รียนเพื่อประเมินผลรวม (Summative Evaluation) เม่ือ
ผเู้ รียนเรียนจบวชิ าน้นั แลว้ มีความรู้อยใู่ นระดบั ใดของคะแนนเกรด A, B, C, D หรือ E หรือมีความรู้เก่ง
กวา่ คนอ่ืนมากนอ้ ยเพยี งใด ดงั น้นั แบบทดสอบวดั ผลสัมฤทธ์ิแบบอิงกลุ่มน้ีเมื่อจะคานวณหาความตรง
ตามสภาพ จะตอ้ งนาแบบทดสอบฉบบั ท่ีจะหาความตรงไปทาการทดสอบกบั ผูเ้ รียนท่ีเป็ นกลุ่มตวั อยา่ ง
แลว้ นาผลการสอบมาคานวณหาสัมประสิทธ์ิสหสัมพนั ธ์ (Correlation Coefficient) กบั คะแนนความรู้

หรือเกรดเฉลี่ย (GPA) ของวิชาน้ัน ซ่ึงถือว่าเป็ นคะแนนเกณฑ์ (Criteria) ของผูเ้ รียนท่ีสอบ
แบบทดสอบฉบบั น้นั โดยใชส้ ูตรคานวณดงั น้ี
NΣ xy Σ xΣ y
rxy = [NΣx2  (Σx2 )][ NΣy2  (Σy2 )]

เมื่อ rxy = ค่าความตรงตามสภาพ
N= จานวนผเู้ รียนที่ทาแบบทดสอบ

Σx = ผลรวมคะแนนของแบบทดสอบที่หาความตรงตามสภาพ
ผลรวมคะแนนความรู้ของผเู้ รียนในขณะน้นั หรือคะแนนเกณฑ์
Σy =
Σx2 = ผลรวมคะแนนของแบบทดสอบของผเู้ รียนแตล่ ะคนยกกาลงั สอง
Σy2 = ผลรวมคะแนนเกณฑข์ องผเู้ รียนแตล่ ะคนยกกาลงั สอง
Σ xy = ผลรวมของผลคูณระหวา่ งคะแนนแบบทดสอบกบั คะแนนเกณฑ์

97 ผู้ชว่ ยศาสตราจารย์ ดร.จตุภมู ิ เขตจตั ุรัส 97

ข. ควำมตรงตำมสภำพของแบบทดสอบอิงเกณฑ์ เป็ นการหาความตรงตามสภาพ
ของแบบทดสอบวดั ผลสัมฤทธ์ิที่ใชใ้ นการทดสอบผเู้ รียน เพื่อประเมินผลยอ่ ย (Formative Evaluation)
ซ่ึงความตรงตามสภาพของแบบทดสอบอิงเกณฑ์หมายถึง แบบทดสอบอิงเกณฑ์ท่ีสามารถวดั ความ
รอบรู้ (Master) และไม่รอบรู้(Non-master) ของผูเ้ รียนในการทดสอบ (Test Status) ในแต่ละ
จุดประสงคว์ า่ ตรงกบั สถานภาพความรู้จริง (Known Status) หรือไม่ ถา้ ตรงกบั สภาพความรู้จริง ก็

แสดงวา่ มีความตรงสูง ซ่ึงคานวณจากค่าฟี “” ซ่ึงมีค่าอยู่ระหวา่ ง -1 ถึง +1 คือค่า  มีค่าใกล้ +1

แสดงวา่ มีความตรงสูงและคา่  มีค่าใกล้ 0 หรือ -1 แสดงวา่ มีความตรงต่าหรือไม่ตรง
สถำนภำพกำรสอบ (Test Status)

สถานภาพ ไม่รอบรู้ รอบรู้ รวม
ความรู้จริง รอบรู้ B = 0 A=6 A+B = 6
(Known status)
ไมร่ อบรู้ D=5 C=1 C+D = 6
รวม B+D=5 A+D=7 12

สูตรคำนวณ (AD) (BC)
(A  B)(C  D)(B  D)(A  C)
=

การคานวณค่าตรงชนิดน้ี ชรอคและคอสแคร์ลี (Shrock and Coscarelli, 1989, p. 192) ไดว้ าง
เกณฑ์ไวว้ ่า ถ้าเป็ นแบบทดสอบท่ีวดั จุดประสงค์ท่ีสาคญั มาก ควรจะมีค่าตรงมากกว่า 0.95 และ
แบบทดสอบท่ีวดั จุดประสงคท์ ่ีสาคญั ควรจะมีค่าตรงมากกวา่ 0.75 ส่วนแบบทดสอบที่วดั จุดประสงค์
ทว่ั ๆ ไป ควรมีคา่ ตรงมากกวา่ 0.50 ถา้ มีค่าต่ากวา่ 0.50 แสดงวา่ เป็นแบบทดสอบที่ขาดตรงเชิงสภาพ

(2) ควำมตรงเชิงทำนำย เป็ นความตรงที่ไดม้ าจากเอาผลการวดั แบบทดสอบที่สร้างข้ึนไป
คานวณหาความสัมพนั ธ์กบั เกณฑ์ในอนาคต เพื่อท่ีจะเอาผลการสอบไปพยากรณ์ผลความสาเร็จใน
อนาคต และการคานวณความตรงเชิงทานายน้ีจะคานวณตามชนิดของแบบทดสอบดงั น้ี

ก. ควำมตรงเชิงทำนำยของแบบทดสอบอิงกลุ่ม การหาความตรงของแบบทดสอบ
อิงกลุ่ม เป็ นการหาโดยเอาคะแนนของแบบทดสอบไปหาความสัมพนั ธ์กบั ผลงานท่ีสาเร็จไปแลว้ เช่น
คะแนนเกรดเฉลี่ย (G.P.A.) ท่ีจบการศึกษาไปแล้ว ผลการปฏิบตั ิงานเมื่อจบการศึกษาไปแล้ว ฯลฯ
แบบทดสอบท่ีจะหาความตรงเชิงพยากรณ์จะต้องสอบก่อนท่ีกลุ่มตัวอย่างจะเรียนสาเร็จ เช่น
แบบทดสอบท่ีใช้ในการสอบคดั เลือก เมื่อสอบกลุ่มตวั อยา่ งแลว้ ตอ้ งรอให้กลุ่มตวั อย่างน้ีเรียนจบไป
ก่อน หรือสาเร็จไปทางานแลว้ จึงเอาเกรดเฉล่ียหรือผลการปฏิบตั ิงานมาหาความสัมพนั ธ์กบั คะแนน
สอบคดั เลือก ถา้ ความสัมพนั ธ์มีค่าสูง แสดงวา่ มีความตรงเชิงพยากรณ์ จึงสามารถนาแบบทดสอบไป

98 วิธีการและเคร่อื งมือประเมนิ การเรยี นรูข้ องผูเ้ รยี น 98

สอบคดั เลือกไดห้ รือนาไปใช้ เพื่อพยากรณ์ความสาเร็จในการเรียน หรือพยากรณ์ความสาเร็จในการ
ทางาน การหาความตรงชนิดน้ี คานวณจากสูตร rxy เช่นเดียวกบั ค่าความตรงสภาพของแบบทดสอบอิง
กลุ่ม โดยที่ x คือ คะแนนของแบบทดสอบท่ีตอ้ งการหาความตรงเชิงพยากรณ์ และ y เป็ นคะแนนที่เป็ น
พลงั งานหลงั จากสาเร็จไปแลว้ เป็นตน้

ข. ควำมตรงเชิงทำนำยของแบบทดสอบอิงเกณฑ์ การหาความตรงของแบบทดสอบ
อิงเกณฑก์ ็มีความหมายเช่นเดียวกบั แบบทดสอบอิงกลุ่ม ต่างกนั แต่วิธีการคานวณหาค่าความตรง ซ่ึงจะ
คานวณในลกั ษณะหาคาความสอดคลอ้ งของความรอบรู้กบั ไม่รอบรู้ของผลการสอบแบบทดสอบท่ีจะ

หาความตรงกบั สถานภาพในอนาคต (Future Status) โดยใชส้ ูตรของฟี (Phi : ) ดงั ต่อไปน้ี
สถำนภำพกำรสอบ (Test Status)

ผลเม่ือไปทางาน รอบรู้ ไม่รอบรู้ รอบรู้ รวม
แลว้ B A A+B
ไม่รอบรู้
รวม D C C+D
B+D A+C 12

สูตรคำนวณ (AD) (BC)
(A  B)(C  D)(B  D)(A  C)
=

ค่า  ที่ไดจ้ ากตารางดงั กล่าวจะเป็ นความตรงเชิงพยากรณ์ของแบบทดสอบอิงเกณฑ์ ซ่ึงแปล
ความหมายเช่นเดียวกบั คา่  ท่ีคานวณจากความตรงตามสภาพของแบบทดสอบอิงเกณฑ์

ควำมตรงตำมโครงสร้ำง (Construct Validity) เป็ นคุณภาพของเคร่ืองมือที่สามารถวดั ไดต้ รง
ตามลกั ษณะหรือตามทฤษฎีต่าง ๆ ของโครงสร้างน้นั หรือวดั ไดค้ รอบคลุมตามลกั ษณะของโครงสร้าง
ของแบบทดสอบมาตรฐาน การคานวณค่าความตรงตามโครงสร้างท้งั แบบทดสอบวดั ผลสัมฤทธ์ิอิง
กลุ่ม หรืออิงเกณฑ์ มีวธิ ีการคานวณเหมือนกนั ดงั น้ี

ก. คำนวณจำกค่ำควำมสัมพันธ์ เป็ นการคานวณความตรงตามโครงสร้างของ
แบบทดสอบท่ีตอ้ งการหาความตรงโดยเอาคะแนนท่ีไดจ้ ากการทดสอบกบั คะแนนที่ไดจ้ ากการทดสอบ
แบบทดสอบมาตรฐานที่วดั ลกั ษณะเดียวกนั ไปคานวณค่าสัมประสิทธ์ิสหสมั พนั ธ์จากสูตร

rxy = NΣ xy Σ xΣ y
[NΣx2  (Σx2 )][ NΣy2  (Σy2 )]
จากสูตร ค่า X จะเป็ นคะแนนของแบบทดสอบที่ตอ้ งการหาความตรงตามโครงสร้างส่วน y
เป็นคะแนนท่ีไมจ่ ากผลการสอบแบบทดสอบมาตรฐานที่วดั ลกั ษณะเดียวกนั

99 ผชู้ ่วยศาสตราจารย์ ดร.จตภุ มู ิ เขตจัตุรัส 99

ข. วธิ ีคำนวณจำกหลำยลักษณะหลำยวิธี (The Multitrait-Multimethod Matrix) เป็ นวิธี
หาความตรงแบบหลายลกั ษณะหลายวิธี (Multitrait – Multimethod Validity) ซ่ึงแคมพเ์ บลและฟิ สค์
(Campbell and Fiske, 1959) ไดก้ ล่าวถึงการวดั ความตรงแบบหลายลกั ษณะหลายวธิ ีน้ีวา่ เป็ นการหา
ความตรงของแบบทดสอบที่ประกอบดว้ ย ลกั ษณะท่ีวดั มีสองลกั ษณะหรือมากกวา่ สองลกั ษณะและมีวิธี
วดั สองวธิ ีหรือมากกวา่ สองวธิ ีแลว้ คานวณหาความตรงสองลกั ษณะ ดงั น้ี
1) ความตรงเชิงเหมือน (Convergent Validity) เป็ นความตรงท่ีเกิดจากความสัมพนั ธ์
ระหว่างผลการวดั ลกั ษณะเดียวกนั หรือวิธีวดั เดียวกนั ซ่ึงก็คือ ความเที่ยงแบบทดสอบที่สอบซ้ากนั
(Reliability of Test – Retest) และวดั ลกั ษณะเดียวกนั แตต่ ่างวธิ ีวดั จะมคี วามสมั พนั ธ์กนั มีค่าสูง
2) ความตรงเชิงจาแนก (Discriminate Validity) เป็ นความตรงท่ีเกิดจากความสัมพนั ธ์

ระหวา่ งผลการที่ต่างลกั ษณะกนั จะใชว้ ธิ ีวดั เดียวกนั หรือตา่ งวธิ ีกนั กต็ ามจะมีค่าความสัมพนั ธ์กนั ต่าหรือมี
คา่ ต่ากวา่ ความตรงเชิงเหมือน
ค. วิธีคำนวณจำกกำรวิเครำะห์องค์ประกอบ (Factor Analysis) เป็ นวธิ ีที่จะตอ้ งคานวณหา
คา่ สหสมั พนั ธ์ภายใน (Intercorrelation) ของขอ้ สอบแต่ละขอ้ หรือแบบทดสอบยอ่ ย (Subtest) แต่ละฉบบั

จากน้ันจึงหาค่าน้าหนักขององค์ประกอบ (Factor Loading) เพื่อพิจารณาว่าข้อสอบแต่ละขอ้ หรือ
แบบทดสอบยอ่ ยแต่ละฉบบั น้นั วดั องคป์ ระกอบเดียวกนั หรือไม่ ถา้ ผลปรากฏวา่ เมื่อคานวณค่าน้าหนกั
องคป์ ระกอบแลว้ ปรากฏวา่ มีหน่ึงองคป์ ระกอบแสดงวา่ แบบทดสอบฉบบั น้นั มีความตรงตามโครงสร้าง
ง. วิธีคำนวณจำกกลุ่มที่รู้ชัดอยู่แล้ว (Known-Group Technique) เป็ นวิธีท่ีเปรียบเทียบ
คะแนนเฉลี่ยระหว่างกลุ่มท่ีรู้ว่ามีลกั ษณะที่ตอ้ งการวดั กลุ่มท่ีรู้วา่ ไม่มีลกั ษณะท่ีตอ้ งการวดั เช่น ความ
ตรงตามโครงสร้างของแบบทดสอบคณิตศาสตร์ ทาได้โดยนาแบบทดสอบกบั กลุ่มตวั อย่างที่เรียน
วชิ าเอกคณิตศาสตร์ (กลุ่มที่รู้ทางคณิตศาสตร์) กบั กลุ่มท่ีเรียนวิชาเอกภาษาไทย (กลุ่มท่ีไม่รู้หรือรู้นอ้ ย
ทางคณิตศาสตร์) แลว้ คานวณคะแนนเฉลี่ยของท้งั 2 กลุ่มมากทดสอบนยั สาคญั ทางสถิติโดยใชส้ ูตรดงั น้ี
XH XN
t= SH2 S2N
nH nN


ที่ df = nH + nN – 2
เมื่อ XH = คะแนนเฉลี่ยของกลุ่มท่ีมี (Have : H) สิ่งท่ีตอ้ งการวดั (กลุ่มคณิตศาสตร์)
XN = คะแนนเฉล่ียของกลุ่มท่ีไม่มี (Non : N) ส่ิงที่ตอ้ งการวดั (กลุ่มภาษาไทย)
2 = ความแปรปรวนของกลุ่มท่ีมีสิ่งที่ตอ้ งการวดั
S H

S2N = ความแปรปรวนของกลุ่มท่ีไมม่ ีสิ่งท่ีตอ้ งการวดั
nH = จานวนคนในกลุ่มท่ีมีสิ่งที่ตอ้ งการวดั
nN = จานวนคนในกลุ่มที่ไม่มีสิ่งที่ตอ้ งการวดั

100 วธิ ีการและเครอ่ื งมือประเมนิ การเรยี นรขู้ องผู้เรียน 100
โดยทว่ั ไปแลว้ ความตรงตามโครงสร้าง เหมาะกบั การหาคุณภาพของเครื่องมือที่ไม่มีเน้ือหา

หรือพฤติกรรมที่ชดั เจน เช่น แบบทดสอบทางดา้ นความถนดั ทางการเรียน หรือแบบทดสอบวดั ดา้ น
บุคลิกภาพ จริยธรรม ฯลฯ เป็ นตน้ (ล้วน สายยศ และองั คณา สายยศ, 2543) แต่ไม่นิยมท่ีจะหาจาก
แบบทดสอบวดั ผลสมั ฤทธ์ิเพราะแบบทดสอบมีเน้ือหาและพฤติกรรมที่จะวดั ท่ีชดั เจนอยแู่ ลว้

กำรตรวจสอบควำมเทย่ี ง (Reliability)

ควำมเท่ียง (Reliability) เป็ นความคงที่หรือความเส้นคงวาของคะแนน หรือผลการวดั หรือผลการ
ประเมินที่ไดจ้ ากการเครื่องมือวดั และประเมินที่พฒั นาข้ึนใหม้ ีความคลาดเคล่ือนในการวดั และประเมินนอ้ ย
ที่สุด ตวั อย่างเช่น นาแบบทดสอบวิชาวิจยั ไปสอบกับ นายทศพร คร้ังแรก นายทศพร ทาได้คะแนน 25
คะแนน เวน้ ไปประมาณ 1 สัปดาห์ นาแบบทดสอบแบบเดิมสอบกบั นายทศพร อีกคร้ังหน่ึงก็ยงั คงได้
คะแนน 25 คะแนน เหมือนเดิม แสดงวา่ แบบทดสอบชุดน้ีมีความเท่ียง แต่ถา้ ปรากฏวา่ นาแบบทดสอบชุด
เดิมไปสอบกบั นายทศพรซ้าอีกคร้ังหน่ึงแลว้ นายทศพรไดค้ ะแนนเปล่ียนไปจากเดิมแสดงว่า แบบทดสอบ
ขาดความเที่ยง ทาใหผ้ ลการสอบมีความคลาดเคล่ือนไปจากคะแนนความรู้จริงของผเู้ รียน ความคลาดเคลื่อน
ชนิดน้ีเรียกว่า ความคลาดเคล่ือนในการวดั (Error of Measurement) และในการวดั ผลน้ันจะตอ้ งสร้าง
เคร่ืองมือท่ีตอ้ งการนาไปวดั ผลให้มีคุณภาพเพ่ือผลการวดั ที่ออกมาจะไดเ้ ป็ นคะแนนความรู้จริงของผเู้ รียนท่ี
ปราศจากความคลาดเคลื่อนในการวดั และค่าความเท่ียงจะมีค่าอยูร่ ะหวา่ ง -1 ถึง +1 และพิจารณาเฉพาะค่าที่
เป็ นบวกเท่าน้ัน ซ่ึงควรมีค่ามากกว่า 0.70 จึงจะเป็ นแบบทดสอบที่มีความเท่ียงท่ียอมรับได้ ในการ
คานวณหาค่าความเท่ียงน้นั จะคานวณในรูปของการประมาณค่า หาในรูปของค่าสัมประสิทธ์ิของความ
เท่ียงมกั ใชส้ ัญลกั ษณ์วา่ rtt หรือ rcc

ควำมเทยี่ งของแบบทดสอบองิ กล่มุ มีวธิ ีคานวณอยู่ 3 วธิ ี ดงั น้ี
1. ควำมเทยี่ งแบบควำมคงทข่ี องคะแนน (Stability Reliability) เป็นการประมาณค่าความเที่ยง
โดยพิจารณาจากคะแนนที่ได้จากการทดสอบ 2 คร้ัง ในเครื่องมือวดั ชุดเดียวกันว่ายงั คงมีเท่ากัน
เหมือนเดิมหรือไม่ ถ้ามีค่าเหมือนเดิม แสดงว่ามีความคงที่ของคะแนน วิธีน้ีเป็ นวิธีการทดสอบซ้า
(Test-Retest Method) วธิ ีการหาความเท่ียงแบบน้ีมีจุดอ่อนตรงช่วงเวลาของการทดสอบซ้า กล่าวคือ ถา้
การทดสอบคร้ังแรกกบั คร้ังท่ีสองเวน้ ช่วงการทดสอบนานไปผลของการสอบคร้ังท่ีสองอาจจะมีผลจาก
ผูเ้ รียนไดร้ ับการฝึ กในเร่ืองที่ทดสอบมากข้ึนหรือผูเ้ รียนอาจจะลืมเน้ือหาน้นั ไปทาให้การประมาณค่า
ความเท่ียงของแบบทดสอบต่าเกินไป แต่ถา้ การทดสอบคร้ังแรกกบั การทดสอบคร้ังท่ีสองเวน้ ช่วงการ
ทดสอบเร็วไปผเู้ รียนอาจจะจาขอ้ สอบได้ ใหก้ ารประมาณค่าความเท่ียงของแบบทดสอบสูงเกินไป ผล
ของการเปล่ียนแปลงคา่ ความเที่ยงน้ี เรียกวา่ เกิด Carry-Over Effect
วธิ ีการประมาณค่าความเที่ยงแบบทดสอบซ้าน้ี จะคานวณหาค่าโดยหาความสัมพนั ธ์ระหวา่ ง
คะแนนการสอบสองคร้ังโดยใช้สูตรคานวณหาค่าสัมประสิทธ์ิสหสัมพนั ธ์ของ เปี ยร์สัน (Pearson
Product-Moment Coefficient Correlation) โดยใชส้ ูตร

rtt = 101 ผชู้ ว่ ยศาสตราจารย์ ดร.จตภุ ูมิ เขตจตั ุรสั 101
NΣ xy Σ xΣ y

nΣ 2  (Σ x)2 NΣ y2  (Σ y)2 

เม่ือ rtt = สัมประสิทธ์ิความที่ยงของแบบทดสอบ
N= จานวนผเู้ รียนที่เขา้ สอบ
Σx = ผลรวมท้งั หมดของคะแนนของการสอบคร้ังแรก
Σx2 = ผลรวมท้งั หมดของคะแนนแตล่ ะดว้ ยกาลงั สองของการสอบคร้ังแรก
Σy = ผลรวมท้งั หมดของคะแนนของการสอบคร้ังที่สอง
Σ y2 = ผลรวมท้งั หมดของคะแนนแตล่ ะตวั ยกกาลงั ของการสอบคร้ังท่ีสอง
Σ xy = ผลรวมท้งั หมดของผลคูณระหวา่ งคะแนนการสอบคร้ังแรกกบั คร้ังที่สอง

2. ควำมเท่ยี งโดยใช้แบบทดสอบทเ่ี หมือนกันสองฉบับ (Equivalent-Form Reliability) เป็ น
การประมาณค่าความเที่ยง โดยการใชแ้ บบทดสอบที่มีลกั ษณะวดั ส่ิงเดียวกนั หรือคู่ขนานกนั (Parallel
Forms) ไปทดสอบกบั ผูเ้ รียนกลุ่มเดียวกนั แลว้ นาคะแนนท่ีไดจ้ ากแบบทดสอบท้งั สองฉบบั ที่คู่ขนาน
กนั น้ีไปคานวณหาค่าสัมประสิทธ์ิสหสัมพนั ธ์โดยใช้สูตรของเปี ยร์สันเช่นเดียวกบั การหาความเท่ียง
แบบความคงท่ีของคะแนน การหาความเท่ียง แบบน้ีมีปัญหาตรงสร้างเครื่องวดั ให้คู่ขนานกนั การที่
แบบทดสอบจะเป็ นคู่ขนานกนั น้นั นอกจากแบบทดสอบท้งั สองฉบบั น้นั จะวดั ในเน้ือหาเดียวกนั แลว้
ตอ้ งมีคะแนนเฉลี่ย ความแปรปรวน และค่าสถิติอ่ืน ๆ เท่ากนั ดว้ ย ดงั น้นั จึงเป็ นเร่ืองค่อนขา้ งยากท่ีจะ
สร้างเคร่ืองมือวดั ใหค้ ู่ขนานกนั ได้

3. ควำมเทีย่ ง โดยใช้ควำมสอดคล้องภำยใน (Internal Consistency Reliability) เป็ นการหาความ
เท่ียงท่ีใชแ้ บบทดสอบฉบบั เดียวทาการทดสอบเพยี งคร้ังเดียว ซ่ึงมีวธิ ีการประมาณคา่ ความเท่ียงดงั น้ี
วิธีที่ 1 วธิ ีแบ่งคร่ึงแบบทดสอบ (Split-Half Method) วิธีน้ีจะแบ่งทดสอบเป็ นสองส่วน โดย

แบ่งให้แต่ละส่วนที่มีลักษณะเป็ นคู่ขนานกนั ดงั น้ัน จึงนิยมแบ่งเป็ นฉบบั ข้อคู่กบั ฉบับข้อคี่ เช่น
เครื่องมือเป็นแบบทดสอบวทิ ยาศาสตร์ เมื่อวิเคราะห์หาค่าความยากเป็ นรายขอ้ แลว้ ก็เรียงขอ้ สอบจาก
ขอ้ ง่ายไปยงั ขอ้ ยากแลว้ นาไปสอบกบั ผเู้ รียนเม่ือสอบเสร็จแลว้ ก็ตรวจใหค้ ะแนนโดยแยกเป็ นคะแนนขอ้
คูก่ บั คะแนนขอ้ คี่แลว้ นามาหาค่าสหสัมพนั ธ์ระหวา่ งคะแนนขอ้ คู่กบั คะแนน ขอ้ คี่ โดยใชส้ ูตรของเปี ยร์
สนั (Pearson Product-Moment Coefficient Correlation) จะไดค้ า่ ความเท่ียงเพยี งคร่ึงฉบบั (r1/2) จากน้นั
จึงนาไปหาค่าความเที่ยงของท้งั ฉบบั ใดใช้สูตรขยายของ สเปี ยร์แมนบราวน์ (Spearman-Brown
Formula) ดงั น้ี
2r1 2
rn = 1r1 2

เม่ือ rn คือ ความเท่ียงของแบบทดสอบท้งั ฉบบั
r½ คือ ความเที่ยงของแบบทดสอบคร่ึงฉบบั

102 วธิ กี ารและเครือ่ งมือประเมนิ การเรียนร้ขู องผู้เรยี น 102

วธิ ีที่ 2 วิธีของคูเดอร์-ริชำร์ดสัน (Kuder-Richardson procedure) ในปี ค.ศ. 1973 คูเดอร์และ
ริชาร์ดสันไดพ้ ฒั นาสูตรที่หาความเที่ยงใหง้ ่ายเขา้ โดยท่ีเคร่ืองมือที่จะหาความเท่ียงโดยวิธีน้ี จะตอ้ งมี
ลกั ษณะท่ีวดั องค์ประกอบร่วมกนั และคะแนนแต่ละขอ้ ตอ้ งอยูใ่ นลกั ษณะที่ทาถูกได้ 1 คะแนน ทาผิด
ได้ 0 คะแนนเทา่ น้นั ถา้ ตรวจใหค้ ะแนนนอกเหนือจากน้ีจะใชว้ ธิ ีการน้ีหาค่าความเท่ียงไม่ไดแ้ ละวธิ ีจะ
มีสูตรที่ใชห้ าความเท่ียงอยู่ 2 สูตร คือ สูตร KR.20 กบั KR.21 ดงั น้ี

สูตร KR.20

rtt = k 1  pq 
  
เม่ือ rtt คือ k 1 2 
k คือ
p คือ ค่าความเที่ยงของแบบทดสอบ
q คือ
σ 2 คือ จานวนขอ้ สอบ
สดั ส่วนของคนท่ีทาขอ้ น้นั ได้ = (จานวนคนที่ทาถูก/ จานวนคนท้งั หมด)
หาไดจ้ าก σ 2 = สัดส่วนของผเู้ รียนที่ทาขอ้ น้นั ผดิ = 1 – p

สูตร KR.21 คะแนนความแปรปรวนของแบบทดสอบท้งั ฉบบั
NΣ x2  (Σ x)2
จากสูตร rn = N2

เม่ือ rtt คือ k μ (k μ ) 
k คือ  kσ 2
μ คือ k 1
σ 2 คือ คา่ ความเที่ยงของแบบทดสอบ

จานวนขอ้ สอบ

คะแนนเฉลี่ย

คะแนนความแปรปรวน

การหาค่าความเท่ียงดว้ ยสูตร KR.20 จะใหค้ ่าความเที่ยงสูงกวา่ KR.21 เพราะ KR.21 มีขอ้ ตกลง
วา่ ขอ้ สอบตอ้ งวดั ลกั ษณะเดียวร่วมกนั และแตล่ ะขอ้ มีความยากง่ายเท่ากนั

วธิ ีท่ี 3 วธิ ีของครอนบำค (Cronbach Alpha Procedure) ครอนบาคไดพ้ ฒั นาสูตรหาความเที่ยง
ในรูปสัมประสิทธิแอลฟา (-Coefficient) ในปี ค.ศ. 1951 โดยพฒั นามาจากสูตร KR.20 ท้งั น้ีเป็ น
เพราะวา่ จะไดใ้ ชห้ าค่าความเที่ยงกบั เครื่องมือท่ีไม่ไดต้ รวจใหค้ ะแนนเป็ น 1 กบั 0 จะตรวจให้คะแนน
ลกั ษณะใดกไ็ ด้ เช่น ถา้ ทาถูกไดค้ ะแนนเป็น 10, 8 หรือในลกั ษณะแบบทดสอบถามท่ีให้คะแนนแต่ละ
ขอ้ เป็น 3, 2, 1 หรือ 5, 4, 3, 2, 1 ก็ได้ สูตรที่ใช้ ดงั น้ี

= k 1   2 
  i 

k 1 2

103 ผูช้ ว่ ยศาสตราจารย์ ดร.จตภุ มู ิ เขตจัตุรสั 103

เม่ือ  คือ สัมประสิทธ์ิความเท่ียง

k คือ จานวนขอ้ สอบ
2
σ i คือ คะแนนความแปรปรวนเป็นรายขอ้ หาไดจ้ ากสูตร

NΣX 2  ( ΣX i )2
i
N2
โดยท่ี ΣXi คือ ผลรวมท้งั หมดของคะแนนในขอ้ ที่ i
ΣX 2 คือ ผลรวมท้งั หมดของคะแนนแตล่ ะคนยกกาลงั สอง ในขอ้ ท่ี i
i
N คือ จานวนคนเขา้ สอบ
σ2 คือ คะแนนความแปรปรวนของท้งั ฉบบั คานวณจากสูตร

NΣX2  (ΣX)2
N2

โดยท่ี Σ X2 คือ ผลรวมท้งั หมดของคะแนนขอ้ สอบท้งั ฉบบั
ΣX2 คือ ผลรวมท้งั หมดของคะแนนแตล่ ะคนยกกาลงั สอง

วิธีที่ 4 วิธีของฮอยท์ (Hoyt’s ANOVA Procedure) การหาค่าความเท่ียง โดยวิธีน้ีเหมาะ
สาหรับเครื่องมือที่ใชใ้ นการเก็บขอ้ มูลประเภทตรวจใหค้ ะแนนต่างๆ กนั ในแต่ละขอ้ เช่นเดียวกบั การ
หาความเที่ยงแบบสัมประสิทธ์ิแอลฟา แต่วิธีการคานวณแบบฮอยท์น้ีใช้หลกั สถิติของการวิเคราะห์
ความแปรปรวนคือ ใชส้ ูตรวา่
MSE
rtt = 1- MSP

เม่ือ MSE คือ คะแนนความแปรปรวนของความคลาดเคลื่อน (Error)
MSP คือ คะแนนความแปรปรวนระหวา่ งคน (Between People)

ควำมเทยี่ งของแบบทดสอบองิ เกณฑ์
ความเท่ียงของแบบทดสอบอิงเกณฑ์ เป็ นผลของคะแนนที่สอบไดม้ ีความคงที่ในการเป็ นผรู้ อบรู้
หรือไมร่ อบรู้ในเร่ืองท่ีสอบ ซ่ึงมีวธิ ีหาอยหู่ ลายวธิ ีดงั น้ี
1. ควำมเท่ียงแบบหำควำมคงทข่ี องควำมรอบรู้ (Stability Reliability) เป็ นการคานวณหาความ
เท่ียงโดยการนาแบบทดสอบอิงเกณฑม์ าสอบซ้า 2 คร้ัง จากน้นั นาคะแนนที่ไดจ้ ากการสอบ 2 คร้ัง มาหา
ความคงที่ของการรอบรู้และไม่รอบรู้ท่ีไดจ้ ากการกาหนดคะแนนจุดตดั ที่เหมาะสม และการหาความคงท่ี

ชนิดน้ี (Shrock and Coscarelli, 1990 อา้ งถึงใน ลว้ น สายยศ และองั คณา สายยศ , 2543)
AD  BC
= (A  B)(C  D)(A  C)(B  D)

104 วธิ ีการและเคร่อื งมือประเมินการเรยี นรู้ของผเู้ รยี น 104

โดยมีตวั อยา่ งของขอ้ มูลดงั น้ี กำรทดสอบ คร้ังท่ี 1

ไม่รอบรู้ รอบรู้ รวม

กำรทดสอบ รอบรู้ B=1 A=4 A+B=5
คร้ังท่ี 2 ไมร่ อบรู้ D=4 C=1 C+D=5
B+D =5 A+C=5 N = 10
รวม (4  4)  (11)
(5)(5)(5)(5)
ดงั น้นั  =

= 16 1
625
15
= 25 = 0.60

เพราะฉะน้นั ความเท่ียงของแบบทดสอบอิงเกณฑ์ มีค่า = 0.60

2. กำรหำค่ำควำมเทยี่ งของแบบทดสอบองิ เกณฑ์จำกกำรทดสอบเพยี งคร้ังเดียว การหาค่าความ
เท่ียงท่ีไดจ้ ากการทดสอบเพียงคร้ังเดียวมีวธิ ีหาดงั น้ี
ความเที่ยงจากสูตรของ Livingston (1972 อา้ งถึงใน ลว้ น สายยศ และองั คณา สายยศ , 2543)
σ2 (KR.20)  (μ  KC)2
rcc = σ2  (μ  KC)2

เมื่อ rcc = ความเท่ียงของแบบทดสอบอิงเกณฑ์
K = จานวนขอ้ สอบ

ΣXi = ผลรวมของคะแนนท้งั หมด
ΣX 2 = ผลรวมท้งั หมดของคะแนนแตล่ ะตวั ยกกาลงั สอง
i คะแนนของผเู้ รียนแตล่ ะคน
Xi = คะแนนจุดตดั ของแบบทดสอบอิงเกณฑ์
c=
KR.20 = สัมประสิทธ์ิความเท่ียงตามสูตรคานวณของ Kuder Richardson

105 ผูช้ ่วยศาสตราจารย์ ดร.จตุภูมิ เขตจตั ุรัส 105

สำหรับแบบประเมนิ
การตรวจสอบคุณภาพดา้ นความเท่ียงของแบบประเมิน เป็ นการหาความสอดคลอ้ งของระหวา่ ง
ผปู้ ระเมินหรือผสู้ ังเกต เน่ืองจากผูป้ ระเมินหรือผสู้ ังเกตเป็ นผูใ้ ห้คะแนน ดงั น้นั ความคงเส้นคงวาของ
คะแนนพิจารณาจากการใหค้ ะแนนที่ไม่แตกตา่ งกนั จากเครื่องมือแบบเดียวกนั มีวธิ ีการดงั น้ี
กำรหำควำมเทยี่ งระหว่ำงผ้ปู ระเมนิ
สาหรับกรณีผูส้ ังเกต/ผูป้ ระเมิน 2 คน ทาการวดั /ประเมินกลุ่มตวั อย่างคนเดียวกนั ในเวลา
เดียวกนั มี 2 สูตรท่ีคานวณดชั นีความเท่ียงได้ ดงั น้ี

สูตร Interrater Reliability = จานวนการสงั เกตที่เหมือนกนั

จานวนการสังเกตท่ีเหมือนกนั + จานวนการสังเกตที่ต่างกนั
สูตร Kappa (K) = Po – Pe
1 – Pe

Pe คือ ความสอดคลอ้ งท่ีคาดหวงั (Expected Agreement) = [(a + c)(a + b)] + [(b + d)(c + d)]

nn nn

Po คือ ความสอดคลอ้ งท่ีเป็นจริง (Observed Agreement) = (a + d)

เม่ือ n หมายถึง จานวนช่วงเวลาที่พฤติกรรมเกิดข้ึนท้งั หมด n

a หมายถึง จานวนช่วงเวลาท่ีผสู้ งั เกตท้งั 2 คนเห็นวา่ เกิดพฤติกรรมตรงกนั
b หมายถึง จานวนช่วงเวลาท่ีผสู้ งั เกตคนที่ 1 เห็นวา่ เกิด แต่ผสู้ งั เกตคนที่ 2 เห็นวา่ ไมเ่ กิด
c หมายถึง จานวนช่วงเวลาท่ีผสู้ งั เกตคนที่ 1 เห็นวา่ ไม่เกิด แตผ่ สู้ งั เกตคนที่ 2 เห็นวา่ เกิด
d หมายถึง จานวนช่วงเวลาที่ผสู้ งั เกตท้งั 2 คนเห็นวา่ เกิดพฤติกรรมไม่ตรงกนั

สาหรับกรณีมีความผนั แปรของจานวนผสู้ ังเกต/ผูป้ ระเมิน จานวนตวั อยา่ ง และจานวนสิ่งท่ีถูก
สังเกต/ประเมิน อาจใชก้ ารคานวณดชั นีความสอดคลอ้ งระหวา่ งผูป้ ระเมิน (RAI) ได้ โดยสามารถใช้
คานวณกบั การประเมินที่ใหค้ ะแนนเป็ นช่วงสเกล I สเกล ซ่ึงค่า RAI ท่ีไดจ้ ะมีพิสัยต้งั แต่ 0 – 1 ซ่ึงถา้ มี
คา่ เขา้ ใกล้ 1 แสดงวา่ ผปู้ ระเมินเห็นสอดคลอ้ งกนั มาก (ฉตั รศิริ ปิ ยะพิมลสิทธ์ิ, 2559)

สูตร Rater Agreement Index (RAI)
1) RAI กรณมี ีเป้ำพฤติกรรมเดียว ผู้ประเมนิ 2 คน และกล่มุ ตัวอย่ำงคนเดยี ว

ให้ R1 และ R2 แทนผูป้ ระเมิน 2 คน ซ่ึงประเมินกลุ่มตวั อย่างคนเดียวและประเมิน
พฤติกรรมเดียว ประเมินในสเกลที่มีจานวน I สเกล

RAI = 1 – R1 – R2
I–1

106 วิธกี ารและเครื่องมือประเมนิ การเรยี นรูของผเู รยี น 106

ถา้ ผปู้ ระเมินท้งั 2 คน ประเมินให้คะแนนเหมือนกนั RAI จะเท่ากบั 1 ถา้ ผปู้ ระเมิน 2 คน
ประเมินตรงกนั ขา้ ม แลว้ ค่า RAI จะเท่ากบั 0 ในกรณีของคะแนนที่ใหเ้ ป็ น 0 กบั 1 แลว้ I จะมีค่าเท่ากบั
2 ดงั น้นั RAI จะเขียนใหมไ่ ดว้ า่ RAI = 1 – R1 – R2
2) กรณที ปี่ ระเมนิ K พฤติกรรม ผู้ประเมิน 2 คน และกลุ่มตัวอย่ำงคนเดยี ว
ให้ R1k และ RK2kRแ1ทkน–ผRปู้ 2รkะเมิน 2 คน ซ่ึงประเมินกลุ่มตวั อยา่ งเพียงคนเดียวในพฤติกรรมที่ k
RAI = 1–

K( I – 1)
RAI มีค่าระวา่ ง 0 ถึง 1 ถา้ มีค่าเป็น 1 แสดงวา่ ผปู้ ระเมิน 2 คน มีการประเมินสอดคลอ้ งกนั

ในทุกพฤติกรรม
3) กรณที ปี่ ระเมนิ K พฤตกิ รรม ผ้ปู ระเมิน 2 คน และกลุ่มตัวอย่ำง N คน
การประเมินน้ีจะใชผ้ ปู้ ระเมิน 2 คน ประเมินกลุ่มตวั อยา่ ง N คน ซ่ึงมีจานวน K พฤติกรรม
ท่ีเหมือนกนั เราจะให้ R1kn และ R2kn แทนการประเมินของผปู้ ระเมิน 2 คนท่ีประเมินกลุ่มตวั อยา่ ง คน

ที่ n ในพฤติกรรมท่ี k

RAI = 1 – K N R1k – R2k

 

KN( I – 1)

4) กรณที ป่ี ระเมนิ พฤติกรรมเดียว ผู้ประเมินหลำยคน และกล่มุ ตัวอย่ำงคนเดียว
ให้ R1, R2, …., Rm แทนผปู้ ระเมิน จานวน M คน ซ่ึงประเมินกลุ่มตวั อยา่ งคนเดียว และ

พฤติกรรมเดียว และให้ R เป็นคา่ เฉลี่ย จะไดส้ ูตรดงั น้ี

RAI = 1– M Rm – R



(M-1)( I – 1)

5) กรณปี ระเมนิ K พฤติกรรม ผ้ปู ระเมิน M คน และกลุ่มตัวอย่ำงคนเดยี ว
ให้ Rmk แทนการประเมินของผปู้ ระเมินคนที่ m บนพฤติกรรมที่ k ให้ Rk แทนค่าเฉล่ีย

ของการประเมินจานวน k พฤติกรรม สูตรดงั น้ี

Rk = 1 M Rmk
M


RAI = 1 – K M Rmk – Rk

 

K(M – 1)( I – 1)

107 ผชู ว ยศาสตราจารย ดร.จตุภมู ิ เขตจัตุรสั 107

6) กรณปี ระเมิน K พฤตกิ รรม ผู้ประเมิน M คน และกล่มุ ตัวอย่ำง N คน
ให้ Rmnk แทนการประเมินของผปู้ ระเมินคนท่ี m บนพฤติกรรมท่ี k ในกลุ่มตวั อยา่ งคนท่ี n

ให้ Rnk แทน ค่าเฉลี่ยของการประเมินจานวน M คน สูตรดงั น้ี

Rnk = 1 M Rmk
M


K NM

RAI = 1 –   Rmnk – Rnk

KN(M – 1)( I – 1)

ตัวอย่ำง สมมติวา่ มีผปู้ ระเมิน 3 คน ประเมินกลุ่มตวั อยา่ ง 3 คน และกลุ่มตวั อยา่ งแตล่ ะคนจะวดั ใน 4
พฤติกรรม โดยใชแ้ บบประเมินที่มี 5 สเกล
ตำรำงที่ 3.15 ตวั อยา่ งการคานวณดชั นีความสอดคลอ้ งของผปู้ ระเมิน
พฤตกิ รรม ผู้ประเมนิ คนท่ี 1 ผ้ปู ระเมนิ คนที่ 2 ผู้ประเมนิ คนท่ี 3

คนที่ 1 คนท่ี 2 คนท่ี 3 คนที่ 1 คนท่ี 2 คนท่ี 3 คนท่ี 1 คนท่ี 2 คนท่ี 3

1 1 32111323
2 4 54332354
3 4 55232455
4 3 54243455

สร้างเมตริกของคา่ เฉล่ียท่ีใชใ้ นการคานวณ RAI ดว้ ยสมการไดด้ งั น้ี

Rnk = 1 M Rmk
M


1.67 2 2

3.33 4.33 3.33

3.33 4.33 4

3 4.67 4
แทนค่าในสูตรคานวณจะได้

RAI = 1 – K NM Rmnk – Rnk

 

KN(M – 1)( I – 1)

= 1 – 28 = .708

4. 3. (3 – 1)(5 – 1 )

108 วิธกี ารและเคร่ืองมอื ประเมินการเรยี นรขู้ องผูเ้ รียน 108
ค่า RAI คานวณได้ .708 บ่งช้ีถึงความสอดคลอ้ งกนั สูงระหว่างผูป้ ระเมิน แมว้ ่าจะมีความ

แปรปรวนระหวา่ งผูป้ ระเมิน แต่โดยทวั่ ไปการประเมินจะสูงในคู่ของผปู้ ระเมินที่มีการประเมินให้คะแนน
ปานกลางและสูง โดยเฉพาะในตวั อยา่ งน้ีที่มีอยู่ 2 คนท่ีประเมินใหค้ ะแนนสูง และมีอยู่ 1 คน ท่ีประเมินให้
คะแนนต่า ซ่ึงมีความสอดคลอ้ งกนั สูงระหวา่ งผปู้ ระเมิน ดงั น้นั RAI กค็ วรจะมีค่าสูงตามไปดว้ ย

เกณฑ์กำรพจิ ำรณำคุณภำพของเครื่องมือท้งั ฉบับ
ตำรำงท่ี 3.16 เกณฑพ์ จิ ารณาสมั ประสิทธ์ิสหสัมพนั ธ์ (rxy, ) ในการตรวจสอบความตรง
สัมประสิทธ์ิสหสัมพนั ธ์ ระดับควำมสัมพนั ธ์
0.90 – 1.00 อยใู่ นระดบั สูงมาก
0.70 – 0.89 อยใู่ นระดบั สูง
0.50 – 0.69 อยใู่ นระดบั ปานกลาง
0.30 – 0.49 อยใู่ นระดบั ต่า
0.01 – 0.29 อยใู่ นระดบั ต่ามาก

ปรับปรุงจาก ศิริชยั กาญจนวาสี (2555)

ตำรำงที่ 3.17 เกณฑพ์ จิ ารณาสมั ประสิทธ์ิความเที่ยง (rtt , KR20, Cronbach, , rcc)
ค่ำสัมประสิทธ์ิควำมเที่ยง ระดบั ควำมเทย่ี ง ตัวอย่ำงประเภทเคร่ืองมือ
0.90 – 1.00 อยใู่ นระดบั สูงมาก แบบวดั เชาวนป์ ัญญา
0.80 – 0.89 อยใู่ นระดบั สูง แบบทดสอบมาตรฐาน
0.70 – 0.79 อยใู่ นระดบั ปานกลาง (ยอมรับได)้ แบบวดั เจตคติ/แบบสอบครูสร้างข้ึน
ต่ากวา่ 0.70 อยใู่ นระดบั ต่า

ปรับปรุงจาก Murphy and Davidshofer (1991)

ตำรำงท่ี 3.18 เกณฑพ์ จิ ารณาความสอดคลอ้ งระหวา่ งผปู้ ระเมิน (Interrater Reliability, Kappa, RAI)
ค่ำสถิติ Kappa ระดับควำมสอดคล้องระหว่ำงผู้ประเมนิ
0.80 – 1.00 สอดคลอ้ งมากท่ีสุด
0.60 – 0.79 สอดคลอ้ งมาก
0.40 – 0.59 สอดคลอ้ งปานกลาง
0.20 – 0.39 สอดคลอ้ งนอ้ ย
0.01 – 0.19 สอดคลอ้ งนอ้ ยที่สุด
นอ้ ยกวา่ หรือเทา่ กบั 0.00 ไมส่ อดคลอ้ งเลย

109 ผชู้ ว่ ยศาสตราจารย์ ดร.จตภุ มู ิ เขตจตั รุ ัส 109

ข้นั ที่ 6 ปรับปรุงคุณภำพ และเตรียมเคร่ืองมือก่อนนำไปใช้จริง

เมื่อนาเคร่ืองมือวดั และประเมินผลการเรียนรู้ไปทดลองใช้เพื่อตรวจสอบคุณภาพของเครื่องมือ
เป็นที่เรียบร้อยแลว้ ผสู้ อนควรปรับปรุงคุณภาพของเครื่องมือโดยยดึ หลกั การท่ีสาคญั ดงั น้ี

1) ควำมเหมำะสม เพื่อให้มน่ั ใจว่าการประเมินผูเ้ รียนจะมีการดาเนินการอย่างถูกตอ้ งตาม
หลกั การ จรรยาบรรณ โดยคานึงถึงความเป็ นมนุษยข์ องผูเ้ รียนที่ถูกประเมิน และผไู้ ดร้ ับผลกระทบจาก
การประเมิน

2) ควำมเป็ นประโยชน์ เพื่อใหม้ นั่ ใจในประโยชน์ของการประเมิผูเ้ รียน การประเมินผูเ้ รียนท่ีมี
ประโยชนต์ อ้ งใหส้ ารสนเทศ ตรงเวลา และมีบทบาทสาคญั ในการนาไปใชป้ ระโยชน์

3) ควำมเป็ นไปได้ เพื่อใหม้ น่ั ใจว่าการประเมินผูเ้ รียนสามารถนาไปใชไ้ ดต้ ามแผนท่ีกาหนด
การประเมินที่มีความเป็ นไปไดต้ อ้ งสามารถนาไปปฏิบตั ิได้ มีการจดั การท่ีดี และไดร้ ับการสนบั สนุน
เพยี งพอ

4) ควำมถูกต้อง เพ่ือใหม้ น่ั ใจไดว้ า่ การประเมินผูเ้ รียนจะให้ผลการประเมินที่เช่ือถือไดเ้ กี่ยวกบั
การเรียนรู้และผลการปฏิบตั ิงานของผเู้ รียน สารสนเทศท่ีถูกตอ้ งจะนาไปสู่การแปลความหมายท่ีถูกตอ้ ง

เม่ือปรับปรุงคุณภาพเคร่ื องมือแล้ว ผู้สอนจะต้องเตรี ยมเครื่องมือตามแผนการวัดและ
ประเมินผลการเรียนรู้ให้พร้อม มีการช้ีแจงเป้าหมายของการใช้เคร่ืองมือแต่ละประเภทกบั ผูเ้ รียน
ดาเนินการเกบ็ รวบรวมขอ้ มูลผเู้ รียนตามช่วงเวลาท่ีเหมาะสม โดยคานึงถึงมาตรฐานของการประเมินใน
ช้นั เรียนอยา่ งเคร่งครัด

สรุป

ข้นั ตอนการออกแบบและพฒั นาเคร่ืองมือวดั และประเมินผลการเรียนรู้ มี 6 ข้นั ตอนสาคญั
ไดแ้ ก่ ข้นั กาหนดจุดมุ่งหมายของการใชเ้ ครื่องมือวดั และประเมินผล ข้นั กาหนดขอบเขตและออกแบบ
แผนการวดั และประเมินผล ข้นั การกาหนดรายละเอียดเคร่ืองมือ ข้นั สร้างเคร่ืองมือ ข้นั การตรวจสอบ
คุณภาพของเคร่ืองมือ และข้นั ปรับปรุงคุณภาพ และเตรียมเครื่องมือก่อนนาไปใชจ้ ริง ในการออกแบบ
และพฒั นาเครื่องมือน้ันควรคานึงถึงหลักการของมาตรฐานในด้านความถูกต้อง เป็ นประโยชน์
เหมาะสม และเป็นไปได้

ประเด็นกำรอภปิ รำย

1. การสร้างและพฒั นาเครื่องมือวดั และประเมินผเู้ รียนตอ้ งคานึงถึงส่ิงใดบา้ ง
2. เคร่ืองมือวดั และประเมินการศึกษาแต่ละประเภทตอ้ งตรวจสอบคุณภาพเรื่องใดบา้ ง
3. เคร่ืองมือที่ครูสร้างเอง (Teacher Made Test) จาเป็นตอ้ งหาคุณภาพหรือไม่ อยา่ งไร
4. เหตุใดแบบประเมินจึงตอ้ งพจิ ารณาความสอดคลอ้ งระหวา่ งผปู้ ระเมิน
5. มาตรฐานการประเมินในช้นั เรียนเก่ียวขอ้ งกบั กระบวนการสร้างเคร่ืองมืออยา่ งไร

110 วธิ ีการและเครือ่ งมือประเมนิ การเรยี นร้ขู องผเู้ รยี น 110

บทท่ี 4

กำรให้ข้อมูลย้อนกลบั

การให้ขอ้ มูลยอ้ นกลบั หรือการใหค้ าแนะนาป้อนกลบั (Feed back) เป็ นกระบวนการสะทอ้ น
ผลการเรียนรู้ (Learning Reflection) ระหวา่ งผูส้ อนกบั ผเู้ รียน เม่ือไดม้ ีการตดั สินผลการเรียนรู้แลว้ ผล
น้นั ควรไดม้ ีการให้ยอ้ นกลบั ไปยงั ผูเ้ รียน เพ่ือช่วยให้ผูเ้ รียนปรับความรู้และวิธีการเรียนของตนเอง
เพ่ือให้การเรียนบรรลุผลสัมฤทธ์ิสูงข้ึน การให้ข้อมูลยอ้ นกลับที่มีคุณภาพย่อมมีผลเปลี่ยนแปลง
พฤติกรรมของผูเ้ รียน โดยตอ้ งแนะนาไปที่ตวั พฤติกรรม การทางานของผูเ้ รียน ไม่ใช่ไปที่ตวั ตนของ
ผเู้ รียน แนะนาเฉพาะส่วนท่ีผเู้ รียนควบคุมได้ ไม่ใช่สิ่งที่อยูเ่ หนือการควบคุมของผูเ้ รียน และหากผเู้ รียน
ยงั ไม่พร้อม คาแนะนาป้อนกลบั จะไม่มีความหมายใดๆตอ่ ตวั ผเู้ รียนเลย

ในบทน้ีนาเสนอสาระสาคัญเกี่ยวกับเป้าหมายของการให้ข้อมูลย้อนกลับ ข้ันตอนและ
กระบวนการ วธิ ีการใหข้ อ้ มูลยอ้ นกลบั และส่ิงสาคญั ท่ีควรคานึงถึงในการใหข้ อ้ มูลยอ้ นกลบั

4.1 เป้ำหมำยของกำรให้ข้อมูลย้อนกลบั

วิจารณ์ พานิช (2557) ได้สรุปความจากหนงั สือ Embedded Formative Assessment ของ
Wiliam, D. (2011) เกี่ยวกบั การให้ขอ้ มูลยอ้ นกลบั หรือการให้คาแนะนาป้อนกลบั (feed back) วา่ มี
เป้าหมายและวตั ถุประสงคส์ าคญั ดงั น้ี

1) ใช้กระบวนกำรให้คำแนะนำป้อนกลบั เพ่ือกำรเรียนรู้อย่ำงมปี ระสิทธิผล
(1) เชิงบวกและสร้ำงสรรค์ คาแนะนาป้อนกลบั ตอ้ งกระตุน้ การคิดบวก คิดพฒั นาการ

เรียนของตนเอง ไม่กระตุน้ อารมณ์ ปกป้องความรู้สึก หรืออตั ตาตวั ตนของตนเอง
(2) ส่งเสริมกำรเรียนรู้ คาแนะนาป้อนกลบั ตอ้ งช่วยให้ผูเ้ รียนสามารถสร้างงานเพื่อ

พฒั นาตนเอง มีคาแนะนาวิธีการปรับปรุงหรือแกไ้ ขในอนาคต ช่วยให้ผูเ้ รียนเป็ นเจา้ ของกระบวนการ
เรียนรู้ และที่สาคญั ตอ้ งทาให้ผูเ้ รียนมองครูเป็ น “โคช้ ” หรือผูช้ ่วยแนะนาให้เรียนรู้ไดด้ ีข้ึน ไม่ใช่เป็ น
ผพู้ พิ ากษาวา่ ใครเก่งใครไม่เก่ง

(3) ตรงประเดน็ เป้ำหมำยกำรเรียนรู้ หลกั การของการใหค้ าแนะนาป้อนกลบั คือ LESS
is MORE หมายความวา่ คาแนะนาป้อนกลบั ท่ีมีนอ้ ยประเด็น แต่ตรงประเด็นการเรียนรู้ ก่อผลดีต่อ
ผเู้ รียนมากกวา่

2) ใช้ผลกำรประเมนิ เพ่ือนำไปสู่กำรพัฒนำ ในกระบวนการสะทอ้ นผลจะตอ้ งมีการสะทอ้ นถึง
แนวทางการนาผลการประเมินไปใชป้ ระโยชน์ ซ่ึงมี 3 ลกั ษณะที่สาคญั ดงั น้ี

(1) ครูใช้ปรับปรุงแผนและกระบวนกำรจัดเรียนรู้ ท้งั ในส่วนของการทบทวนส่ิงที่
ผเู้ รียนถูกประเมินวา่ ครอบคลุมเป้าหมายท่ีตอ้ งการแลว้ หรือยงั แผนการจดั การเรียนรู้ที่จะช่วยเสริมสร้าง
ผลการเรียนรู้และทกั ษะในศตวรรษท่ี 21 และแผนการประเมินท่ีจะตอ้ งมีประสิทธิภาพและประสิทธิผล
ยงิ่ ข้ึน

111 ผชู้ ว่ ยศาสตราจารย์ ดร.จตุภมู ิ เขตจตั รุ สั 111
(2) ผู้เรียนรำยคนใช้ปรับปรุงกำรเรียนของตนเอง ผูเ้ รียนจะไดร้ ับโอกาสในการทา
ความเขา้ ใจเน้ือหาที่แทจ้ ริง ไม่ยึดติดกบั คะแนน เกิดอุปนิสัยในการตรวจทานตวั เอง เพ่ิมทกั ษะการ
ขวนขวายหาคาตอบ และนาคาแนะนาจากครูไปใชใ้ นการปรับปรุงและพฒั นาตนเอง
(3) ผู้เรียนท้ังช้ันใช้ในกำรร่วมกันปรับปรุงบรรยำกำศกำรเรียนในช้ันเรียน เพื่อสร้าง
ชุมชนการเรียนรู้ในช้นั เรียนที่เกิดจากความร่วมมือกนั มองเห็นโอกาสการเรียนรู้จากเพือ่ นและครู

4.2 ข้นั ตอนของกระบวนกำรให้ข้อมูลย้อนกลบั

โชติมา หนูพริก (2557) ไดน้ าเสนอบทความเกี่ยวกบั “เทคนิคการประเมินเพ่ือการเรียนรู้ :การ
ต้งั คาถามและการใหข้ อ้ มูลยอ้ นกลบั เพอื่ ส่งเสริมการเรียนรู้”ไดอ้ ยา่ งน่าสนใจดงั น้ี

การใหข้ อ้ มูลยอ้ นกลบั เป็นองคป์ ระกอบท่ีสาคญั ในการส่งเสริมการเรียนรู้และการประเมินเพื่อ
การเรียนรู้ (Assessment for learning) ซ่ึงการจดั การเรียนรู้ในยุคปัจจุบนั ตอ้ งการให้ผเู้ รียนมีส่วนร่วมใน
กระบวนการเรียนรู้ แนวคิดน้ีส่งเสริมการมีส่วนร่วมในการเรียนระหวา่ งผเู้ รียนและครู พฒั นาความรู้
ความสามารถของผูเ้ รียนโดยมีการเปล่ียนแปลงพฤติกรรมของผูเ้ รียนในระยะยาวมากกว่าข้อมูล
ยอ้ นกลบั ท่ีไดร้ ับจากครู รวมถึงการสร้างบรรยากาศในการเรียนรู้แบบมิตร

การใหข้ อ้ มูลยอ้ นกลบั แก่ผูเ้ รียนมี 3 ลกั ษณะ ไดแ้ ก่ การใหข้ อ้ มูลกระตุน้ การเรียนรู้ (Feed up)
การใหข้ อ้ มูลยอ้ นกลบั (Feed back) และการใหข้ อ้ มูลเพื่อการเรียนรู้ต่อยอด (Feed forward) เพ่ือ
พฒั นาการเรียนรู้ ผูเ้ รียนตระหนักในการเรียนรู้อย่างต่อเนื่องสอดคลอ้ งกบั การประเมินผูเ้ รียนใน
ศตวรรษท่ี 21 ให้ความสาคญั กบั การประเมินเพ่ือปรับปรุงการเรียนรู้ของผูเ้ รียน (Improve Student
Learning) การประเมินเพ่ือการเรียนรู้ (Assessment for learning) และใชก้ ารประเมินเป็ นเครื่องมือการ
เรียนรู้ (Assessment as Learning)

การใหข้ อ้ มูลยอ้ นกลบั นกั เรียนเป็ นองคป์ ระกอบสาคญั ของการประเมินเพื่อพฒั นาการเรียนรู้ มี
ประโยชนต์ อ่ การเรียนการสอน ซ่ึงไมม่ ีกฎเกณฑต์ ายตวั แต่ข้ึนอยกู่ บั บริบทของการจดั การเรียนรู้ การให้
ขอ้ มูลแก่นกั เรียนที่มีประสิทธิภาพจะตอ้ งตรงประเด็น อธิบายผลที่เกิดตามจริงและทนั เวลาเพื่อนกั เรียน
จะไดแ้ กไ้ ขไดท้ นั ท่วงที จะไม่ตดั สินวา่ ถูก – ผดิ แต่จะบอกใหน้ กั เรียนเห็นประเด็นตามเกณฑแ์ ลว้ สรุป
การปฏิบตั ิของตนเองว่าเป็ นอยา่ งไร ห่างจากเป้าหมายอยา่ งไร และตอ้ งทาอะไรต่อไปเพ่ือให้บรรลุ
เป้าหมาย การให้ขอ้ มูลแก่นกั เรียนท่ีมีประสิทธิภาพส่งเสริมให้นกั เรียนสามารถเรียนรู้ไดด้ ว้ ยตนเอง
เพราะนกั เรียนไดฝ้ ึกฝนการประเมินตนเอง

Nancy Frey and Douglas Fisher (2011) ปรับปรุงจาก Hattie and Timperley ไดเ้ สนอรูปแบบ
การประเมินระหวา่ งเรียนที่มีประสิทธิภาพ ดงั ภาพที่ 9.1 ซ่ึงแบ่งการให้ขอ้ มูลยอ้ นกลบั แก่นกั เรียน มี 4
ข้นั ดงั น้ี

ข้ันท่ี 1 การกระตุน้ และสร้างแรงจูงใจในการเรียน (Feed up) โดยแจง้ จุดประสงคก์ ารเรียนรู้
และการประเมินที่ชดั เจนเพื่อให้นกั เรียนเห็นคุณค่าในการเรียนรู้และการประเมิน ทาให้ครูมนั่ ใจไดว้ ่า
นกั เรียนมีความเขา้ ใจจุดประสงคก์ ารเรียนรู้ ความคิดรวบยอด ภาระงาน และการประเมินผล

112 วธิ ีการและเคร่ืองมือประเมินการเรียนรขู องผเู รียน 112
ข้ันท่ี 2 การตรวจสอบความเขา้ ใจเพื่อพฒั นาการเรียนรู้ (Checking for understanding) โดยการ

พดู ตอบคาถาม การนาเสนอ การเขียน ฯลฯ
ข้ันที่ 3 การใหข้ อ้ มูลสารสนเทศเก่ียวกบั ความสาเร็จและส่ิงที่จาเป็ นตอ้ งไดร้ ับการพฒั นาหรือ

ปรับปรุงแกไ้ ขแก่นกั เรียน (Feedback)
ข้ันท่ี 4 การใหค้ าแนะนา ช้ีแนะแนวทางบนพ้ืนฐานของขอ้ มูลเชิงประจกั ษ์ เพ่ือกระตุน้ ให้

นกั เรียนเกิดพฒั นาการเรียนรู้ท่ีสูงข้ึน (Feed forward)

รูปแบบกำรประเมนิ ระหว่ำงเรียนทมี่ ปี ระสิทธิภำพ

เป้าหมายที่จะพฒั นา ลดช่องวา่ งระหวา่ งเป้าหมายที่คาดหวงั กบั
นกั เรียน ผลลพั ธท์ ี่จะ ความเขา้ ใจ ทกั ษะของนกั เรียน

เกิด วธิ ีการ/แนวทางใน
การลดช่องวา่ ง

ครู นกั เรียน
กาหนดเป้าหมายเท่ีทา้ ทายและเหมาะสมกบั ใชค้ วามพยายามท่ีจะทากิจกรรมที่มีประสิทธิภาพ
นกั เรียนหรือใชร้ ะบบประเมนิ เพอ่ื พฒั นานกั เรียน
หรือละทิง้ เป้าหมายเดิม ต้งั เป้าหมายใหส้ ูงข้ึน

กระตน้ และการสร้าง เทคนิคการใหข้ อ้ มลู ใหข้ อ้ มลู ยอ้ นกลบั เพอ่ื
แรงจูงใจในการเรียนรู้ เพือ่ พฒั นานกั เรียน กระตนุ้ ความกา้ วหนา้ ในการ

(Feed up) เรียนรู้ (Feed forward)

เทคนิคการตรวจสอบความเขา้ ใจ ใหน้ กั เรียนมีขอ้ มลู ท่ีมีคุณคา่ และ
เพ่ือพฒั นาการเรียนรู้ สร้างสรรคเ์ ก่ียวกบั ความสาเร็จ
และความตอ้ งการ (Feedback)
(Checking for understanding)

ภำพที่ 4.1 รูปแบบการประเมินระหวา่ งเรียนท่ีมีประสิทธิภาพโดยใชเ้ ทคนิคการใหข้ อ้ มูลเพ่อื พฒั นานกั เรียน

ท่ีมาภาพ: Visible Learning: A Synthesis of over 800 meta-analysis relating to achievement (p176) by Hattie, 2009,
New York: Routledge.Copyright 2009 by Routledge. Adapted with permission. อา้ งถึงใน โชติมา หนูพริก (2557)

113 ผูช วยศาสตราจารย ดร.จตภุ มู ิ เขตจตั ุรัส 113
ในการจดั การเรียนรู้ของครูผสู้ อนสามารถนาข้นั ตอนของการใหข้ อ้ มูลยอ้ นกลบั มาใชต้ าม
ข้นั ตอนของกระบวนการจดั การเรียนรู้ ดงั ภาพที่ 9.2

กระตุ้นและสร้ำงแรงจูงใจในกำรเรียนรู้
-การสงั เกต
ข้นั นำ -ซกั ถาม

-การแสดงออก
-กิจกรรม

ข้นั สอน กำรให้ข้อมูลย้อนกลบั
-ภาระงาน
-กระบวนการภาระงาน
-การควบคุมตนเอง
-การเป็ นตวั ตนของตนเอง
กำรตรวจสอบควำมเข้ำใจ
-การสงั เกต ซกั ถาม
-การพดู การนาเสนอ
-การเขียน
-กระบวนการทางาน
-โครงงาน

ข้ันสรุป กำรให้ข้อมูลย้อนกลบั
- ครูและนกั เรียนสะทอ้ นผล ประเมิน
ตนเอง การใหข้ อ้ มลู ยอ้ นกลบั เพ่อื
กระตุน้ ความกา้ วหนา้ ในการเรียน
- การเสริมแรงเพ่ือการปรับปรุงพฒั นา
เรียนรู้ตอ่ ยอด

ภำพท่ี 4.2 การใหข้ อ้ มูลยอ้ นกลบั ตามข้นั ตอนของกระบวนการจดั การเรียนรู้

114 วิธีการและเครื่องมอื ประเมินการเรยี นร้ขู องผเู้ รยี น 114

4.3 วธิ กี ำรให้ข้อมูลย้อนกลบั

วธิ ีกำรให้ข้อมูลย้อนกลบั ตำมกระบวนกำรเรียนรู้ของผู้เรียน
1) กำรให้ผลสะท้อนกลบั เกยี่ วกบั ผลงำน (task) วา่ ผลงานท่ีปฏิบตั ิดีหรือไม่ ถูกตอ้ งหรือไม่ เช่น
การแกโ้ จทยป์ ัญหาขอ้ น้ีถูกตอ้ ง หรือการแกโ้ จทยป์ ัญหาขอ้ น้ีผดิ
2) กำรให้ข้อมูลย้อนกลบั เก่ียวกบั กระบวนกำร (process) วา่ กระบวนการท่ีใชใ้ นการปฏิบตั ิงาน
มีขอ้ บกพร่องอยา่ งไร จะแกข้ อ้ บกพร่องของกระบวนการอยา่ งไร มีทางเลือกในการปฏิบตั ิงานดว้ ยวิธี
อ่ืนหรือไม่ เช่น นกั เรียนลองตรวจสอบดูใหม่ซิ วา่ การแกโ้ จทยป์ ัญหาขอ้ น้ียงั มีขอ้ บกพร่องตรงไหน
หรือการแกโ้ จทยป์ ัญหาขอ้ น้ีถูกตอ้ งแลว้ แต่มีวิธีการแกโ้ จทยป์ ัญหาวิธีการอ่ืนหรือไม่ หรือขณะท่ีแก้
โจทย์ปัญหานักเรียนคุยกับเพ่ือนอยู่ นักเรียนลองน่ังทาคนเดียวไม่คุยกับเพื่อนดูซิว่าคาตอบจะ
เหมือนเดิมหรือไม่
3) กำรให้ข้อมูลย้อนกลับเก่ียวกบั กำรกำกับติดตำมตนเอง (self-regulation) วา่ นกั เรียนตอ้ ง
ตรวจสอบผลงานไดอ้ ยา่ งไร เช่น นกั เรียนทาแบบฝึ กหดั ไม่ทนั เวลา คราวหนา้ นกั เรียนจะทาอยา่ งไรให้
ทนั เวลา หรือ คราวน้ีนกั เรียนลืมนางานมาส่งครู จะทาอยา่ งไรไม่ใหน้ กั เรียนลืมอีก
4) กำรให้ข้อมูลย้อนกลับเก่ยี วกับกำรประเมินตนเอง (self-personal evaluation) วา่ ผลงานของ
ตนเองเป็นอยา่ งไร เม่ือเทียบกบั เกณฑม์ ีคุณภาพระดบั ใด เช่น นกั เรียนพอใจในผลงานของตนเองหรือยงั
หรือ ผลงานของนกั เรียนมีคุณภาพระดบั ใด หรือ ถา้ ครูให้โอกาสปรับปรุงผลงานอีกคร้ัง นกั เรียนจะ
ปรับปรุงหรือไม่ ถา้ ปรับปรุงจะปรับปรุงอยา่ งไร

วธิ ีกำรให้ข้อมูลย้อนกลบั โดยกำรเขียนให้มปี ระสิทธิภำพ
ในการให้ขอ้ มูลยอ้ นกลบั โดยการเขียน ครูจาเป็ นตอ้ งเลือกให้คาหรือวลีที่มีความเหมาะสม
เพราะส่ิงเหล่าน้ีจะสร้างคุณค่าให้แก่นกั เรียน รวมไปถึงการสนบั สนุนและส่งเสริมใหน้ กั เรียนเกิดการ
เรียนรู้ โดยอาจจะเขียนลงในงานของนกั เรียน เขียนโดยอา้ งอิงเกณฑ์ (Rubrics) หรือเขียนลงในใบงาน
ของนกั เรียนโดยมีวธิ ีการเขียนการใหข้ อ้ มูลยอ้ นกลบั ที่ดี ดงั น้ี
1) หลีกเลี่ยงการใชป้ ากกาหมึกสีแดงเพราะทาใหน้ กั เรียนรู้สึกวา่ งานของตนมีขอ้ ผดิ พลาด
2) เขียนการใหข้ อ้ มูลยอ้ นกลบั ดว้ ยลายมือที่อา่ นง่าย
3) เขียนการใหข้ อ้ มูลยอ้ นกลบั ดว้ ยขอ้ ความที่เขา้ ใจง่าย มีนยั ทางบวก
4) เขียนการใหข้ อ้ มูลยอ้ นกลบั โดยใชเ้ ทคนิค Sandwich 3 ข้นั ตอน ดงั น้ี

ข้นั ตอนแรก เขียนขอ้ ความชมเชย โดยนาขอ้ ดีของนกั เรียนกล่าวข้ึนตน้
ข้นั ตอนท่ีสอง เขียนขอ้ ความท่ีตอ้ งการใหป้ รับปรุง แกไ้ ข
ข้นั ตอนสุดท้าย เขียนข้อความที่เป็ นเชิงบวกโดยกล่าวถึงส่ิงที่จะเป็ นผลจากการ
ปรับปรุงผลงานน้นั ๆ

115 ผูช้ ่วยศาสตราจารย์ ดร.จตุภูมิ เขตจัตรุ สั 115

4.4 ส่ิงสำคญั เกย่ี วกบั กำรให้ข้อมูลย้อนกลบั

1) ควรใหข้ อ้ มูลยอ้ นกลบั ท่ีส่งเสริมความสาเร็จของผเู้ รียน
2) ถา้ นกั เรียนรู้สึกปลอดภยั จะเกิดการเรียนรู้และพฒั นาไดม้ ากข้ึน
3) ขอ้ มูลยอ้ นกลบั จากผเู้ รียนเป็นประโยชน์ต่อการพฒั นาคุณภาพการจดั การเรียนรู้
4) ใหข้ อ้ มูลยอ้ นกลบั อยา่ งหลากหลาย ครอบคลุม คุณภาพผลงาน กระบวนการทางาน การ
กากบั ตนเองและคุณลกั ษณะส่วนบุคคล
5) ขอ้ มูลยอ้ นกลบั ท่ีทาใหเ้ กิดการเปลี่ยนแปลง มกั เกิดข้ึนในระหวา่ งการจดั การเรียนรู้
6) ควรใหเ้ พ่อื นใหข้ อ้ มูลยอ้ นกลบั ซ่ึงกนั และกนั เป็นส่ิงสาคญั ของการเรียนรู้
7) ใหน้ กั เรียนกาหนดเป้าหมายของตนเองอยเู่ สมอ แลว้ ใหข้ อ้ มูลยอ้ นกลบั ที่เป็ นประโยชน์ต่อ
การบรรลุเป้าหมายของแต่ละคน

สรุป

การให้ขอ้ มูลยอ้ นกลบั ไปยงั นักเรียนเป็ นส่ิงที่ครูตอ้ งปฏิบตั ิเป็ นประจาและตอ้ งคานึงว่าการ
จะตอ้ งไม่เป็ นการสร้างแรงกดดนั ให้กบั นกั เรียน แต่ตอ้ งเป็ นการกระตุน้ สร้างแรงจูงใจใฝ่ สัมฤทธ์ิ โดย
อาจเป็ นการให้รางวลั การกล่าวชมเชย หรือการประทบั รูปภาพท่ีแสดงนยั ในทางบวก เช่น ภาพใบหนา้
ท่ีมีรอยยิม้ การติดสติกเกอร์รูปท่ีสวยงาม มากกวา่ ที่จะเป็ นการให้คะแนนที่เป็ นตวั เลข หรือการเขียน
ขอ้ ความเพ่ือใหพ้ ฒั นาหรือปรับปรุงเพียงอยา่ งเดียว นอกจากน้ีการให้ขอ้ มูลยอ้ นกลบั ที่มีประสิทธิภาพ
และประสิทธิผลควรมีวตั ถุประสงคห์ ลกั เพ่ือใหน้ กั เรียนไดท้ ราบเทคนิค/วธิ ีการในการปรับปรุงผลงาน
และเพอื่ สะทอ้ นใหเ้ ห็นแนวทางในการสร้างผลงานที่มีประสิทธิผลต่อไป

ประเดน็ อภปิ รำย

1. ขอ้ มูลเก่ียวกบั ผเู้ รียนดา้ นใดบา้ งที่ควรนามาใหข้ อ้ มูลยอ้ นกลบั
2. วธิ ีการและเครื่องมือประเมินผลการเรียนรู้มีความสมั พนั ธ์อยา่ งไรกบั การใหข้ อ้ มูลยอ้ นกลบั
3. ผลของการใหข้ อ้ มูลยอ้ นกลบั สามารถนามาใชป้ รับปรุงการจดั การเรียนรู้ไดอ้ ยา่ งไร
4. ผปู้ กครองมีบทบาทอยา่ งไรในการใหข้ อ้ มลู ยอ้ นกลบั กบั ครูและนกั เรียน
5. ควรรายงานการเรียนรู้ของผเู้ รียนอยา่ งไรใหม้ ีขอ้ มูลยอ้ นกลบั ที่เป็นประโยชนม์ ากที่สุด

116 วิธกี ารและเครือ่ งมอื ประเมินการเรยี นรู้ของผเู้ รยี น 116

บทที่ 5

มำตรฐำนกำรประเมนิ

"Teachers make judgments about students every day, based on such formal and
informal appraisals of their work as classroom observation, homework assignments, and
teacher-made quizzes. Soon, they'll have the first set of professional standards to help guide
them in making such decisions."

"ครูให้คาตดั สินเก่ียวกบั นักเรียนทุกวนั ซ่ึงมาจากการประเมินท้ังที่เป็ นทางการและไม่
เป็ นทางการ ไม่ว่าจะเป็ นการสังเกตในห้องเรียน การตรวจการบ้าน และแบบทดสอบที่ครูสร้ าง
ขึน้ จึงเป็ นที่มาของการกาหนดมาตรฐานวิชาชีพที่จะช่วยแนะนาให้คุณครูทั้งหลายได้นาไปใช้
ในการตดั สินใจปฏิบัติในการวดั และประเมินผ้เู รียน"
—Education Week

ในบทน้ีนาเสนอสาระสาคญั เกี่ยวกบั มาตรฐานการประเมินในช้นั เรียน ดงั น้ี

มำตรฐำนกำรประเมนิ ในช้ันเรียน (Classroom Assessment Standard)

มาตรฐานการประเมินในช้นั เรียน เป็นขอ้ กาหนดท่ีไดร้ วบรวมข้ึนอยา่ งเป็ นระบบโดยไดร้ ับการ
ยอมรับจากองคก์ รวิชาชีพท่ีบ่งบอกถึงการปฏิบตั ิท่ีสอดคลอ้ งและถูกตอ้ งของการประเมินในช้นั เรียน
เพ่ือนาไปใชแ้ จง้ ตอ่ ครูผสู้ อน ผเู้ รียน รวมถึงพอ่ แม่ผปู้ กครอง ผูใ้ ชผ้ ลการประเมินเก่ียวกบั ความกา้ วหนา้
ของผูเ้ รียนที่จะได้รับความรู้ ทกั ษะ เจตคติ และพฤติกรรมการเรียนรู้ท่ีพึงประสงค์ของสถานศึกษา
(Joint Committee on Standards for Educational Evaluation, 2003)

โครงสร้างของมาตรฐานการประเมินในช้นั เรียน ประกอบดว้ ย องคป์ ระกอบสาคญั 3 ส่วน
ไดแ้ ก่ (1) หลกั การพ้ืนฐาน (Foundations) (2) การใช้ (Use) และ (3) คุณภาพ (Quality) มาตรฐานน้ีไม่ได้
ครอบคลุมถึงการประเมินระดบั เขตพ้ืนท่ี (district level) และการประเมินระดบั ชาติ (National level)
มาตรฐานน้ีแตกต่างจากมาตรฐานการประเมินผูเ้ รียนในแง่ที่เป็ นมาตรฐานท่ีไดร้ ับการพฒั นาเพื่อให้
สื่อสารกบั ครูผสู้ อนไดอ้ ยา่ งเขา้ ใจและนาไปใชไ้ ดง้ ่ายที่สุด มาตรฐานการประเมินในช้นั เรียนที่พฒั นาข้ึน
โดยคณะกรรมการชุดน้ีประกอบกอบดว้ ยมาตรฐาน 3 ดา้ น รวม 17 มาตรฐาน มีดงั น้ี

117 ผชู วยศาสตราจารย ดร.จตุภูมิ เขตจัตรุ ัส 117

มำตรฐำนด้ำนหลกั กำรพืน้ ฐำน (FOUNDATIONS)

เป็ นมาตรฐานท่ีเน้นให้การประเมินในช้ันเรียนมีความสอดคล้องกับผลการเรียนรู้ที่คาดหวงั ตาม
หลกั สูตร ใหส้ ารสนเทศที่ถูกตอ้ งเก่ียวกบั จุดแข็งและจุดที่ควรพฒั นา กระตุน้ ให้เกิดการเรียนรู้ท่ีต่อเน่ือง
การส่งเสริมสนบั สนุนให้ผเู้ รียนเกิดการเรียนรู้เป็ นเป้าหมายสาคญั ของการประเมินในช้นั เรียน การแจง้
ผลและสื่อสารถึงผูเ้ รียน พ่อแม่ผูป้ กครอง และผูท้ ่ีจะนาผลมาใช้ การนาผลประเมินมาปรับปรุงการ
จดั การเรียนการสอน และการเรียนรู้ รวมถึงผใู้ ชผ้ ลประเมินในดา้ นอื่นๆ

F1: เป้าหมายการประเมิน (Assessment Purpose) การปฏิบตั ิการประเมินในช้นั เรียนควรมีความ
ชดั เจนของเป้าหมายที่จะส่งเสริมสนบั สนุนการเรียนการสอน

F2: ผลการเรียนรู้ท่ีคาดหวงั (Learning Expectations) การปฏิบตั ิการประเมินในช้นั เรียนควร
สอดคลอ้ งกบั ผลการเรียนรู้ท่ีคาดหวงั /มาตรฐานการเรียนรู้ และการจดั การเรียนการสอน ท่ีสามารถ
ตอบสนองความตอ้ งการของผเู้ รียนแตล่ ะคนอยา่ งเหมาะสม

F3: การออกแบบการประเมิน (Assessment Design) ประเภทและวิธีการประเมินในช้นั เรียน
ควรมีความชดั เจนและเหมาะสมที่ช่วยใหผ้ เู้ รียนไดแ้ สดงออกถึงผลการเรียนรู้ของพวกเขา

F4: การให้ผูเ้ รียนมีส่วนร่วมในการประเมิน (Student Engagement in Assessment) ผูเ้ รียนควร
ไดร้ ับความสาคญั ใหเ้ ขา้ ร่วมในกระบวนการประเมินและใชห้ ลกั ฐานการประเมินเพื่อส่งเสริมการเรียนรู้
ของพวกเขา

F5: การเตรียมการประเมิน (Assessment Preparation) ความพร้อมของครูผูส้ อน การเตรียม
ความพร้อมของผูเ้ รียน ทรัพยากร เวลา และโอกาสการเรียนรู้ ควรเป็ นเร่ืองที่ตอ้ งคานึงถึงในการ
ประเมินในช้นั เรียน

F6: การแจ้งผลประเมินต่อผูเ้ รียน พ่อแม่และผูป้ กครอง (Informed Students and
Parents/Guardians) เป้าหมายและการใชก้ ารประเมินในช้นั เรียนควรมีการสื่อสารถึงผูเ้ รียน ผปู้ กครอง
ไดอ้ ยา่ งเหมาะสม

118 วธิ กี ารและเครอื่ งมอื ประเมินการเรยี นรขู องผเู รยี น 118

มำตรฐำนด้ำนกำรใช้ (USE)

เป็ นมาตรฐานที่เน้นให้ครูเกิดความมนั่ ใจในผลการประเมินที่จะช่วยส่งเสริมสนบั สนุนการเรียนรู้
และผลสัมฤทธ์ิของผูเ้ รียน ขอ้ ระวงั ในการวิเคราะห์ความสามารถของผูเ้ รียนที่จะให้สารสนเทศที่
สาคญั คะแนน และให้ขอ้ มูลยอ้ นกลบั ไปยงั การจดั การเรียนการสอน รวมถึงผลของการประเมินใน
ช้ันเรียนควรใช้สรุปผลการเรียนรู้ของผูเ้ รียนและส่ือสารไปถึงผูเ้ รียน พ่อแม่ผูป้ กครองและตัว
ครูผสู้ อน

U1: การวิเคราะห์ผลการปฏิบตั ิงานของผเู้ รียน (Analysis of Student Performance) วิธีสาหรับ
วิเคราะห์หลกั ฐานร่องรอยการเรียนรู้ของผูเ้ รียนควรมีความเหมาะสมกบั เป้าหมายการประเมินและการ
จดั การเรียนการสอน

U2: การให้ขอ้ มูลยอ้ นกลบั ท่ีมีประสิทธิผล (Effective Feedback) ควรมีเวลาในการให้ขอ้ มูล
ยอ้ นกลบั ที่เพียงพอเพ่อื ปรับปรุงการเรียนรู้ของผเู้ รียน

U3: การติดตามการจดั การเรียนการสอน (Instructional Follow-up) ผสู้ อนควรวิเคราะห์ ติดตาม
ผลการปฏิบตั ิการสอนของตนเองโดยใช้ผลการประเมิน เพื่อนามาปรับปรุง ส่งเสริม สนับสนุนการ
เรียนรู้ของผเู้ รียน

U4: การให้คะแนนและขอ้ เสนอแนะเชิงสรุป (Grades and Summative Comments) การ
ประเมินผลการเรียนและการให้ขอ้ เสนอแนะ ควรสะทอ้ นผลสัมฤทธ์ิของผเู้ รียนอยา่ งแทจ้ ริง ต่อผลการ
เรียนรู้ท่ีคาดหวงั /มาตรฐานการเรียนรู้

U5: การรายงานคะแนน (Reporting) รายงานประเมินของผเู้ รียนควรอยบู่ นหลกั การของความ
เพียงพอของหลกั ฐานร่องรอยการเรียนรู้และให้ผลสรุปท่ีเก่ียวกบั ผลการเรียนรู้ของผูเ้ รียนอยา่ งชดั เจน
ทนั เวลาและตรงกบั ความตอ้ งการ รวมถึงเป็นประโยชนต์ อ่ ผใู้ ชผ้ ลการประเมิน

119 ผูชวยศาสตราจารย ดร.จตภุ มู ิ เขตจตั ุรัส 119

มำตรฐำนด้ำนคุณภำพ (QUALITY)

เป็ นมาตรฐานท่ีเน้นให้ครูเกิดความมนั่ ใจในการประเมินช้นั ในเรียนของตนเองว่าให้สารสนเทศ
เกี่ยวกบั ผลการเรียนรู้ของผูเ้ รียนที่ถูกตอ้ งและเชื่อถือได้ การประเมินตอ้ งปราศจากความลาเอียง
สอดคลอ้ งกบั ชีวติ จริง มีการสะทอ้ นผลและปรับปรุงการปฏิบตั ิการประเมินในช้นั เรียนอยา่ งตอ่ เนื่อง

Q1: ความหลากหลายทางวฒั นธรรมและภาษา (Cultural and Linguistic Diversity) การ
ปฏิบตั ิการประเมินในช้นั เรียนควรรับผดิ ชอบและเคารพต่อความหลากหลายทางวฒั นธรรมและภาษา
ของผเู้ รียนและชุมชนที่พวกเขาอาศยั อยู่

Q2: ความตอ้ งการพิเศษในการไดร้ ับการศึกษา (Exceptionality and Special Education) การ
ปฏิบตั ิการประเมินในช้ันเรียนควรเหมาะสมกับความแตกต่างของผูเ้ รียนท่ีมีความตอ้ งการเฉพาะ
รายบุคคลไดอ้ ยา่ งเหมาะสม

Q3: การปราศจากความลาเอียง (Freedom from Bias) การปฏิบตั ิการประเมินในช้นั เรียนและ
การตดั สินผลไมไ่ ดร้ ับอิทธิพลจากปัจจยั แทรกซอ้ นอื่นๆที่จะมีต่อเป้าหมายของการประเมิน

Q4: ความตรง (Validity) การปฏิบตั ิการประเมินในช้นั เรียนควรใหส้ ารสนเทศท่เี พียงพอและ
เหมาะสมที่จะช่วยสนบั สนุนการตดั สินที่ถูกตอ้ งเก่ียวกบั ความรู้และทกั ษะของผเู้ รียนแต่ละคน

Q5: ความเท่ียง (Reliability) การปฏิบตั ิการประเมินในช้นั เรียนควรมีความคงเส้นคงวา เช่ือถือ
ได้ มีสารสนเทศท่ีช่วยสนบั สนุนการตดั สินใจที่ถูกตอ้ งเกี่ยวกบั ความรู้และทกั ษะของผเู้ รียนแตล่ ะคน

Q6: การสะทอ้ นผล (Reflection) การปฏิบตั ิการประเมินในช้นั เรียนควรถูกกากบั และทบทวน
เพื่อปรับปรุงคุณภาพโดยรวมท้งั หมดของครูผสู้ อน

สรุป

มาตรฐานการประเมินเป็ นข้อกาหนดในการดาเนินงานดา้ นการวดั และประเมินผลทางการ
ศึกษาท่ีไดร้ ับการยอมรับในวิชาชีพดา้ นการวดั และประเมินผล ช่วยให้มีเกณฑ์กลางในการกากบั และ
ควบคุมคุณภาพของการดาเนินงานปฏิบตั ิดา้ นการประเมินผเู้ รียน การประเมินในช้นั เรียนของครูผสู้ อน
มาตรฐานการประเมินผู้เรียน ประกอบด้วย มาตรฐานด้านความเหมาะสม มาตรฐานด้าน
อรรถประโยชน์ มาตรฐานดา้ นความเป็ นไปได้ และมาตรฐานดา้ นความถูกตอ้ ง สาหรับมาตรฐานการ
ประเมินในช้นั เรียน ประกอบดว้ ย มาตรฐานดา้ นหลกั การพ้ืนฐาน มาตรฐานดา้ นการใช้ และมาตรฐาน
ดา้ นคุณภาพ การดาเนินการวดั และประเมินผลการศึกษาใหไ้ ดต้ ามมาตรฐานที่กาหนดจะช่วยสร้างความ
มน่ั ใจใหก้ บั ผรู้ ับบริการทางการศึกษา ท้งั ผเู้ รียน ผปู้ กครอง ผเู้ กี่ยวขอ้ งใหเ้ กิดความเชื่อมน่ั และเกิดการ
พฒั นาคุณภาพการจดั การศึกษาใหไ้ ดค้ ุณภาพมากท่ีสุด

120 วธิ ีการและเคร่ืองมอื ประเมินการเรยี นรขู้ องผู้เรยี น 120

ประเด็นกำรอภปิ รำย

1. มาตรฐานการประเมินผูเ้ รียนมีความสาคญั อยา่ งไรตอ่ ผเู้ รียน
2. มาตรฐานการประเมินในช้นั เรียนมีความสาคญั อยา่ งไรต่อครูผสู้ อน
3. ผบู้ ริหารโรงเรียนมีบทบาทอยา่ งไรในการนามาตรฐานการประเมินผเู้ รียน มาตรฐานการ
ประเมินในช้นั เรียนมาใชใ้ นโรงเรียน
4. กระบวนการนามาตรฐานการประเมินมาใชใ้ นสถานศึกษาควรดาเนินการอยา่ งไร
5. มาตรฐานการประเมินส่งผลตอ่ คุณภาพของการจดั การศึกษาอยา่ งไร

121 ผชู้ ่วยศาสตราจารย์ ดร.จตภุ มู ิ เขตจัตุรัส 121

บรรณำนุกรม

กมลวรรณ ตงั ธนกานนท์. (2559). กำรวัดและประเมินทักษะกำรปฏิบัติ. กรุงเทพมหานคร: โรงพิมพ์
แห่งจุฬาลงกรณ์มหาวทิ ยาลยั .

กรมวิชาการ กระทรวงศึกษาธิการ. (2546). กรอบควำมคิดและแนวทำงกำรประเมินผลด้วยทำงเลือก
ใหม่ตำมหลกั สูตรกำรศึกษำข้ันพืน้ ฐำน พุทธศักรำช 2544. กรุงเทพมหานคร : สานกั ทดสอบ
ทางการศึกษา กรมวชิ าการ กระทรวงศึกษาธิการ.

กระทรวงศึกษาธิการ. (2551). หลกั สูตรแกนกลำงกำรศึกษำข้ันพืน้ ฐำน พ.ศ.2551. กรุงเทพมหานคร :
โรงพิมพค์ ุรุสภาลาดพร้าว.

โครงการ PISA ประเทศไทย สถาบนั ส่งเสริมการสอนวทิ ยาศาสตร์และเทคโนโลย.ี (2554). กรอบ
โครงสร้ำงกำรประเมินผลนักเรียนนำนำชำติ PISA 2009. กรุงเทพฯ : หา้ งหุน้ ส่วนจากดั อรุณ
การพิมพ.์

โครงการ PISA ประเทศไทย สถาบนั ส่งเสริมการสอนวทิ ยาศาสตร์และเทคโนโลย.ี (2554). ผลกำร
ประเมนิ PISA 2009 กำรอ่ำน คณติ ศำสตร์ และวทิ ยำศำสตร์. กรุงเทพฯ : หา้ งหุน้ ส่วนจากดั
อรุณการพิมพ.์

โครงการ PISA ประเทศไทย สถาบนั ส่งเสริมการสอนวทิ ยาศาสตร์และเทคโนโลย(ี สสวท.)
กระทรวงศึกษาธิการ. (2554).ข้อสอบกำรอ่ำน. กรุงเทพฯ : หา้ งหุน้ ส่วนจากดั อรุณการพิมพ.์

โครงการ PISA ประเทศไทย สถาบนั ส่งเสริมการสอนวทิ ยาศาสตร์และเทคโนโลย.ี (2554) ตัวอย่ำง
ข้อสอบกำรประเมินผล PISA : คณติ ศำสตร์. กรุงเทพฯ : หา้ งหุน้ ส่วนจากดั อรุณการพิมพ.์

โครงการ PISA ประเทศไทย สถาบนั ส่งเสริมการสอนวทิ ยาศาสตร์และเทคโนโลย.ี (2555). ตัวอย่ำง
ข้อสอบกำรประเมินผลนำนำชำติ PISA และ TIMSS : วทิ ยำศำสตร์. กรุงเทพฯ : หา้ งหุ้นส่วน
จากดั อรุณการพิมพ.์

ฉตั รศิริ ปิ ยะพิมลสิทธ์ิ. (2559). ดชั นีควำมสอดคล้องของผู้ประเมิน : RAI. สืบคน้ เม่ือ 10 ธนั วาคม 2559
จากเวบ็ ไซตh์ ttp://www.watpon.com/Elearning/

ชนาธิป ทุย้ แป. (2554). สานกั ทดสอบทางการศึกษา สานกั งานคณะกรรมการการศึกษาข้นั พ้ืนฐาน. กำร
สร้ำงเคร่ืองมือวดั ควำมสำมำรถทำงกำรคดิ (Thinking Ability Test). (Power point
ประกอบการบรรยายการประชุมชุมนุมนกั วดั และประเมินผลการศึกษาข้นั พ้นื ฐานแห่งประเทศ
ไทย. 5 กมุ ภาพนั ธ์ 2554.)

ชวาล แพรัตกลุ . (2520). เทคนิคกำรเขียนข้อทดสอบ. กรุงเทพฯ : โรงพิมพพ์ ิทกั ษอ์ กั ษร.

122 วธิ กี ารและเคร่ืองมือประเมินการเรียนรู้ของผเู้ รียน 122
โชติมา หนูพริก. (2557). เทคนิคกำรประเมินเพื่อกำรเรียนรู้ :กำรต้ังคำถำมและกำรให้ข้อมูลย้อนกลบั
เพ่ือส่งเสริมกำรเรียนรู้. สืบคน้ เม่ือ 26 มิถุนายน 2559 จากเวบ็ ไซต์
www.curriculumandlearning.com
ทววี ฒั น์ วฒั นกุลเจริญ. (2547). กำรพฒั นำรูปแบบกำรวดั ประเมนิ ตำมสภำพจริง จำกกำรเรียน
อเิ ลก็ ทรอนิกส์ทใ่ี ช้วธิ ีกำรเรียนตำมสถำนกำรณ์ ทส่ี ่งผลต่อกำรรับรู้ควำมสำมำรถของตนเอง
ของผู้เรียนในสถำนศึกษำระดบั อดุ มศึกษำ. ครุศาสตร์ดุษฎีบณั ฑิต สาขาวชิ าอุดมศึกษา คณะครุ
ศาสตร์ จุฬาลงกรณ์มหาวิทยาลยั .
นงลกั ษณ์ วริ ัชชยั . (2545). กระบวนกำรปฏิรูปเพื่อพฒั นำคุณภำพกำรเรียนรู้: กำรประเมินและกำร
ประกนั : รำยงำนผลกำรดำเนินงำนโครงกำรนำร่องระดับชำติ. กรุงเทพฯ : โครงการโรงเรียน
ปฏิรูปการเรียนรู้เพ่ือพฒั นาคุณภาพผเู้ รียน สานกั งานคณะกรรมการการศึกษาแห่งชาติ.
ประภาพร ศรีตระกูล. (2549). กำรวัดและประเมินผลกำรศึกษำ. ขอนแก่น: คณะศึกษาศาสตร์
มหาวทิ ยาลยั ขอนแก่น
______________. (2552). กำรวัดและประเมินผลกำรเรียนรู้. ขอนแก่น: ศูนยพ์ ฒั นาวิชาชีพครูและ
บุคลากรทางการศึกษา คณะศึกษาศาสตร์ มหาวทิ ยาลยั ขอนแก่น.
ไพศาล สุวรรณนอ้ ย. (2558). กำรสร้ำงข้อสอบตำมวตั ถุประสงค์กำรเรียนรู้. สืบคน้ เม่ือ 10 ธนั วาคม
2559 จากเวบ็ ไซต์ www.ubu.ac.th/web/files_up/46f2014110508440092.pdf
ลว้ น สายยศ และ องั คณา สายยศ. (2543). กำรวดั ด้ำนจิตพสิ ัย. กรุงเทพมหานคร : สุวริ ิยาสาสน์.
______________. (2543). เทคนิคกำรวดั ผลกำรเรียนรู้. พมิ พค์ ร้ังที่ 2. กรุงเทพมหานคร :
สุวรี ิยาสาสน์.
วรพจน์ วงศก์ ิจรุ่งเรือง และอธิป จิตตฤกษ์ (แปล). (2554). ทกั ษะแห่งอนำคตใหม่: กำรศึกษำเพ่ือ
ศตวรรษที่ 21. กรุงเทพมหานคร: สานกั พิมพ์ openworlds.
วจิ ารณ์ พานิช. (2555). วถิ ีสร้ำงกำรเรียนรู้เพ่ือศิษย์ในศตวรรษท่ี 21. กรุงเทพมหานคร: มูลนิธิสดศรี-
สฤษด์ิวงศ.์
__________. (2556). สนุกกบั กำรเรียนในศตวรรษท่ี 21. กรุงเทพมหานคร: มูลนิธิสดศรี-
สฤษด์ิวงศ.์
__________. (2557). กำรประเมนิ เพื่อมอบอำนำจกำรเรียนรู้ (Embedded Formative Assessment).
กรุงเทพมหานคร: สานอกั ษร.
ศิริชยั กาญจนวาสี. (2543). กำรประเมนิ กำรเรียนรู้ : ข้อเสนอแนะเชิงนโยบำย. กรุงเทพฯ:
อมรินทร์พริ้นติง้ แอนดพ์ บั ลิชชิ่ง
______________. (2548). ทฤษฎกี ำรทดสอบแบบด้งั เดมิ . พมิ พค์ ร้ังท่ี 5. กรุงเทพมหานคร:
โรงพิมพแ์ ห่งจุฬาลงกรณ์มหาวทิ ยาลยั .

123 ผชู้ ว่ ยศาสตราจารย์ ดร.จตุภูมิ เขตจตั รุ ัส 123

______________. (2552). ทฤษฎกี ำรทดสอบแบบด้งั เดมิ . พมิ พค์ ร้ังที่ 6 (ฉบบั ปรับปรุงใหม่).
กรุงเทพมหานคร: โรงพมิ พแ์ ห่งจุฬาลงกรณ์มหาวทิ ยาลยั .

______________. (2555). สถติ ิประยุกต์สำหรับกำรวจิ ัย. พมิ พค์ ร้ังท่ี 6 (ฉบบั ปรับปรุงใหม่).
กรุงเทพมหานคร: โรงพิมพแ์ ห่งจุฬาลงกรณ์มหาวทิ ยาลยั .

สังวร งดั กระโทก. (2556). การออกแบบระบบการประเมินท่ีสมดุลในระบบการจดั การศึกษาอิง
มาตรฐาน. วำรสำรศึกษำศำสตร์ มสธ. ปี ท่ี 6 ฉบบั ท่ี 2 (กรกฎาคม – ธนั วาคม)

สถาบนั ส่งเสริมการสอนวทิ ยาศาสตร์และเทคโนโลย.ี (2548). เอกสำรประกอบกำรประชุมปฏิบตั ิกำร
สำหรับครูผ้สู อนวทิ ยำศำสตร์ในโรงเรียนแกนนำของ สสวท.และศึกษำนิเทศก์. (อดั สาเนา).

สถาบนั ทดสอบทางการศึกษาแห่งชาติ. (2560). ลกั ษณะเฉพำะของแบบทดสอบ (Test Specification)
ทำงกำรศึกษำระดับชำติข้ันพืน้ ฐำน (O-NET) กลุ่มสำระกำรเรียนรู้ภำษำไทย รูปแบบอัตนัย
แบบเขียนตอบ. สืบคน้ เมื่อ 25 มกราคม 2560 จากเวบ็ ไซต์ http://www.niets.or.th

สุวมิ ล วอ่ งวาณิช. (2546). รวมบทควำมกำรประเมนิ ผลกำรเรียนรู้แนวใหม่ (บรรณาธิการ).
กรุงเทพมหานคร: ศูนยต์ าราและเอกสารทางวชิ าการ คณะครุศาสตร์ จุฬาลงกรณ์มหาวทิ ยาลยั

สานกั ทดสอบทางการศึกษา กรมวชิ าการ กระทรวงศึกษาธิการ. (2546). กรอบควำมคดิ และ
แนวทำงกำรประเมินผลด้วยทำงเลือกใหม่. กรุงเทพมหานคร : สานกั ทดสอบทางการศึกษา.

สานกั วชิ าการและมาตรฐานการศึกษา สานกั งานคณะกรรมการการศึกษาข้นั พ้นื ฐาน
กระทรวงศึกษาธิการ. (2553). แนวปฏิบัติกำรวดั และประเมนิ ผลกำรเรียนรู้ตำมหลกั สูตร
แกนกลำงกำรศึกษำข้นั พืน้ ฐำน พุทธศักรำช 2551 สืบคน้ เมื่อ10 กนั ยายน 2558 จากเวบ็ ไซต์
http://www.curriculum51.net/

เอมอร จงั ศิริพรปกรณ์. (2551). เอกสำรคำสอนรำยวชิ ำกำรวดั และกำรประเมนิ ผลกำรศึกษำ.
กรุงเทพมหานคร: คณะครุศาสตร์ จุฬาลงกรณ์มหาวทิ ยาลยั

Angelo, T.A and Cross, K. P. (1993). Classroom Assessment Techniques: A Handbook for
College Teachers, 2nd Edition. Jossey-Bass.

Araisian, P. W. (2001). Classroom assessment. (2ndEdition). New York: McGraw-Hill.
Assessment Reform Group. (1999). Assessment for learning: Beyond the black box. Cambridge:

University of Cambridge School of Education.
Bloom, S.B. (1956). Taxonomy of Educational Objectives . Boston: Allyn and Bacon.
Brookhart, S. M. (2008). How to give effective feedback to your students. Alexandria,

VA: ASCD.
Chappuis,J. (2009). Seven strategies of assessment for learning.Upper Saddle River,NJ : Pearson

Education

124 วิธีการและเคร่อื งมอื ประเมินการเรยี นรู้ของผเู้ รียน 124

Chang. H.H. (2015) Psychometrics behind Computerized Adaptive Testing. Psychometrika. Vol.80,
No.1. pp.1-20.

Fisher,D., Frey. N.(2011).The formative assessment action plan. Alexandria, VA: ASCD.
Frey, A.and Carstensen, C, H. (2009). Diagnostic Classification Models and Multidimensional

Adaptive Testing: A Commentary on Rupp and Templin. Measurement: Interdisciplinary
Research & Perspective. 7: 1, 58-61.
Frey, A., and Seitz, N. N. (2009). Multidimensional adaptive testing in educational and psychological
measurement: Current state and future challenges. Studies in Educational Evaluation. 35,
89-94.
Hambleton, R. K., Swaminathan, H., & Rogers, H. J. (1991). Fundamentals of item response
theory. United States of America: Sage Publications.
Hattie, J., &Timperley, H. (2007).The power of feedback. Review of Educational Research, 77, 81–
112.
Jan Chappuis.(2012). How am I doing?. Education Leadership.September Volume 70 Number 1
Hattie, J., &Timperley, H. (2007).The power of feedback. Review of Educational Research,
77, 81–112.
McMillan, J. H. (2011). Classroom Assessment: Principles and practice for effective standards-
based instruction.(5th ed.). Allyn&Bacon: Pearson.
Murphy, K. R. and Davidshofer, C. O. (2001). Psychological testing: Principles and
Applications. 5th ed. New Jersey Upper Saddle River: Prentice Hall.
Nitko, A. J. and Brookhart, S. M. (2010). Educational Assessment of Students.
(6th Edition). Pearson Merrill Prentice Hall.
Ourict. (2560). Ten of the Best digital Formative Tools. Retrieved from
http://www.ourict.co.uk/formative-assessment-tools/
O'Sullivan, R. G. & Johnson, R. L. (1993). Using performance assessments to measure
teachers' competence in classroom assessment. Paper presented at the annual meeting of
the American Educational Research Association, Atlanta, GA. (ERIC Document
Reproduction Service No. 358156)
Plake, B. S., Impara, J. C., & Fager, J. J. (1993). Assessment competencies of teachers:
A national survey. Educational Measurement: Issues and Practice, 12(4), 10-
12, 39.

125 ผู้ชว่ ยศาสตราจารย์ ดร.จตุภมู ิ เขตจัตุรัส 125

Partnership for 21st Century Skills. (2009). P21 framework definitions. Retrieved from
http://www.p21.org/storage/documents/P21_Framework_Definitions.pdf.

Partnership for Assessment of Readiness for College and Careers. (2010). Application for the race
to the top comprehensive assessment systems competition. Retrieved from
http://www.fldoe.org/parcc/pdf/apprtcasc.pdf.

Reeves, D. (2010). A framework for assessing 21st century skills. 21st century skills: Rethinking
how students learn, 305-326.

Shute, V. J. and Becker, B. J. (2010). Innovative Assessment for the 21st Century: Supporting
Educational Needs. New York: Springer.

Stiggins, R.J. (1994). Student Centered Classroom Assessment. New York: Macmillan
callege Publishing company.

__________. (1998). Educational tests and measurements; Motivation in education;
School improvement programs. United States. National Education
Association (Washington, D.C.).

Stiggins, R. J. (2007). Introduction to student-involved assessment for learning. (5thEdition).
Upper Saddle River, NJ: Prentice Hall.

The Assessment and Teaching of 21st Century Skills (ATC21S). Policy Frameworks for New
Assessments. Retrieved from http://atc21s.org/index.php/resources/white-papers/#item7

Wiliam, D. (2011). Embedded Formative Assessment : practical strategies and tools for K-12
teachers. Solution Tree Press.




Click to View FlipBook Version