นายทศพล กันพุ่ม รหสั นักศกึ ษา 046560781703-3
หลักสตู รดุษฎบี ัณฑิต สาขาวศิ วกรรมโยธาและการบริหารงานก่อสร้าง
คณะวศิ วกรรมศาสตรแ์ ละสถาปตั ยกรรมศาสตร์
มหาวิทยาลัยเทคโนโลยรี าชมงคลตะวันออก วิทยาเขตอุเทนถวาย
Research Methodology Methods and Techniques (SECOND REVISED EDITION)
หวั ข้อ : Testing of Hypotheses I (Parametric or Standard Tests of Hypotheses)
----------------------------------------------------------------------------------------------------------------
บทท่ี 9
การทดสอบสมมตฐิ าน
(การทดสอบสมมตุ ิฐานหรอื มาตรฐานของสมมติฐาน)
เนือ่ งจาก Ha เปน็ แบบด้านเดียว เราจะกำหนดขอบเขตการปฏเิ สธท่ใี ชก้ ารทดสอบแบบด้านเดยี ว (ทางด้านขวา
2
ของหางเพราะ Ha เป็นมากกว่าแบบ) ที่ระดับนัยสำคัญร้อยละ 5 และมีลักษณะเป็นด้านล่างโดยใช้ตารางการ
กระจาย t สำหรบั 11 องศาอิสระ:
R : t > 1.796
ค่าที่สังเกตได้ของ t คือ 3.558 ซึ่งอยู่ในขอบเขตการปฏิเสธ ดังนั้น Ho จะถูกปฏิเสธที่ 5 ต่อระดับ
นยั สำคัญและสรุปได้ว่าขอ้ มูลตัวอย่างบ่งชว้ี า่ ร้านราจยู อดขายเพม่ิ ข้นึ
การทดสอบสมมติฐานเพ่ือหาความแตกตา่ งระหวา่ งค่าเฉลีย่
ในหลายสถานการณ์การตัดสินใจ เราอาจสนใจที่จะรู้ว่าพารามิเตอร์ของประชากรสองกลุ่มมีความเหมือนหรือ
ต่างกัน ตัวอย่างเช่น เราอาจสนใจที่จะทดสอบว่าเพศหญิงหรือไม่คนงานมีรายได้น้อยกว่าคนงานชายสำหรับงาน
เดียวกัน ตอนนี้เราจะอธิบายเทคนิคของการทดสอบสมมตฐิ านสำหรับความแตกต่างระหว่างวิธีการ สมมติฐานว่าง
สำหรับการทดสอบความแตกต่างระหว่างค่าเฉลี่ยโดยทั่วไปจะระบเุ ปน็ Ho : μ1 = μ2 โดยที่ μ1 คือค่าเฉลย่ี
ประชากรของประชากรหน่งึ กลมุ่ และ μ2 คือคา่ เฉล่ยี ประชากรของประชากรกลมุ่ ทีส่ อง โดยถอื ว่าประชากรทั้งสอง
เป็นปกติประชากร สมมติฐานทางเลือกอาจไม่เท่ากับหรือน้อยกว่าหรือมากกว่าประเภทตามที่ระบุไว้ก่อนหน้าน้ี
และตามน้ัน เราจะกำหนดเขตการยอมรับหรือปฏิเสธสำหรับการทดสอบสมมตฐิ าน อาจมสี ถานการณ์ท่แี ตกต่างกัน
เม่ือเราตรวจสอบความสำคญั ของความแตกตา่ งระหว่างสองวธิ ี แตส่ ิง่ ต่อไปนอ้ี าจถอื เปน็ สถานการณ์ปกติ:
1. ทราบความแปรปรวนของประชากรหรือกลุ่มตัวอย่างเกิดขึ้นเปน็ กลุ่มตัวอย่างขนาดใหญ่:ในสถานการณ์
นี้ เราใช้ z-test สำหรบั ความแตกตา่ งของค่าเฉลี่ย และหาสถิติการทดสอบ z ภายใต:้
3
2. ตัวอย่างมีขนาดใหญ่ แต่สันนิษฐานว่ามาจากสิ่งเดียวกันประชากรที่ทราบความแปรปรวน:ใน
สถานการณน์ ี้ เราใช้ z - test สำหรบั ความแตกตา่ งของคา่ เฉลีย่ และหาค่าสถิติการทดสอบ z ภายใต้:
3. ตวั อย่างเกิดขน้ึ กบั กลุ่มตัวอยา่ งขนาดเล็กและไม่ทราบความแปรปรวนของประชากรแต่ตง้ั สมมตุ ิฐานไว้
ใหเ้ ท่ากนั : ในสถานการณ์นี้ เราใช้ t-test สำหรับความแตกต่างของคา่ เฉลี่ย และหาสถิตกิ ารทดสอบ t ภายใต:้
4
ภาพประกอบ 7
ผลผลติ เฉล่ยี ของข้าวสาลจี ากตวั อยา่ ง 100 ทงุ่ ใน 200 ปอนด์ ตอ่ เอเคอรโ์ ดยมีคา่ เบี่ยงเบนมาตรฐานจาก 10 ปอนด์
ตัวอย่างอีก 150 แปลง ให้ค่าเฉลีย่ 220 ปอนด์ โดยมีค่าเบ่ียงเบนมาตรฐานของ12 ปอนด์ จะถือว่าทั้งสองตวั อย่าง
มาจากประชากรกลุ่มเดยี วกันซึ่งส่วนเบย่ี งเบนมาตรฐานคือ 11 ปอนด?์ ใชร้ ะดับนัยสำคัญรอ้ ยละ 5
วิธแี กป้ ญั หา: ใช้สมมติฐานวา่ งวา่ ค่าเฉลีย่ ของประชากรสองกลุ่มไม่ตา่ งกัน เราสามารถเขียน
เนื่องจาก Ha เป็นแบบสองหาง เราจะใช้การทดสอบแบบสองหางเพ่อื กำหนดขอบเขตการปฏิเสธท่ี 5 เปอรเ์ ซ็นต์
ของระดบั ความมนี ัยสำคญั ทอี่ อกมาเปน็ ดา้ นล่าง โดยใช้ตารางพื้นท่โี คง้ ปกติ:
R : | z | > 1.96
ค่าที่สังเกตได้ของ z คือ – 14.08 ซึ่งอยู่ในขอบเขตการปฏิเสธ ดังนั้นเราจึงปฏิเสธ Ho และ สรุปได้ว่าทั้งสอง
ตัวอย่างไม่สามารถพิจารณาได้ในระดับร้อยละ 5 ของระดับความนัยสำคัญจากประชากรกลุ่มเดียวกันที่มีค่า
เบี่ยงเบนมาตรฐานเท่ากับ 11 ปอนด์ ซึ่งหมายความว่าความแตกต่างระหว่างค่าเฉลี่ยของตัวอย่างสองตัวอย่างมี
นัยสำคัญทางสถติ แิ ละไม่ไดเ้ กดิ จากความผนั ผวนของตวั อย่าง
ภาพประกอบ 8
แบบสำรวจสุ่มตัวอย่างอย่างง่ายโดยคำนึงถึงรายได้ต่อเดือนของคนงานกึ่งฝีมือเป็นสองเท่าเมืองให้ข้อมูลสถิติ
ต่อไปนี้:
5
ทดสอบสมมติฐานท่ีระดับรอ้ ยละ 5 ว่าไมม่ คี วามแตกต่างระหว่างรายไดต้ ่อเดือนของคนงานในท้ังสองเมอื ง
วธิ ีแกป้ ญั หา: ใชส้ มมติฐานว่างว่าไม่มีความแตกตา่ งในรายไดข้ องคนงานในสองเมอื ง เราสามารถเขยี น:
เนื่องจากขนาดกลุ่มตัวอย่างมีขนาดใหญ่ เราจะใช้การทดสอบ z สำหรับความแตกต่างของค่าเฉลี่ยโดยสมมติว่า
ประชากรเปน็ ปกติและต้องใช้สถิตกิ ารทดสอบ z ดังนี้
(เนื่องจากไม่ทราบความแปรปรวนของประชากร เราจึงใช้ความแปรปรวนตัวอย่างมาพิจารณความแปรปรวน
ตวั อยา่ งเปน็ การประมาณความแปรปรวนของประชากร)
6
เนอื่ งจาก Ha เปน็ แบบสองด้าน เราจะใช้การทดสอบแบบสองด้านเพื่อกำหนดขอบเขตการปฏเิ สธที่ 5 ตอ่
ระดบั นยั สำคญั ที่อย่ใู ตโ้ ดยใชต้ ารางพื้นที่โคง้ ปกต:ิ
R : | z | > 1.96
ค่าที่สังเกตได้ของ z คือ – 2.809 ซึ่งอยู่ในขอบเขตการปฏิเสธ ดังนั้นเราจึงปฏิเสธ Ho ที่ร้อยละ 5 และ
สรปุ วา่ รายได้ของคนงานในสองเมอื งแตกตา่ งกนั อยา่ งมาก
ภาพประกอบ 9
ตัวอยา่ งการขายในร้านคา้ ท่ีคล้ายกันในสองเมืองถูกนำมาเป็นผลิตภัณฑ์ใหม่ทม่ี ผี ลดังต่อไปนี:้
มีหลักฐานของความแตกต่างในการขายในทั้งสองเมืองหรือไม่ ? ใช้ระดับนัยสำคัญร้อยละ 5 เพื่อทดสอบความ
แตกต่างระหว่างคา่ เฉลี่ยของสองตัวอย่างวิธแี ก้ปัญหา: ใช้สมมติฐานว่างวา่ ค่าเฉลย่ี ของประชากรสองกลุ่มไม่ต่างกัน
เราสามารถเขยี นได:้
และขอ้ มลู ท่ใี หไ้ วด้ ังนี้
เนอื่ งจากในคำถามท่กี ำหนดใหไ้ มร่ ะบุความแปรปรวนของประชากรและขนาดของกลมุ่ ตัวอยา่ งมนี ้อย เราจะใช้
t-test สำหรบั ความแตกต่างของคา่ เฉล่ยี โดยถอื วา่ ประชากรเปน็ ปกตแิ ละสามารถหาสถิตกิ ารทดสอบ t ดงั ตอ่ ไปน้ี:
7
เนื่องจาก Ha เป็นแบบสองด้าน เราจะใช้การทดสอบแบบสองด้านเพื่อกำหนดขอบเขตการปฏิเสธท่ีระดับร้อยละ
5 ทอ่ี ยใู่ ต้โดยใช้ตารางการแจกแจงแบบ t คา่ ชน้ั แหง่ ความเป็นอิสระเท่ากบั 10
R : | t | > 2.228
ค่าทีส่ งั เกตไดข้ อง t คอื – 3.053 ซึ่งอยู่ในขอบเขตการปฏิเสธ ดังนน้ั เราจึงปฏเิ สธ Ho และสรปุ ว่าความแตกต่างของ
ยอดขายในท้งั สองเมอื งมนี ยั สำคัญท่รี ะดบั รอ้ ยละ 5
ภาพประกอบ 10
กลุ่มไกอ่ ายุ 7 สัปดาหท์ ่เี ลีย้ งด้วยอาหารโปรตนี สูง มีน้ำหนกั 12, 15, 11, 16, 14, 14 และ 16 ออนซ์; ไก่กลุม่ ท่ีสอง
จำนวน 5 ตัว ได้รับการปฏิบัติเช่นเดียวกัน เว้นแต่จะได้รับอาหารที่มีโปรตีนต่ำน้ำหนัก 8, 10, 14, 10 และ 13
ออนซ์ ทดสอบทรี่ ะดบั รอ้ ยละ 5 วา่ มหี ลกั ฐานสำคญั วา่ โปรตนี เพ่มิ เตมิ ได้เพม่ิ น้ำหนักของไก่ ใช้ค่าเฉลี่ยสมมติ ( หรือ
A1 ) = 10 สำหรับตัวอย่าง 7 และค่าเฉลี่ยสมมติ ( หรือ A2 ) = 8 สำหรับตวั อย่างไก่ 5 ตัวในการคำนวณของคณุ
วิธีแกป้ ญั หา: ใชส้ มมตฐิ านวา่ งวา่ โปรตีนเพ่ิมเติมไม่ได้เพม่ิ น้ำหนกั ของไก่
เราสามารถเขยี น:
(ตามท่เี ราต้องการสรุปวา่ โปรตีนเพ่มิ เติมไดเ้ พิ่มนำ้ หนกั ของไก)่
เนื่องจากในคำถามที่ให้มา ค่าความแปรปรวนของประชากรไม่เป็นที่รู้จักและขนาดของกลุ่มตัวอย่างคือ
น้อย เราจะใช้ t-test สำหรับความแตกต่างของค่าเฉลี่ย โดยถือว่าประชากรเป็นปกติ ดังนั้นหาสถิติการทดสอบ t
ดังตอ่ ไปน้:ี
8
จากขอ้ มลู ตวั อย่าง
(นำตัวอย่างอาหารที่มีโปรตีนสูงเป็นตัวอย่างหนึ่งและตัวอย่างอาหารโปรตีนต่ำเป็นตัวอย่างที่สอง) ดังท่ี
แสดงด้านลา่ ง:
9
เนอ่ื งจาก Ha เป็นดา้ นเดียว เราจะใช้การทดสอบแบบดา้ นเดียว (ในหางดา้ นขวาเพราะ Ha มคี ่า
มากกวา่ ชนดิ ) สำหรบั กำหนดขอบเขตการปฏเิ สธที่ระดับร้อยละ 5 ซง่ึ อยู่ด้านล่าง โดยใชต้ ารางของ
t-distribution คา่ ชนั้ แหง่ ความเปน็ อิสระ เทา่ กับ :10
R : t > 1.812
ค่าที่สังเกตได้ของ t คือ 2.381 ซึ่งอยู่ในขอบเขตการปฏิเสธ ดังนั้นเราจึงปฏิเสธ Ho และ สรุปว่าโปรตีน
เพ่ิมเติม ไดเ้ พม่ิ นำ้ หนักของไก่ ท่ีระดบั นัยสำคัญรอ้ ยละ 5
การทดสอบสมมติฐานเพื่อเปรยี บเทียบสองตัวอยา่ งทเ่ี กี่ยวข้อง
การทดสอบ t ทจ่ี บั คูเ่ ปน็ วธิ กี ารทดสอบเพอื่ เปรียบเทียบตวั อยา่ งท่ีเก่ียวข้องกันสองตวั อย่าง โดยเกี่ยวข้องกบั ค่า n
เพียงเล็กน้อยซึ่งไม่ต้องการความแปรปรวนของประชากรทั้งสองให้เท่ากัน แต่เป็นการสันนิษฐานว่ าประชากรทั้ง
สองเป็นปกติต้องประยุกต์ใช้ตอ่ สำหรบั การทดสอบ t แบบคู่ จำเป็นต้องสงั เกตในสองใหเ้ ก็บตวั อย่างในลักษณะที่
เรียกว่าคทู่ ่ีตรงกัน กลา่ วคอื “การสงั เกตท้ังคู่ในเวลาเดียวกัน”ตัวอย่างจะต้องจับคู่กับการสังเกตในอีกตัวอย่างหนึ่ง
ในลักษณะที่การสังเกตเหล่าน้ี มีความ "ตรงกัน" หรือเกี่ยวข้องกัน โดยพยายามขจัดปัจจัยภายนอกที่ไม่ใช่ความ
สนใจในการทดสอบ” โดยทั่วไปแล้วการทดสอบดังกล่าวถอื ว่าเหมาะสมในการบำบัดก่อนและหลังการรักษา
เช่น เราอาจทดสอบกลุ่มนักเรียนบางกลุ่มก่อนและหลังการฝึกเพื่อรู้ว่าการฝึกนั้นได้ผลหรือไม่ ซึ่งในสถานการณ์ที่
เราอาจใช้ t-test แบบจับคู่ เพื่อใช้การทดสอบน้ีก่อนอืน่ เราคำนวณคะแนนความแตกต่างสำหรบั คู่ท่ีตรงกันแต่ละคู่
แลว้ หาค่าเฉล่ียของส่ิงนน้ั ความแตกต่าง ̅ พรอ้ มกับความแปรปรวนตัวอยา่ งของคะแนนความแตกต่าง ถ้าค่าจาก
สองตัวอย่างทีต่ รงกันจะแสดงเป็น Xi และ Yi และความแตกต่างโดย Di (Di = Xi – Yi) จากนั้นค่าเฉลี่ยของความ
แตกต่างคือ
10
และความแปรปรวนของความแตกตา่ งหรือ
สมมติว่าความแตกต่างดังกล่าวมีการกระจายตามปกติและเป็นอิสระ เราสามารถใช้การทดสอบคู่เพื่อตัดสิน
ความสำคัญของค่าเฉลยี่ ของความแตกต่างและคำนวณสถิติการทดสอบ t ดงั ด้านล่าง
ค่าที่คำนวณได้ของ t นี้เปรียบเทียบกับค่าตารางที่ระดับนัยสำคัญที่กำหนดตามปกติสำหรับวัตถุประสงค์ในการ
ทดสอบ เรายังสามารถใช้การทดสอบ A ของแซนด์เลอร์ (Sandler’s A-test) เพื่อจุดประสงค์นี้ตามที่ระบุไว้ก่อน
หน้าน้ีในบทท่ี 8
ภาพประกอบ 11
ทดสอบความจุหน่วยความจำของนักเรียน 9 คน ก่อนและหลังการฝึก สถานะที่ระดับร้อยละ 5 ของนัยสำคัญว่า
การฝกึ มีผลจากคะแนนดังต่อไปนี้
ใช้ t-test ที่จับคู่ A-test สำหรบั คำตอบ
วิธีแก้ปัญหา: ใช้คะแนนก่อนการฝึกเป็น X และคะแนนหลังการฝึกเป็น Y แล้วจึงหาค่าว่างสมมุติฐานว่าค่าเฉลี่ย
ของผลตา่ งเปน็ ศนู ย์ เราสามารถเขียนไดด้ งั น้ี
Ho : µ1 µ2 = ซ่งึ เทยี บเท่ากบั การทดสอบ Ho : ̅ = 0
Ho : µ1 µ2 < (ตามท่ีเราตอ้ งการสรุปวา่ การฝึกไดผ้ ล)
ในขณะท่เี รามีคู่ท่ีตรงกัน เราใช้ t-test ทจ่ี บั ค่แู ละคำนวณสถติ ิการทดสอบ t ดงั น้ี:
11
ในการหาค่าของ t ก่อนอ่ืนเราต้องหาค่าเฉลย่ี และสว่ นเบี่ยงเบนมาตรฐานของความแตกตา่ งดังที่แสดงดา้ นล่าง
คา่ ช้ันแหง่ ความเปน็ อสิ ระ = n - 1 = 9 - 1 = 8
อยา่ ง Ho เป็นดา้ นเดียวเราจะใชก้ ารทดสอบด้านเดียว (ในหางซ้ายเพราะ Ha น้อยกวา่ ประเภท) สำหรบั กำหนด
ขอบเขตการปฏเิ สธท่รี ะดับร้อยละ 5 ซง่ึ อยดู่ ้านล่าง โดยใชต้ ารางของ t - distribution สำหรับ 8 องศาอิสระ:
R : t < – 1.860
12
ค่าที่สังเกตได้ของ t คือ –1.361 ซึ่งอยู่ในขอบเขตการยอมรับ ดังนั้นเราจึงยอมรับ HO และสรุปว่า
คะแนนก่อนและหลังการฝึกมีความแตกต่างกันเล็กน้อย กล่าวคือ เป็นเพราะความผันผวนของการสุ่มตัวอย่าง
ดังนนั้ เราจงึ สรปุ ไดว้ า่ การฝึกน้นั ไมไ่ ด้ผล
วิธแี กป้ ัญหาโดยใช้ A-test: การใช้ A-test เราฝึกสถิตกิ ารทดสอบสำหรบั ปัญหาที่กำหนดดงั น:้ี
ตง้ั แต่ Ha ในปญั หาที่กำหนดเป็นแบบด้านเดียว เราจะทำการทดสอบแบบดา้ นเดียว ดงั นน้ั ท่ีระดับ 5% ของ
ความสำคัญของค่าตารางของสถิติ A สำหรับ (n – 1) หรือ (9 – 1) = 8 d.f. ในกรณีที่กำหนดคือ 0.368 (ตาราง
สถิติ A ในภาคผนวก) ค่าที่คำนวณได้ของ A คือ 0.592 สูงกว่าตารางนี้ ค่าและสถิติ A นั้นไม่มีนัยสำคัญและ
ตามน้นั Ho ควรได้รบั การยอมรบั กล่าวอีกนยั หน่งึ เราควรสรปุ ว่าการฝึกอบรมไม่ได้ผล (การอนุมานนี้เหมือนกับ
การวาดก่อนหน้าน้ีทใี่ ช้ t-test จบั คู่)
ภาพประกอบ 12
ข้อมลู การขายของสนิ ค้าในรา้ นค้า 6 แหง่ กอ่ นและหลงั แคมเปญสง่ เสริมการขายพเิ ศษคอื :
แคมเปญสามารถตัดสินได้ว่าประสบความสำเร็จหรือไม่? ทดสอบที่ระดับนัยสำคัญร้อยละ 5 ใช้คู่กัน t - test
เช่นเดยี วกบั การทดสอบ A – test
วิธีแก้ไข: ให้การขายก่อนแคมเปญแสดงเป็น X และการขายหลังแคมเปญเป็น Y และจากนั้นใช้สมมติฐานว่าง
วา่ แคมเปญไม่ไดท้ ำให้ยอดขายดขี ึน้ เราสามารถเขียนได้วา่ :
Ho : µ1 = µ2 = ซ่ึงเทียบเทา่ กบั การทดสอบ Ho : ̅ = 0
Ha : µ1 < µ2 (ตามทเ่ี ราตอ้ งการสรปุ ว่าแคมเปญประสบความสำเร็จ)
เนอ่ื งจากคทู่ ่ีตรงกนั เราใช้ t - test ท่จี บั คู่และคำนวณสถิตกิ ารทดสอบ 't' ดังน้:ี
13
ในการหาคา่ ของ t ก่อนอืน่ เราจะหาคา่ เฉลีย่ และส่วนเบยี่ งเบนมาตรฐานของความแตกต่างดังนี:้
ค่าชนั้ แห่งความเป็นอิสระ = (n - 1) = 6 - 1 = 5
อย่าง Ha เป็นด้านเดียวเราจะใช้การทดสอบด้านเดียว (ในหางซ้ายเพราะ Ha น้อยกว่าประเภท) สำหรับกำหนด
ขอบเขตการปฏิเสธที่ระดับนัยสำคัญร้อยละ 5 ซึ่งอยู่ด้านล่างโดยใช้ ตารางการกระจาย t สำหรับ 5 ค่าชั้นแห่ง
ความเปน็ อิสระ:
R : t < – 2.015
ค่าที่สังเกตได้ของ t คือ – 2.784 ซึ่งอยู่ในขอบเขตการปฏิเสธ ดังนั้นเราจึงปฏิเสธ Ho ท่ีระดับร้อยละ 5
และสรุปวา่ แคมเปญส่งเสรมิ การขายประสบความสำเร็จ
วธิ ีแกไ้ ข: การใช้ A-test: การใช้ A-test เราคำนวณสถติ กิ ารทดสอบสำหรบั ปญั หาท่กี ำหนดดงั น้ี:
14
ตั้งแต่ Ha ในปัญหาที่กำหนดเป็นแบบด้านเดียว เราจะทำการทดสอบแบบด้านเดียว ดังนั้นที่ 5% ของระดับ
นัยสำคัญ ค่าตารางของสถิติ A สำหรับ (n –1) หรือ (6 –1) = 5 d.f. ในกรณีที่กำหนดคือ0.372 (ตามตาราง
สถิติ A ในภาคผนวก) ค่าที่คำนวณได้ของ A คือ 0.2744 น้อยกว่าค่าตารางนี้และ สถิติ A ดังกล่าวมีความสำคัญ
ซึ่งหมายความว่าเราควรปฏิเสธ Ho (อีกทางหนึ่งเราควรยอมรับ Ha ) และควรอนุมานว่าแคมเปญส่งเสริมการ
ขายประสบความสำเร็จ
การทดสอบสมมตฐิ านของสัดสว่ น
ในกรณีของปรากฏการณ์เชิงคุณภาพ เรามีข้อมูลบนพื้นฐานของการมีอยู่หรือไม่มีแอตทริบิวต์ด้วยข้อมูลดังกล่าว
การกระจายตัวตัวอย่างอาจอยู่ในรูปแบบของการแจกแจงความน่าจะเป็นทวินามซึ่งค่าเฉลี่ยจะเท่ากับ n ⋅ p และ
ค่าเบี่ยงเบนมาตรฐานเท่ากับ √ ⋅ ⋅ โดยที่ p แทนค่าความน่าจะเป็นของความสำเร็จ q แสดงถึงความ
น่าจะเป็นของความล้มเหลวซึ่ง p + q = 1 และ n ขนาดของตัวอย่าง. แทนที่จะนำจำนวนความสำเร็จเฉล่ีย
และค่าเบี่ยงเบนมาตรฐานของจำนวนความสำเร็จ เราอาจบันทึกสัดส่วนของความสำเร็จในแต่ละตัวอย่าง ซึ่งใน
กรณีน้ี ค่าเฉล่ีย และสว่ นเบีย่ งเบนมาตรฐาน (หรือความคลาดเคล่ือนมาตรฐาน) ของการกระจายตัวตัวอย่างอาจหา
ไดด้ งั นี้
สดั สว่ นความสำเร็จเฉล่ยี (n ⋅ p) / n = p
และสว่ นเบ่ยี งเบนมาตรฐานของสดั สว่ นความสำเร็จ = √ ⋅
ใน n มีขนาดใหญ่ การแจกแจงทวินามมแี นวโน้มทจี่ ะกลายเป็น การแจกแจงแบบปกติ และสำหรบั
วตั ถปุ ระสงค์ในการทดสอบสดั สว่ น เราใช้สถิตกิ ารทดสอบ z ดงั น้ี:
โดยที่ ̂ คอื สดั ส่วนตวั อยา่ ง
สำหรับการทดสอบสัดส่วน เรากำหนด Ho และ Ha และสร้างเขตปฏิเสธสมมุติฐานว่าการประมาณคา่ ปกติของ
การแจกแจงทวินามสำหรับระดับนัยสำคัญที่กำหนดไว้ล่วงหน้าแล้วอาจตัดสินความสำคัญของผลลัพธ์ตัวอย่างท่ี
สงั เกตได้ ตัวอย่างต่อไปน้ีทำใหท้ ้ังหมดน้คี ่อนขา้ งชดั เจน
ภาพประกอบ 13
จากการสำรวจตัวอยา่ งระบวุ า่ จากจำนวนที่เกิด 3232 คน 1705 เป็นเดก็ ชายและที่เหลือเปน็ ผูห้ ญงิ ทำสิง่ เหลา่ นี้
15
ตวั เลขยืนยนั สมมติฐานอตั ราส่วนเพศ 50 : 50? ทดสอบทรี่ ะดบั นยั สำคัญร้อยละ 5
วธิ แี กป้ ัญหา: เริ่มจากสมมติฐานว่างวา่ อตั ราสว่ นเพศคอื 50 : 50 เราอาจเขยี นว่า
ดังนนั้ ความน่าจะเปน็ ของการเกดิ ของเด็กชายหรือ p = 1 และความนา่ จะเป็นของการเกิดของเดก็ ผ้หู ญิงก็ 1
22
เช่นกนั
การพจิ ารณาการคลอดบุตรเปน็ ความสำเรจ็ และการให้กำเนิดบุตรหญิงเป็นความลม้ เหลว เราสามารถเขียนได้ดังน:้ี
สดั สว่ นความสำเรจ็ หรือ p = 1
2
สดั สว่ นของความล้มเหลวหรือ q = 1
2
และ n = 3232 (กำหนดไว)้
ขอ้ ผดิ พลาดมาตรฐานของสดั ส่วนความสำเร็จ
อย่าง Ha เป็นสองด้านในคำถามที่กำหนด เราจะใช้การทดสอบสองด้านเพื่อกำหนดพื้นที่ปฏิเสธที่ระดับ
ร้อยละ 5 ซง่ึ อยดู่ ้านล่าง โดยใชต้ ารางพน้ื ทสี่ ว่ นโคง้ ปกติ:
R : | z | > 1.96
ค่าที่สังเกตได้ของ z คือ 3.125 ซึ่งมาในพื้นที่การปฏิเสธตั้งแต่ R : | z | > 1.96 และ ดังนั้น Ho ถูก
ปฏิเสธเพื่อประโยชน์ของ Ha ดังนั้นเราจึงสรุปได้ว่าตัวเลขที่ให้มาไม่สอดคล้องกันสมมติฐาน อัตราส่วนเพศคือ
50 : 50
16
ภาพประกอบ 14
สมมติฐานว่างคือผู้โดยสารร้อยละ 20 ขึ้นชั้นเฟิร์สคลาส แต่ฝ่ายบริหารตระหนักดีความเป็นไปได้ท่ี
เปอร์เซ็นต์นี้อาจมากหรือน้อย สุ่มตัวอย่างผู้โดยสาร 400 คน รวมผู้โดยสาร 70 คนที่ถือตั๋วชั้นหนึ่ง สามารถ
ปฏเิ สธสมมตฐิ านวา่ งท่ีร้อยละ 10 ระดบั ความมนี ยั สำคัญได้หรือไม่
วิธแี กไ้ ข: สมมติฐานวา่ งคอื
Ho : p = 20 % หรือ 0.20
และ Ha : p ≠ 20 %
อย่าง Ha เป็นสองด้าน เราจะกำหนดขอบเขตการปฏิเสธที่ใช้การทดสอบสองหาง ที่ 10 ระดับ 10 เปอร์เซ็นต์ท่ี
ลงมาเป็นดา้ นล่าง โดยใชต้ ารางพน้ื ทีโ่ ค้งปกติ:
R : | z | > 1.645
ค่าที่สังเกตได้ของ z คือ – 1.25 ซึ่งอยู่ในขอบเขตที่ยอมรับได้ และ Ho . ดังกล่าว เป็นที่ยอมรับ ดังนั้น
สมมตฐิ านว่างไมส่ ามารถปฏเิ สธได้ทรี่ ะดับความมนี ยั สำคัญ 10 เปอรเ์ ซน็ ต์
ภาพประกอบ 15
กระบวนการบางอยา่ งทำใหเ้ กิดสนิ ค้าที่มขี ้อบกพร่อง 10 เปอรเ์ ซ็นต์ ซัพพลายเออร์ของการเรยี กร้องวัตถุดิบใหม่
ว่าการใช้วัสดุของเขาจะลดสัดส่วนของข้อบกพร่อง สุ่มตัวอย่าง 400 หน่วย โดยใช้วัสดุใหม่นี้ โดย 34 ชิ้นมี
ข้อบกพรอ่ ง ขอ้ เรียกรอ้ งของซัพพลายเออร์สามารถเปน็ ทยี่ อมรับ? ทดสอบทร่ี ะดบั นัยสำคัญรอ้ ยละ 1
วิธีแก้ไข: สมมตฐิ านว่างสามารถเขยี นเปน็ Ho : p = 10% หรอื 0.10 และสมมตฐิ านทางเลือก Ha : p < 0.10
(เนอ่ื งจากซัพพลายเออร์อ้างว่าวสั ดใุ หม่จะลดสดั ส่วนของข้อบกพร่อง)
เพราะฉะนน้ั .
17
อย่าง Ha เป็นด้านเดียว เราจะกำหนดขอบเขตการปฏิเสธที่ใช้การทดสอบด้านเดียว (ในหางด้านซ้าย
เพราะ Ha มีคา่ นอ้ ยกว่าประเภท) ที่ระดับนยั สำคญั 1% และมลี กั ษณะเป็นดา้ นล่าง โดยใชค้ ่าปกตติ ารางพนื้ ทโ่ี คง้ :
R : z < – 2.32
เนื่องจากค่าที่คำนวณได้ของ z ไม่อยู่ในขอบเขตการปฏิเสธ Ho เป็นที่ยอมรับในระดับ 1% ของระดับ
ความมีนัยสำคญั และเราสามารถสรุปได้ว่าบนพื้นฐานของข้อมูลตัวอย่าง ขอ้ เรยี กร้องของซพั พลายเออร์ไมส่ ามารถ
เป็นทย่ี อมรับในระดบั 1% การทดสอบสมมตฐิ านเพื่อความแตกตา่ งระหวา่ งสดั ส่วน ถ้าตัวอยา่ งสองตวั อยา่ งมาจาก
ประชากรที่ต่างกัน คนหนึ่งอาจสนใจที่จะรู้ว่าความแตกต่างระหว่างสัดส่วนความสำเร็จมีนัยสำคัญหรือไม่ ในกรณี
เช่นนี้ เราจะเริม่ ด้วยสมมติฐานท่วี ่าความแตกต่างระหวา่ งสัดส่วนของความสำเร็จในตวั อย่างท่ี 1 ( ̂ 1 ) กบั สดั สว่ น
ของความสำเร็จในตัวอย่างท่ี 2 ( ̂ 2 ) เกิดจากความผันผวนของการสุ่มตัวอย่าง กลา่ วอกี นัยหน่งึ เราใช้สมมติฐาน
ว่างเปน็ Ho : ̂ 1 = ̂ 2 และสำหรับการทดสอบความสำคญั ของความแตกตา่ ง เราหาสถิติการทดสอบดงั น้:ี
โดยท่ี ̂1 = สัดสว่ นของความสำเร็จในตวั อย่างที่ 1
̂2 = สัดส่วนของความสำเรจ็ ในตวั อยา่ งที่ 2
18
จากน้นั เราสร้างขอบเขตการปฏิเสธขึน้ อยกู่ ับ Ha สำหรบั ระดบั ความสำคัญท่ีกำหนดและบนพื้นฐานของมัน เรา
ตดั สินความสำคัญของผลลัพธ์ตวั อย่างสำหรบั การยอมรบั หรือปฏิเสธ Ho ซง่ึ สามารถทำได้
แสดงข้อความตอนนี้ท้งั หมดตามตัวอยา่ ง
ภาพประกอบ 16
หน่วยทดลองวิจัยยากำลังทดสอบยา 2 ชนิดที่พัฒนาขึ้นใหม่เพื่อลดความดันโลหิตระดับ ยานี้ใช้กับสัตว์สองชุดที่
แตกต่างกัน ในกลุ่มที่ 1 สัตว์ 350 จาก 600 ตัวทดสอบตอบสนองต่อยาที่ชนิดที่หนึ่งและในกลุ่มที่สอง สัตว์ 260
จาก 500 ตัวที่ทดสอบตอบสนองต่อยาชนิดที่สอง หน่วยวิจัยต้องการทดสอบว่าประสิทธิภาพของยา 2 ชนิด
ดังกล่าวมคี วามแตกตา่ งกันหรือไม่ ท่รี ะดับนัยสำคัญรอ้ ยละ 5 คณุ จะจดั การกบั ปัญหานอี้ ยา่ งไร?
* สูตรนใี้ ชเ้ ม่ือดงึ ตวั อย่างจากประชากรสองกลมุ่ ทแ่ี ตกต่างกนั ซึง่ เราไม่สามารถมสี ่งิ ท่ีดีท่สี ุดได้การประมาณ
ค่าทั่วไปของสัดส่วนของแอตทริบิวต์ในประชากรจากข้อมูลตัวอย่างทีใ่ ห้มา แต่บนสมมติฐานที่วา่ ประชากรมีความ
คล้ายคลึงกันตามคุณลักษณะที่กำหนด เราใช้สูตรต่อไปนี้สำหรับหาข้อผิดพลาดมาตรฐานของความแตกต่าง
ระหวา่ งสดั ส่วนของตวั อยา่ งทง้ั สอง:
วิธีแก้ปญั หา: เราใช้สมมติฐานว่างว่าไมม่ ีความแตกตา่ งระหวา่ งยาสองตัวน่นั คือ Ho : ̂ 1 = ̂ 2
สมมติฐานทางเลือกสามารถนำมาไดเ้ น่ืองจากมคี วามแตกตา่ งระหวา่ งยา กล่าวคือ Ha : ̂ 1 ≠ ̂ 2
และข้อมูลที่ระบสุ ามารถระบุได้ดงั น้ี:
เราสามารถหาสถติ ิการทดสอบ z ไดด้ งั น:ี้
19
อย่าง Ha เปน็ แบบสองด้าน เราจะกำหนดขอบเขตการปฏิเสธทใี่ ชก้ ารทดสอบแบบสองดา้ นท่รี ะดับ 5%
ซึง่ มาตามตารางพืน้ ท่โี ค้งปกติ
R : | z | > 1.96
ค่าที่สงั เกตไดข้ อง z คอื 2.093 ซึ่งอยู่ในขอบเขตการปฏเิ สธ ดงั นั้น Ho ถกู ปฏิเสธในการสนบั สนุนของ Ha และ
ด้วยเหตุน้ี เราจงึ สรุปไดว้ า่ ความแตกต่างระหว่างประสิทธภิ าพของยาทงั้ สองอย่างมีนยั สำคัญ
ภาพประกอบ 17
ณ วันที่หนึ่งในเมืองใหญ่ 400 คนจากกลุ่มตัวอย่างสุ่ม 500 คนพบว่าสูบบุหรี่หลังจากขึ้นภาษียาสูบอย่าง
หนัก กลุม่ ตวั อย่างอีก 600 คนในกลุ่มเดียวกนั รวมผู้สบู บหุ รี่ 400 คน สัดส่วนของผ้สู ูบบหุ ร่ีลดลงอย่างมีนัยสำคัญ
หรือไม?่ ทดสอบทีร่ ะดบั นยั สำคัญรอ้ ยละ 5
วิธีแก้ปัญหา: เราเริ่มตน้ ดว้ ยสมมติฐานว่างว่าสัดส่วนของผูส้ ูบบหุ ร่แี ม้หลงั ภาษหี นักยาสูบยังคงไม่เปล่ียนแปลง เช่น
Ho : ̂ 1 = ̂ 2 และสมมตฐิ านทางเลือกท่สี ัดส่วนของผสู้ บู บหุ รหี่ ลงั หักภาษลี ดลง กลา่ วคือ
บนสมมติฐานทว่ี ่าประชากรทีก่ ำหนดมคี วามคล้ายคลึงกนั โดยคำนงึ ถึงคณุ ลักษณะที่กำหนด เราทำงาน
ประมาณการที่ดีท่สี ดุ ของสัดส่วนผู้สูบบุหร่ี (po ) ในประชากรตามข้อมูลท่ีกำหนดดังน้ี
20
ในฐานะที่ Ha เป็นด้านเดียว เราจะกำหนดขอบเขตการปฏิเสธท่ีใช้การทดสอบด้านเดียว (ในหางขวาเพราะ Ha
มากกวา่ ประเภท) ทร่ี ะดบั รอ้ ยละ 5 และทำงานเหมือนกนั กับดา้ นล่างโดยใช้ตารางพน้ื ทโ่ี ค้งปกต:ิ
R : z > 1.645
ค่าท่ีสงั เกตไดข้ อง z คือ 4.926 ซง่ึ อยูใ่ นขอบเขตการปฏเิ สธ ดงั น้ันเราจึงปฏเิ สธ Ho เพอ่ื ประโยชนข์ อง Ha
และสรุปไดว้ ่าสัดส่วนผสู้ บู บหุ รห่ี ลังหักภาษีลดลงอย่างมาก
การทดสอบความแตกต่างระหว่างสัดส่วนตามตวั อย่างและสัดสว่ นท่ีกำหนดสำหรับประชากรทั้งหมด: ใน
สถานการณ์เช่นนี้ เราหาข้อผิดพลาดมาตรฐานของความแตกต่างระหว่างสัดส่วนของบุคคลที่มีลักษณะเฉพาะใน
กลุ่มตวั อยา่ งและสัดส่วนท่ีกำหนดสำหรับประชากรภายใต้:ข้อผิดพลาดมาตรฐานของความแตกต่างระหว่างสัดส่วน
ตัวอย่างและ สัดสว่ นประชากรหรือ S.E
โดยท่ี p = สดั ส่วนประชากร
q=1–p
n = จำนวนรายการในกลมุ่ ตัวอย่าง
N = จำนวนรายการในประชากร
และสถติ ิการทดสอบ z สามารถหาได้ภายใต้
ขั้นตอนอื่นๆ ทั้งหมดยังคงเหมือนเดิมตามที่อธิบายไว้ข้างต้นในบริบทของการทดสอบสัดส่วน เรา
ยกตัวอย่างเพอื่ แสดงใหเ้ ห็นเช่นเดียวกัน
ภาพประกอบ 18
มีนักเรียน 100 คนในวิทยาลัยของมหาวิทยาลัยและทั่วทั้งมหาวิทยาลัย ซึ่งรวมวิทยาลัยนี้ด้วยจำนวน
นกั เรยี น 2,000 คน ในกลมุ่ ตัวอย่างสมุ่ ศึกษา 20 คน พบวา่ สบู บุหร่ใี นวิทยาลยั และสดั ส่วนผู้สูบบหุ รีใ่ นมหาวิทยาลยั
เทา่ กับ 0.05 มคี วามแตกตา่ งอยา่ งมีนยั สำคญั ระหว่างสัดส่วนของผูส้ ูบบหุ รี่ในวทิ ยาลยั และมหาวทิ ยาลัย? ทดสอบท่ี
ระดับรอ้ ยละ 5
21
วธิ แี ก้ไข: ให้ Ho : ̂ = P (ไม่มีความแตกต่างระหว่างสดั สว่ นกลมุ่ ตัวอยา่ งและสัดส่วนประชากร)
และ Ha : ̂ ≠ P (มีความแตกต่างระหวา่ งสองสัดสว่ น)
และบนพน้ื ฐานของขอ้ มูลทีก่ ำหนด สถิตกิ ารทดสอบ z สามารถคำนวณได้ดังน้ี:
ในฐานะที่เป็น Ha เป็นแบบสองหาง เราจะกำหนดขอบเขตการปฏิเสธที่ใช้การทดสอบแบบสองด้าน
ระดับ 5 เปอน?เซน็ ต์และผลงานเหมือนกันกับดา้ นลา่ งโดยใชต้ ารางพื้นท่ีโคง้ ปกติ:
R : | z | > 1.96
ค่าที่สังเกตได้ของ z คือ 7.143 ซึ่งอยู่ในขอบเขตการปฏิเสธ ดังนั้นเราจึงปฏิเสธ Ho และสรุปว่า
สัดส่วนของผู้สูบบหุ ร่ใี นวิทยาลยั กบั มหาวิทยาลยั มีความแตกต่างกันอยา่ งมนี ัยสำคัญ.
การทดสอบสมมตฐิ านเพ่อื เปรียบเทยี บความแปรปรวน
กบั ความแปรปรวนของประชากรที่คาดคะเนบางส่วน
การทดสอบที่เราใช้สำหรับเปรียบเทียบความแปรปรวนตัวอย่างกับความแปรปรวนทางทฤษฎีหรือ
สมมติฐานของประชากรแตกต่างจาก z-test หรือ t-test การทดสอบที่เราใช้เพื่อจุดประสงค์นี้เรียกว่าการ
ทดสอบไคสแควร์ และสถติ กิ ารทดสอบที่ใชส้ ัญลักษณ์เป็น 2 หรอื ท่ีเรียกว่าค่าไคสแควร์น้นั ได้ผลค่าไคสแควร์
เพ่อื ทดสอบสมมตฐิ านวา่ ง กล่าวคอื Ho : 2 = 2 ทำงานดงั น:้ี
โดย 2 = ความแปรปรวนของกลมุ่ ตวั อย่าง
2 = ความแปรปรวนของประชากร
(n – 1) = ระดับความเปน็ อสิ ระ n คือจำนวนรายการในกลุ่มตวั อยา่ ง
จากน้นั โดยเปรยี บเทียบค่าท่ีคำนวณไดข้ อง χ 2 กบั คา่ ตารางสำหรับ (n – 1) คา่ ช้นั แห่งความเป็นอิสระใน
ระดับความสำคัญที่กำหนด เราอาจยอมรับ Ho หรือปฏิเสธ ถ้าค่าที่คำนวณได้ของ χ2 เท่ากับหรือน้อยกว่าค่า
ตาราง ยอมรับสมมติฐานว่าง มิฉะนั้นจะเป็นโมฆะสมมติฐานถูกปฏเิ สธ การทดสอบน้ีใช้การแจกแจงแบบไคสแควร์
22
ซึ่งไม่สมมาตรและทั้งหมดค่าที่เกิดขึ้นเป็นบวก เราต้องรู้ระดับค่าชั้นแห่งความเป็นอิสระในการใช้ การกระจาย a .
ดังกลา่ ว*
การทดสอบความเทา่ เทียมกนั ของความแปรปรวน
ของสองประชากรปกติ
เมื่อเราต้องการทดสอบความเท่าเทียมกันของความแปรปรวนของประชากรปกติสองกลุ่ม เราจะใช้
F-test ขึ้นอย่กู ับการกระจาย F ในสถานการณเ์ ช่นน้ี สมมตฐิ านวา่ งจะเป็น Ho : 2 1 = 2 2 , 2 1 และ
2 2 แทนค่าความแปรปรวนของประชากรปกติสองกลุ่ม สมมติฐานนี้ได้รับการทดสอบบนพื้นฐานของข้อมูล
ตัวอยา่ งและสถติ กิ ารทดสอบ F พบ โดยใช้ 2 1 และ 2 2 คา่ ประมาณตวั อย่างสำหรับ 2 1 และ 2 2
ตามลำดบั ดังท่รี ะบุไวด้ ้านล่าง:
ขณะคำนวณ F ได้รับการปฏบิ ัติ > 2 2 ซง่ึ หมายความวา่ ตัวเศษจะมากกวา่ เสมอ ความแปรปรวน
ตารางการกระจาย F** จัดทำโดยนักสถิติสำหรับค่า F at . ที่แตกต่างกัน ระดับความมีนัยสำคัญที่แตกต่างกัน
สำหรับระดับค่าชั้นแห่งความเป็นอิสระที่ต่างกันความแปรปรวน โดยการเปรียบเทียบค่าที่สังเกตได้ของ F กับค่า
ตารางที่สอดคล้องกัน เราสามารถอนุมานได้ความแตกต่างระหว่างความแปรปรวนของกลุ่มตัวอย่างอาจเกิดขึ้น
เนอื่ งจากการสุ่มตวั อยา่ งหรอื ไม่ความผันผวน หากคา่ ทค่ี ำนวณได้ของ F มากกวา่ คา่ ตารางของ F ที่ระดบั ความมี
นยั สำคญั ท่กี ำหนด
สำหรบั (n1 – 1) และ (n2 – 2) คา่ ชน้ั แห่งความเป็นอสิ ระ เราถือว่าอัตราส่วน F มคี วามสำคัญ องศาของ
เสรีภาพสำหรับความแปรปรวนที่มากขึ้นแสดงเป็น v1 และสำหรับความแปรปรวนที่น้อยกว่าเช่น v2 ในทาง
กลับกัน, ถ้าค่าที่คำนวณได้ของ F น้อยกว่าค่าในตาราง เราก็สรุปได้ว่าอัตราส่วน F นั้นไม่สำคัญ ถ้าอัตราส่วน F
ถือว่าไม่มีนัยสำคัญ เรายอมรับสมมติฐานว่าง แต่ถ้าพิจารณาอัตราส่วน F สำคัญ เราก็ปฏิเสธ Ho (กล่าวคือ เรา
ยอมรับ Ha ). เมื่อเราใช้ F-test เราถือว่า
(i) ประชากรเป็นปกติ
(ii) ตวั อยา่ งไดร้ บั การสุ่มตวั อยา่ ง;
(iii) การสงั เกตเป็นอิสระ; และ
23
(iv) ไม่มขี ้อผดิ พลาดในการวดั
เป้าหมายของการทดสอบ F คือการทดสอบสมมติฐานว่าตัวอย่างทั้งสองมาจากค่าปกติหรือไม่
ประชากรที่มีความแปรปรวนเทา่ กนั หรือจากประชากรปกติสองกลุ่มทม่ี ีความแปรปรวนเทา่ กนั F-test คอื
แรกเริ่มใช้เพื่อตรวจสอบสมมติฐานของความเท่าเทียมกันระหว่างความแปรปรวนสองค่า แต่ตอนนี้ส่วนใหญ่ใช้ใน
บริบทของการวิเคราะห์ความแปรปรวน ตวั อย่างต่อไปนี้แสดงให้เห็นถงึ การใช้ F-test สำหรับการทดสอบความเท่า
เทียมกนั ของความแปรปรวนของประชากรปกติสองกลุม่
ภาพประกอบ 19
ตัวอยา่ งสุ่มสองตวั อยา่ งจากประชากรปกตสิ องกลุ่มคือ:
ตัวอยา่ งที่ 1 20 16 26 27 23 22 18 24 25 19
ตัวอยา่ งท่ี 2 27 33 42 35 32 34 38 28 41 43 30 37
ทดสอบโดยใช้อัตราส่วนความแปรปรวนที่ร้อยละ 5 และระดับนัยสำคัญร้อยละ 1 ว่าทั้งสองประชากรมีความ
แปรปรวนเทา่ กนั
วิธแี กป้ ญั หา: เรานำสมมติฐานวา่ งทว่ี ่าประชากรทัง้ สองมาจากที่ซ่งึ กลมุ่ ตวั อย่างไดร้ บั มีความแปรปรวนเหมือนกัน
เช่น Ho : 2 1 = 2 2 จากข้อมูลตวั อยา่ ง เราหาค่า 2 1 และ 2 2 ตามดา้ นล่าง:
24
คา่ ตารางของ F ทีร่ ะดบั นัยสำคัญรอ้ ยละ 5 สำหรบั v1 = 11 และ v2 = 9 คือ 3.11 และตาราง
ค่าของ F ทร่ี ะดับนยั สำคัญร้อยละ 1 สำหรับ v1 = 11 และ v2 = 9 คอื 5.20 เนอ่ื งจากค่าท่ีคำนวณได้ของ
F = 2.14 ซึ่งน้อยกว่า 3.11 และน้อยกว่า 5.20 เช่นกัน อัตราส่วน F จึงไม่มีนัยสำคัญที่ร้อยละ 5
เช่นเดียวกับที่ระดับนัยสำคัญร้อยละ 1 และด้วยเหตุนี้เราจึงยอมรับสมมติฐานว่าง และสรุปว่ากลุ่มตัวอย่างถูกดงึ
มาจากประชากรสองกล่มุ ท่มี ีความความแปรปรวนเหมือนกนั
ภาพประกอบ 20
ใช้ F-test เพ่ือตดั สินวา่ ความแตกตา่ งนี้มีนัยสำคัญท่ีระดับรอ้ ยละ 5 หรือไม่
25
วิธแี กป้ ญั หา: เราเริ่มตน้ ด้วยสมมติฐานท่วี ่าความแตกตา่ งไมม่ ีนัยสำคญั และด้วยเหตุน้ี Ho : 2 1 = 2 2
เพือ่ ทดสอบส่ิงน้ี เราคำนวณอตั ราส่วน F ดังนี:้
คา่ ตารางของ F ท่ีระดบั ร้อยละ 5 สำหรับ v1 = 8 และ v2 = 7 คือ 3.73 เน่ืองจากคา่ ท่คี ำนวณได้
ของ F มากกว่าค่าตาราง อัตราส่วน F มีนัยสำคัญที่ระดับร้อยละ 5 ดังนั้นเราจึงปฏิเสธ Ho และสรุปได้ว่าความ
แตกตา่ งมนี ัยสำคญั
การทดสอบสมมตฐิ านของสัมประสทิ ธ์สิ หสมั พันธ์*
เราอาจสนใจที่จะรู้ว่าค่าสัมประสิทธิ์สหสัมพันธ์ที่เราคำนวณบนพื้นฐานหรือไม่ของข้อมูลตัวอย่างบ่งบอกถึง
ความสมั พันธ์ที่มีนยั สำคญั เพือ่ จดุ ประสงค์นเี้ ราอาจใช้ (ในบริบทของตัวอย่างขนาดเล็ก) โดยปกติ t - test หรือ
F - test ขึ้นอยกู่ ับชนดิ ของสมั ประสทิ ธ์สิ หสมั พันธเ์ ราใชก้ ารทดสอบตอ่ ไปนี้เพ่อื วตั ถปุ ระสงค:์
(a) กรณีค่าสัมประสทิ ธส์ิ หสัมพนั ธ์อย่างงา่ ย เราใช้ t - test และคำนวณสถติ ิการทดสอบดงั น้ี
โดยที่ (n – 2) ค่าชัน้ แหง่ ความเป็นอิสระ ryx เปน็ สัมประสทิ ธิ์สหสัมพนั ธ์อย่างง่ายระหว่าง x และ y
ค่าทคี่ ำนวณได้ของ t นจ้ี ะถกู นำไปเปรยี บเทียบกับค่าในตาราง และถา้ คา่ ทค่ี ำนวณไดน้ ้อยกวา่ กว่าค่าตาราง เรา
ยอมรับสมมติฐานว่างที่ระดับนัยสำคัญที่กำหนดและอาจอนุมานได้ว่าไม่มีความสัมพันธ์ที่มีนัยสำคัญทางสถิติ
ระหว่างตวั แปรท้งั สอง
(b) ในกรณขี องคา่ สัมประสิทธิ์สหสมั พนั ธบ์ างสว่ น เราใช้ t - test และคำนวณสถิติการทดสอบดังน้ี
26
ด้วยองศาอิสระ (n – k) n คอื จำนวนการสงั เกตคแู่ ละ k เป็นตวั เลขของตวั แปรทีเ่ กยี่ วข้อง rp เกดิ ข้ึนเป็น
สมั ประสทิ ธ์ิสหสัมพันธ์บางสว่ น หากค่าของ t ในตารางมากกว่าค่าทค่ี ำนวณได้ เราอาจยอมรบั สมมตฐิ านวา่ ง
และอนมุ านว่าไม่มีความสัมพนั ธ์กัน
(c) ในกรณีของสัมประสทิ ธิ์สหสัมพันธพ์ หุคูณ: เราใช้ F - test และหาสถติ ิการทดสอบเปน็ ภายใต้
โดยที่ R คือสัมประสิทธิ์สหสัมพันธ์พหุคูณใดๆ k คือจำนวนตัวแปรที่เกี่ยวข้องและ n เป็นจำนวนการสังเกตคู่
การทดสอบทำได้โดยการปอ้ นตารางของการกระจาย F กับ
v1 = k – 1 = ค่าชน้ั แหง่ ความเป็นอสิ ระสำหรบั ความแปรปรวนในตวั เศษ
v2 = n – k = องศาอิสระสำหรบั ความแปรปรวนในตวั สว่ น
หากคา่ ทคี่ ำนวณได้ของ F น้อยกวา่ คา่ ตาราง เราก็อาจอนุมานได้ว่าไม่มสี ถิติหลักฐานของความสมั พนั ธท์ ส่ี ำคัญ
ข้อจำกัดของการทดสอบสมมติฐาน
เราได้อธิบายไว้ข้างต้นว่าการทดสอบที่สำคัญบางอย่างมักใช้สำหรับการทดสอบสมมติฐานบนพื้นฐานของซึ่งการ
ตัดสินใจท่สี ำคญั อาจขึ้นอยู่กับข้อจำกัดหลายประการของการทดสอบดังกลา่ วซ่ึงควรจะเป็นคำถามในใจโดยนักวิจัย
ข้อจำกัดทสี่ ำคญั มีดงั น้ี:
(i) การทดสอบไม่ควรใช้ในลักษณะเชิงกล พึงระลึกไว้เสมอว่าการทดสอบไม่ได้เป็นคนตัดสินใจเอง การ
ทดสอบเป็นเพียงเครอ่ื งมอื ชว่ ยในการตดั สนิ ใจเท่าน้นั เพราะฉะนัน้ “การตีความหลกั ฐานทางสถิตอิ ย่างเหมาะสมมี
ความสำคัญตอ่ การตัดสินใจอย่างชาญฉลาด”
(ii) การทดสอบไม่ได้อธบิ ายเหตุผลว่าทำไมถึงมคี วามแตกตา่ งกัน กลา่ วได้ว่าระหว่างวิธีของทั้งสองตัวอย่าง
พวกเขาเพียงแค่ระบุว่าความแตกต่างเกิดจากความผันผวนของการสมุ่ ตวั อย่างหรือเพราะเหตุผลอื่นแต่การทดสอบ
ไมไ่ ดบ้ อกเราว่าอนั ไหนเปน็ อีกหน่ึงสาเหตทุ ่ีทำใหเ้ กดิ ความแตกต่าง
(iii) ผลลัพธ์ของการทดสอบนัยสำคัญขึ้นอยู่กับความน่าจะเปน็ และไมส่ ามารถแสดงออกได้ด้วยความมั่นใจ
เต็มที่ เมื่อการทดสอบแสดงว่าความแตกต่างมีนัยสำคัญทางสถิติ ก็แสดงให้เห็นว่าความแตกต่างอาจไม่ได้เกิดจาก
โอกาส
(iv) การอนุมานทางสถิติจากการทดสอบนัยสำคัญไม่สามารถกล่าวได้ว่าถูกต้องทั้งหมดหลักฐานเก่ียวกับ
ความจริงของสมมติฐาน นี้เป็นพิเศษดังนั้นในกรณีที่มีกลุ่มตัวอย่างขนาดเล็ก ความน่าจะเป็นของการอนุมานท่ี
27
ผิดพลาดมักจะสูงกว่า เพื่อความนา่ เช่ือถือท่ีมากข้ึน ขนาดของตัวอยา่ งต้องขยายให้เพียงพอกับข้อจำกัดท้ังหมดนี้
ชี้ให้เห็นว่าในปัญหาที่มีนัยสำคัญทางสถิติ เทคนิคการอนุมาน (หรือแบบทดสอบ) จะต้องรวมกับความรูท้ ี่เพียงพอ
ของวชิ าการพร้อมกบั ความสามารถของการตดั สนิ ทด่ี ี
คำถาม
1. แยกแยะระหวา่ งสง่ิ ต่อไปน้:ี
(i) สมมติฐานอย่างงา่ ยและสมมตฐิ านประกอบ
(ii) สมมตฐิ านวา่ งและสมมติฐานทางเลือก;
(iii) การทดสอบทางเดียวและการทดสอบสองทาง
(iv) ข้อผดิ พลาด Type I และข้อผิดพลาด Type II;
(v) เขตการยอมรับและเขตพ้นื ทก่ี ารปฏเิ สธ;
(vi) ฟงั ก์ชันกำลงั และฟังก์ชนั ลักษณะการทำงาน
2. สมมติฐานคืออะไร ต้องมีคุณสมบัติอะไรบ้างจึงจะเป็นสมมติฐานการวิจัยที่ดีได้ ผู้ผลิตถือว่า
กระบวนการผลิตของเขาทำงานอย่างถูกต้องหากความยาวเฉลยี่ ของแทง่ ผู้ผลติ คือ 8.5" ส่วนเบ่ยี งเบนมาตรฐานของ
แทง่ จะว่งิ ประมาณ 0.26" เสมอ สมมตวิ า่ ตวั อย่างจาก 64 แทง่ ถูกถ่ายและให้ความยาวเฉลี่ยของแท่งเท่ากับ 8.6"
ค่าว่างและทางเลือกคืออะไร สมมติฐานสำหรับปัญหาน้ี? คุณสามารถอนุมานระดับนัยสำคัญ 5% ว่า
กระบวนการทำงานไดห้ รอื ไม่ หรอื ทำงานไดอ้ ย่างถกู ต้องหรอื ไม่
3. ข้นั ตอนการทดสอบสมมตฐิ านตอ้ งการใหผ้ ้วู จิ ยั นำหลายขน้ั ตอน อธบิ ายส้นั ๆ ทกุ ขั้นตอนดังกลา่ ว
4. พลงั ของการทดสอบสมมตฐิ านหมายถงึ อะไร จะวดั ได้อยา่ งไร อธบิ าย และอธบิ ายโดยตวั อยา่ ง
5. อธิบายสั้น ๆ เกี่ยวกับการทดสอบพารามิเตอรท์ ี่สำคัญที่ใช้ในบริบทของสมมติฐานการทดสอบ อธิบาย
วธิ กี ารทดสอบดงั กลา่ วแตกต่างจากการทดสอบทไ่ี มใ่ ช่พารามเิ ตอร์
6. อธิบายให้ชัดเจนว่าคุณจะทดสอบความเท่าเทียมกันของความแปรปรวนของประชากรปกตสิ องกลุ่มได้
อยา่ งไร
7. (a) การทดสอบ t คืออะไร ใชเ้ ม่อื ใด และเพอ่ื วัตถุประสงคอ์ ะไร อธิบายโดยใชต้ ัวอยา่ ง
(b) เขียนขอ้ ความสัน้ ๆ เกีย่ วกับ "Sandler's A-test" เพอื่ อธบิ ายความหมายมากกวา่ t - test
8. ชี้ให้เห็นข้อจำกัดที่สำคัญของการทดสอบสมมติฐาน ผู้วิจัยต้องระมัดระวังอย่างไรขณะทำการอนุมาน
ตามผลการทดสอบดังกลา่ ว
9. โยนเหรียญ 10,000 ครง้ั หัวขึ้น 5,195 ครง้ั เหรียญเปน็ กลางหรือไม่
28
10. ในการทดลองการโยนลูกเต๋าบางครั้ง การโยนลูกเต๋า 41,952 ครั้ง และจากจำนวนนี้ 25,145 ได้
ผลลัพธ์เปน็ 4 หรือ 5 หรอื 6 น้ีสอดคล้องกับสมมตฐิ านท่ีวา่ ลูกเตา๋ ไม่มีอคติ
11. เคร่ืองจักรนำส่ิงของที่ไม่สมบรู ณ์ออกมา 16 ชน้ิ ในตัวอย่าง 500 ชน้ิ หลงั จากยกเคร่ืองเครื่องจักรแล้ว
ก็จะดึงออกมาสามช้ินของท่ีไม่สมบรู ณ์ในชุดละ 100 เครอ่ื งมกี ารปรบั ปรุงหรอื ไม่ ทดสอบทีร่ ะดบั นยั สำคญั 5%
12. ในประชากรขนาดใหญ่สองกลุ่ม มีคนผมสีบลอนด์ 35% และ 30% ตามลำดับ ความแตกต่างนี้น่าจะ
เป็นไปไดท้ ่จี ะเปิดเผยโดยตัวอยา่ งงา่ ยๆ 1,500 และ 1,000 ตามลำดบั จากสองประชากร
13. ในตารางการเช่อื มโยงบางตารางไดร้ ับความถ่ีตอ่ ไปนี:้
(AB) = 309, (Ab) = 214, (aB) = 132, (ab) = 119
ความสมั พนั ธร์ ะหวา่ ง AB ตามขอ้ มูลขา้ งต้นสามารถกลา่ วได้ว่าเป็นความผันผวนของสุ่มตวั อยา่ งงา่ ยๆ
14. กลุ่มตัวอย่าง 900 ตัวอย่าง มีค่าเฉลีย่ 3.47 ซม. ถอื ว่าเป็นเร่อื งธรรมดาอยา่ งมีเหตุผลไดไ้ หม
ตวั อย่างจากประชากรจำนวนมากทม่ี ีค่าเฉลีย่ 3.23 ซม. และสว่ นเบย่ี งเบนมาตรฐาน 2.31 ซม.
15. ค่าเฉลี่ยของตัวอย่างสุ่มสองตัวอย่าง 1,000 และ 2,000 คือ 67.5 และ 68.0 นิ้วตามลำดับ ถือว่าสุ่ม
ตวั อย่างจากประชากรสว่ นเบีย่ งเบนมาตรฐานเดยี วกัน 9.5 น้ิว ไดห้ รอื ไม่ โดยทดสอบท่ีระดับนยั สำคัญ 5%
16. บริษัทขนาดใหญ่ใชห้ ลอดไฟหลายพันหลอดทุกปี แบรนด์ทเี่ คยใช้มาแลว้ มีอายุการใชง้ านเฉล่ีย 1,000
ชั่วโมงโดยมีค่าเบี่ยงเบนมาตรฐาน 100 ชั่วโมง มีการเสนอแบรนด์ใหม่ให้กับบริษัทในราคาที่ต่ำกว่าที่พวกเขาจ่ าย
ให้กับแบรนดเ์ กา่ มีการตดั สนิ ใจวา่ พวกเขาจะเปลีย่ นไปใช้แบรนดใ์ หม่ เวน้ แต่จะไดร้ บั การพสิ ูจนด์ ว้ ยระดบั นัยสำคัญ
5% ที่แบรนด์ใหม่มีอายุขัยเฉลี่ยน้อยกว่าแบรนด์เก่า สุ่มตัวอย่างหลอดไฟแบรนด์ใหม่ 100 ดวงได้รับการทดสอบ
โดยให้ผลเป็น สังเกตค่าเฉลี่ยตัวอย่าง 985 ชั่วโมง สมมติว่าค่าเบี่ยงเบนมาตรฐานของแบรนด์ใหม่เท่ากัน
เช่นเดยี วกบั แบรนด์เก่า
(a) ควรลงความเหน็ อย่างไรและควรตดั สินใจอยา่ งไร?
(b) ความนา่ จะเปน็ ที่จะยอมรบั แบรนดใ์ หม่หากมีอายกุ ารใช้งานเฉลีย่ 950 ชั่วโมง?
17. นักเรียนสิบคนถูกสุ่มเลือกจากโรงเรียนและพบว่ามีหน่วยเป็นนิ้ว 50, 52, 52, 53, 55, 56, 57, 58, 58
และ 59 จากข้อมูลเหล่านี้ ให้อภิปรายข้อเสนอแนะว่าความสูงเฉลี่ยของนักเรียนของโรงเรียนคือ 54 นิ้ว คุณ
สามารถใช้ระดับนยั สำคญั 5% (ใช้ t-test และ A-test)
18. ในการทดสอบใหน้ กั เรยี นสองกลุ่ม คะแนนท่ไี ด้มีดงั นี้
กลุ่มแรก 18 20 36 50 49 36 34 49 41
กล่มุ ทีส่ อง 29 28 26 35 30 44 46
ตรวจสอบความสำคญั ของความแตกตา่ งระหวา่ งคะแนนเฉล่ยี ท่ีไดร้ ับจากนักเรียนสองคนข้างต้น
29
กลุม่ ทดสอบท่ีระดบั นยั สำคญั รอ้ ยละ 5
19. ความสูงของกะลาสีที่สุ่มเลือก 6 คนคือ 63, 65, 58, 69, 71 และ 72 ส่วนสูง 10 ทหารที่สุ่ม
เลอื กคอื 61, 62, 65, 66, 69, 69, 70, 71, 72 และ 73 ตัวเลขเหลา่ นร้ี ะบุหรอื ไม่
วา่ ทหารเตี้ยกว่ากะลาสโี ดยเฉลี่ย ทดสอบท่รี ะดบั นัยสำคญั 5%
20. ทหารเกณฑ์อายุนอ้ ยสิบคน ถกู นำตวั ผา่ นโปรแกรมการฝึกกายภาพอันทรงพลังของกองทัพบก น้ำหนกั
ของพวกเขา (หน่วยเป็นกิโลกรัม) ถูกบนั ทกึ ก่อนและหลงั ดว้ ยผลลัพธ์ตอ่ ไปน:้ี
รบั สมัคร 1 2 3 4 5 6 7 8 9 10
น้ำหนกั กอ่ น 127 195 162 170 143 205 168 175 197 136
นำ้ หนักหลัง 135 200 160 182 147 200 172 186 194 141
โดยใช้ระดบั นัยสำคญั 5% หากสรุปได้วา่ โปรแกรมมีผลกระทบต่อนำ้ หนักเฉล่ียของการรับสมคั ร (ตอบโดยใช้
t - test และ A -test)?
21. สมมติว่าการทดสอบสมมติฐาน HO : µ = 200 เทียบกับ Ha : µ > 200 เสร็จสิ้นโดยมีระดับ
นยั สำคัญ 1%
σp = 40 และ n = 16
(a) ความนา่ จะเป็นท่ีจะยอมรับสมมติฐานวา่ งเม่ือคา่ เฉลี่ยทีแ่ ทจ้ ริงคือ 210 เป็นเท่าดกำลงั ของ
การทดสอบสำหรับ µ = 210 คืออะไร? ค่าของ β และ 1 – β เหล่านี้เปลี่ยนแปลงอย่างไรหากการทดสอบใช้
ระดับนยั สำคญั รอ้ ยละ 5
(b) ขอ้ ผิดพลาด Type I และ Type II ใดทีร่ า้ ยแรงกว่า
22. การสงั เกตเกา้ ข้อตอ่ ไปน้มี าจากประชากรปกต:ิ
27 19 20 24 23 29 21 17 27
(i) ทดสอบสมมตฐิ านวา่ ง Ho : µ = 26 เทียบกบั สมมติฐานทางเลือก Ha : µ ≠ 26. ระดับของ
ความมีนัยสำคญั Ho สามารถถกู ปฏิเสธ?
(ii) ท่รี ะดับความสำคัญสามารถ Ho : µ = 26 ถูกปฏเิ สธเมอื่ ทดสอบกับ Ha : µ < 26?
23. สมมติว่าบรรษัทมหาชนตกลงโฆษณาผ่านหนังสือพิมพ์ท้องถิ่นหากสามารถจัดตั้งได้ว่ายอดจำหน่าย
หนังสือพิมพ์เข้าถึงลูกค้าของบริษัทได้มากกว่าร้อยละ 60 Ho และ Ha ควรจะกำหนดสำหรับปัญหานี้ใน
ขณะที่ตัดสนิ ใจบนพื้นฐานของกลุ่มตัวอย่างของลูกค้าว่าหรอื บริษัทไมค่ วรโฆษณาในหนงั สือพิมพ์ท้องถิ่น? หากเก็บ
ตัวอยา่ งขนาด 100 และร้อยละ 1 ของระดบั ความมีนัยสำคัญถูกนำมาใช้ อะไรคือค่าที่สำคัญสำหรับการตัดสินใจ
30
วา่ จะโฆษณาหรอื ไม?่ มนั จะสร้างความแตกต่างไหมถา้ เราใช้ตวั อยา่ ง 25 แทน 100 สำหรบั จุดประสงคข์ องเรา ถ้า
เปน็ เช่นนนั้ อธิบาย
24. ตอบโดยใช้ F - test วา่ ตัวอย่างสองตัวอยา่ งตอ่ ไปนีม้ าจากประชากรกลุม่ เดียวกันหรือไม:่
ตัวอยา่ งที่ 1 17 27 18 25 27 29 27 23 17
ตัวอย่างที่ 2 16 16 20 16 20 17 15 21
โดยใชร้ ะดับความมนี ัยสำคญั 5 %
25. ตารางต่อไปน้รี ะบุจำนวนหนว่ ยท่ีผลติ ตอ่ วนั โดยคนงานสองคน A และ B สำหรับจำนวนวัน:
A 40 30 38 41 38 35
B 39 38 41 33 32 49 49 34
ผลลัพธ์เหล่านี้ควรได้รับการยอมรับเป็นหลักฐานว่า B เป็นคนงานที่มีเสถียรภาพมากขึ้นหรือไม่? ใช้ F - test ท่ี
ระดับ 5%
26. กลุ่มตัวอย่าง 600 คน สุ่มเลือกจากเมืองใหญ่ให้ผลเป็นเพศชาย 53 % มีเหตุผลไหมที่สงสัยใน
สมมตุ ิฐานว่าชายและหญิงมจี ำนวนเทา่ กันในเมือง? ใช้ระดับ 1% ของระดับความมีนัยสำคญั
27. นกั เรียน 12 คนไดร้ ับการฝึกสอนแบบเขม้ ขน้ และทำการทดสอบ 5 ครง้ั ในหน่ึงเดือน คะแนนสอบ 1
และ 5 ได้รับดา้ นลา่ ง คะแนนจากการทดสอบ 1 ถงึ การทดสอบ 5 แสดงการปรับปรงุ หรือไม่? ใชร้ ะดับ 5% ของ
ระดบั ความมนี ยั สำคญั
จำนวนนักเรียน 1 2 3 4 5 6 7 8 9 10 11 12
คะแนนทดสอบครัง้ ที่ 1 50 42 51 26 35 42 60 41 70 55 62 38
คะแนนทดสอบครัง้ ท่ี 5 62 40 61 35 30 52 68 51 84 63 72 50
-----------------------------------------------------------------------------------