สถิติ…ใช้ง่าย
BIOSTATISTICS FOR HEALTH RESEARCH : GUIDE BOOK
(สำหรับวจิ ยั ทำงวิทยำศำสตร์สขุ ภำพ)
อ.ดร.นพนฐั จำปำเทศ
▪ สบ.(สำธำรณสขุ ชุมชน), พย.บ.
▪ กศ.ม.(วิจยั และสถติ ทิ ำงกำรศึกษำ)
▪ กศ.ม.(สุขศกึ ษำ), พย.ม.(กำรพยำบำลผู้สูงอำย)ุ
▪ Ph.D. (Tropical Medicine)
คณะพยำบำลศำสตร์ มหำวิทยำลยั หวั เฉียวเฉลิมพระเกยี รติ
สถติ ิ (สำหรับวิจยั ทางวทิ ยาศาสตรส์ ขุ ภาพ) ใช้ง่าย
BIOSTATISTICS FOR HEALTH RESEARCH : GUIDE BOOK
อ.ดร.นพนัฐ จำปาเทศ
อาจารย์ประจำ คณะพยาบาลศาสตร์ มหาวิทยาลยั หัวเฉยี วเฉลิมพระเกยี รติ
วุฒิการศึกษา: สาธารณสุขศาสตร์ และพยาบาลศาสตร์
การศึกษามหาบณั ฑติ (การวจิ ัยและสถิติทางการศึกษา) และ (สขุ ศกึ ษา)
พยาบาลศาสตรม์ หาบัณฑติ (การพยาบาลผู้สูงอาย)ุ
ปรชั ญาดษุ ฎบี ัณฑติ (อายรุ ศาสตร์เขตรอ้ น)
คำนำ
“สถิติ” เป็นศาสตร์ที่ถูกนำมาใช้ในศาสตร์อื่น ๆ โดยเฉพาะการวิจัยที่ต้องมีการ “บรรยาย” ข้อมูล และ
ทดสอบ “สมมติฐานการวิจัย” ว่าเป็นไปตามที่ผู้วิจัยคาดการณ์ไว้หรือไม่ ในฐานะที่ผู้เขียนเป็นพยาบาลวิชาชีพ
และนักสาธารณสุข และมีโอกาสศึกษาต่อในระดับบัณฑิตศึกษาในสาขาวิจัยและสถิติทางการศึกษา และปัจจุบัน
เป็นอาจารย์ประจำที่สอนในหัวข้อชีวสถิติให้กับนักศึกษาพยาบาลระดับปริญญาตรี และระดับบัณฑิตศึกษาสาขา
การพยาบาลเวชปฏิบัตติ ิชุมชน จึงสรุปความรู้และประสบการณ์การใช้สถิติในการวจิ ัยซึ่งเปน็ guide book ที่เน้น
การเลอื กใช้สถติ ใิ หเ้ หมาะสมกับข้อมลู
ผู้เขียนหวังว่า guide book เล่มนี้ จะเป็นประโยชน์สำหรับนักวิจัยหน้าใหม่ที่มีความกังวลกับการใช้สถิติ
ในการจดั กระทำกับขอ้ มูลในการวิจัยและสามารถใชส้ ถติ ิไดง้ ่าย ๆ ตามชือ่ หนังสือ คือ “สถติ ิ.......ใชง้ ่าย”
นพนัฐ จำปาเทศ
สารบัญ หนา้
2
บทท่ี หวั ข้อ 5
1 บทนำ 10
2 การจัดกระทำกบั ข้อมลู ในการศึกษาวิจยั ดว้ ยสถิติพรรณนา 13
3 หลักการการจัดกระทำกบั ขอ้ มลู ในการศึกษาวิจยั ด้วยสถติ ิอนุมาน 16
4 ประเดน็ สำคัญทีเ่ กยี่ วข้องกับสถิติอนมุ าน 21
5 สถิติอนมุ านกลุ่ม Non – parametric
6 สถติ ิอนุมานกลมุ่ Parametric
1
บทท่ี 1
บทนำ
การใช้วิธีการทางสถิตเิ พื่อพรรณนาหรืออธบิ ายลักษณะของข้อมูลที่เกีย่ วกับโรค ปัญหาสุขภาพหรอื การเจ็บปว่ ย
ตลอดจนปัจจัยต่าง ๆ ที่อาจจะหรือมีความเกี่ยวข้องกัน (association) ทั้งที่มีความสัมพันธ์ทั่วไปและสัมพันธ์เชิงสาเหตุ
(non causal and causal association) กับสุขภาพหรือการเจ็บป่วย รวมทั้งควบคุมหรือกำจัดอิทธิพลของปัจจัยแทรก
ซอ้ นหรือปจั จยั รบกวน เพ่ือแสดงถงึ ความสัมพันธข์ องปัจจัยสาเหตุกับปัญหาสุขภาพที่ชดั เจนขนึ้ เป็นวตั ถุประสงค์ท่ีสำคัญ
ที่นำองค์ความรู้ทางสถิติมาใช้ในวิทยาศาสตร์สุขภาพ นอกจากนี้ยังใช้คำนวณจำนวนกลุ่มตัวอย่างที่เหมาะสมในการเก็บ
ข้อมูลสุขภาพหรือการเจบ็ ป่วย และวิเคราะห์คุณภาพของแบบสอบถามและเคร่ืองมอื ที่ใช้เก็บขอ้ มูลรวมทั้งเครื่องมือที่ใช้
ในห้องปฏิบัติการ ข้อมูลที่ถูกจดั กระทำแล้วด้วยสถติ ิจะเป็นสิ่งสำคัญในการดำเนินการจดั การปัญหาทางสาธารณสุข เช่น
การเฝ้าระวัง การควบคุมป้องกัน หรือการออกมาตรการที่เหมาะสมและทันเวลาโดยเฉพาะเมื่อมีการระบาดของโรคหรือ
ปญั หาสขุ ภาพ โดยสถติ ใิ นภาษาองั กฤษ ไดแ้ ก่ “Statistic” “Statistics” และ “Biostatistics” ซ่งึ มคี วามหมายดังน้ี
“Statistic” หมายถึง ค่าสถิติตัวหนึ่ง ๆ ได้มาจากการคำนวณ เช่น ค่าเฉลี่ย ค่าเบี่ยงเบนมาตรฐาน อัตราการเกิด
อตั ราการตาย เปน็ ต้น
“Statistics” มีความหมาย 2 ความหมาย ดังน้ี
1) ความหมายที่ 1 คือตัวเลขหลายจำนวน ที่ถูกเก็บรวบรวมเพื่อแสดงลักษณะหรือคุณสมบัติของบุคคล สิ่งของ
เรื่องราว ปรากฏการณ์ ตา่ งๆ เชน่ สถิตปิ ระชากร สถติ ิชพี ปริมาณน้ำฝนในปตี ่าง ๆ เป็นตน้
2) ความหมายที่ 2 คือวิชาสถิติศาสตร์ เป็นเนื้อหาที่ประกอบด้วยการเก็บรวบรวมข้อมูล การจำแนกประเภท การ
วิเคราะห์และแปลความหมายข้อมลู เพือ่ บรรยายหรอื สรุปเก่ยี วกับคณุ ลักษณะของสิ่งทศี่ ึกษา
“Biostatistics” หมายถึง วิชาสถิติที่ถูกนำไปประยุกต์ใช้กับข้อมูลสุขภาพ สาธารณสุขหรือข้อมูลทางด้านชีว
การแพทย์ (biomedical)
สถิตทิ ีถ่ ูกใชใ้ นการจดั กระทำกับขอ้ มูลแบง่ เป็นประเภทตา่ ง ๆ ดงั นี้
1. สถิติพรรณนาหรือสถิติเบื้องต้น ซึ่งเป็นสถิติสำหรับเพื่อบรรยาย พรรณนา หรืออธิบายการกระจายหรือแจก
แจง (distribution) ของข้อมูล เพื่อแสดงถึงการกระจายของโรคหรือปัญหาสุขภาพ และความเกี่ยวข้องของปัจจัยที่เป็น
สาเหตุของการเกดิ โรคหรือปญั หาสุขภาพ (determinant, exposure) เช่น ร้อยละ สัดสว่ น ค่ากลาง คา่ การกระจาย เป็น
ต้น รวมทั้งสถิติชีพหรือดัชนีทางสุขภาพ เช่น อัตราป่วย อัตราตาย ความชุกและอุบัติการณ์ของการเกิดโรคหรือปัญหา
สขุ ภาพ เป็นตน้ จะใชใ้ นการศกึ ษาวิจยั เชิงพรรณนา (descriptive study)
2. สถิติอนุมานหรือสถิติเพื่อทดสอบสมมติฐาน เป็นสถิติท่ีนำข้อมูลมาจัดกระทำเพื่อมุ่งตอบคำถามของการ
ศึกษาวิจัยถึงความเกี่ยวข้องของปัจจัยหรือตัวแปรต่าง ๆ เช่น t-test, ANOVA, Odds/Risk ratio เป็นต้น จะใช้ใน
การศึกษาวจิ ยั เชิงวเิ คราะห์ (analytic study)
3. สถิติอื่น ๆ เช่น สถิติในการคำนวณจำนวนหรือขนาดของกลุ่มตัวอย่าง และสถิติในการวิเคราะห์คุณภาพ
เครื่องมือในการเก็บรวบรวมข้อมูล เป็นสถิติที่ใช้ในการอธิบายถึงความเที่ยงตรง ความแม่นยำ หรือความถูกต้องของ
แบบสอบถาม แบบทดสอบ ท่ีใชใ้ นการเก็บรวบรวมขอ้ มูล เชน่ CVI, IOC, α Cronbach, sensitivity/specificity เปน็ ตน้
2
หมายเหตุ
- การแบง่ ประเภทของสถิติ แบ่งได้หลายวธิ ี ดงั น้ี
1. แบง่ ตามการนำไปใช้ ได้แก่
1.1 Descriptive statistics (สถติ เิ บื้องตน้ หรือบรรยาย หรือ พรรณนา) เป็นสถติ ิทใ่ี ชอ้ ธบิ ายขอ้ มูลทีร่ วบรวมไว้
1.2 Inferential statistics (สถิติอ้างอิง หรือ สถิติอนุมาน หรือ สถิติเพื่อใช้ทดสอบสมมติฐาน) เป็นสถิติที่ใช้
วเิ คราะห์แปลข้อมลู จากกลุ่มตวั อยา่ ง แล้วนำทฤษฎีความนา่ จะเปน็ มาใช้อ้างอิง สรุปไปสู่ประชากร
2. แบง่ ตามจำนวนตวั แปรท่ศี ึกษา ดงั น้ี
2.1 Univariate statistics เป็นการวิเคราะห์ค่าสถติ ิของข้อมลู 1 ชุด และพิจารณาความเกี่ยวข้องของข้อมูลชุด
นั้น กับค่าหรอื คะแนน หรือเกณฑ์มาตรฐาน
2.2 Bivariate statistics เปน็ การวิเคราะหค์ ่าสถิติของขอ้ มลู ความเก่ียวข้องของข้อมูล/ตวั แปร 2 ตวั
2.3 Multivariate statistics เปน็ การวิเคราะห์คา่ สถติ ขิ องข้อมลู ความเกี่ยวข้องของข้อมูล/ตวั แปรมากกว่า 2 ตัว
3. แบ่งตามขนาดตัวอยา่ ง และการกระจายขอ้ มูล ดังน้ี
3.1 Parametric statistics (การทดสอบสมมติฐานที่ใช้พารามิเตอร์) ใช้สำหรับการวิเคราะห์เพื่อทดสอบ
สมมติฐาน เมอื่ ขอ้ มูลทไี่ ดม้ ีการกระจายเป็นโค้งปกติ (Normal distribution)
3.2 Non – parametric statistics (การทดสอบสมมติฐานที่ไม่ใช้พารามิเตอร์) ใช้สำหรับการวิเคราะห์เพ่ือ
ทดสอบสมมติฐาน เมอ่ื ขอ้ มลู ทไ่ี ดม้ ีการกระจายเป็นแบบใดกไ็ ด้ (Free distribution)
ขอ้ มูล ความหมายและจำแนกประเภทและระดบั ของขอ้ มูล
สถิติเป็นเครื่องมือที่นำมาใช้ในการจัดกระทำกับข้อมูล ซึ่งต้องเลือกสถิติที่เหมาะสมกับลักษณะ ประเภทหรือระดับ
หรือมาตรวัดของข้อมูล รวมทัง้ ลักษณะการแจกแจงความถี่ของข้อมูล โดยท่ี ข้อมลู จะหมายถึง ข้อเท็จจริงเก่ียวกับเร่ืองที่
สนใจศึกษา อาจจะเป็นข้อเท็จจริงที่เป็นตัวเลข เช่น จำนวนประชากรของประเทศ คะแนนสอบวิชาสถิติ เป็นต้น
ส่วนข้อมลู อกี ประเภทหนึง่ ท่ีไม่อยู่ในรปู ตัวเลข เชน่ เพศ อาชีพ ลกั ษณะนิสัย สถานภาพสมรส เป็นตน้ ข้อมูลสามารถแบ่ง
ออกได้ ดงั นี้
1. แบ่งตามลักษณะข้อมลู ทเ่ี ป็นหรือไม่เป็นตัวเลข ไดแ้ ก่
1.1 ขอ้ มลู เชิงปรมิ าณหรอื ขอ้ มูลตอ่ เนอื่ ง (quantitative or continuous data) ลกั ษณะข้อมูลเป็นตวั เลข และมี
ค่า หรือความหมายตรงตามตัวเลขนั้น ๆ เช่น อายุ ส่วนสูง น้ำหนัก คะแนนสอบ คะแนนความเครียด คะแนนคุณภาพ
ชีวิต เปน็ ต้น ลักษณะสำคัญอีกอย่าง คอื เป็นข้อมลู ท่ไี ดจ้ ากการวดั
1.2 ข้อมูลเชิงกลุ่ม หรือข้อมูลเชิงคุณลักษณะหรือเชิงคุณภาพ (categorical or qualitative Data) ลักษณะ
ข้อมูลทีไ่ ม่ใชต่ วั เลข เชน่ เพศ สถานภาพสมรส ผลสัมฤทธทิ์ างการเรยี นท่ีแบ่งเป็นเกรด เปน็ ตน้ หรือขอ้ มลู ทเ่ี ป็นตัวเลขแต่
ไม่มีค่า หรือไม่มีความหมายตรงตามตัวเลขนั้นๆ ซึ่งเป็นการกำหนดตัวเลขแทนค่า (coding) เท่านั้น ลักษณะสำคัญอีก
อย่าง คอื เป็นข้อมลู ทไี่ ดจ้ ากการแจงนับ ผลของการนับจะเปน็ ความถี่ และรอ้ ยละ
2. แบ่งตามระดบั ข้อมลู หรือมาตรวดั ของข้อมลู ซ่งึ ใช้พจิ ารณาเลือกสถิติในการพรรณนาหรืออธิบายข้อมูลรวมท้ังการ
เลือกใช้สถติ ิอนมุ านหรอื สถิติเพื่อทดสอบสมมติฐานตอ่ ไป แบ่งเป็น 4 ระดบั ดังน้ี
2.1 นามบัญญัติ (nominal scale or classification scale) เป็นข้อมลู ทถ่ี กู จดั เป็นกลุ่มหรอื ประเภทแลว้ กำหนด
ตัวเลขหรือสญั ลักษณ์แทนกลุ่มหรอื ประเภทนัน้ เช่น กำหนดตัวเลข 1 แทนเพศหญิง 2 แทนเพศชาย โดยที่ตัวเลขเหลา่ นี้
3
ไมม่ คี วามหมายในเชิงตวั เลขและเชิงปริมาณ และไมส่ ามารถนำมาบวก ลบ คณู หาร กันได้ เชน่ แยกบคุ คลเป็นกลุ่ม ตาม
เพศ ศาสนา ภูมลิ ำเนา เปน็ ต้น
2.2 เรียงอันดับ (ordinal scale) เป็นข้อมูลที่ถูกจัดเป็นกลุ่มหรือประเภทแลว้ กำหนดตัวเลขหรือสัญลักษณ์แทน
กลมุ่ หรอื ประเภทน้ันเชน่ เดียวกับ nominal scale และมีการกำหนดตวั เลขหรือสัญลักษณ์แทนกลุ่มหรือประเภทนั้น เช่น
กำหนดตัวเลขแทนระดับความเครียด ดังนี้ เลข 1 แทนระดับสูง เลข 2 แทนระดับปานกลาง และ เลข3 แทนระดับต่ำ
เป็นตน้ โดยที่ตวั เลขเหล่านี้ไม่มคี วามหมายในเชิงตวั เลขแต่มีความหมายในเชิงปริมาณ ในระบบน้ตี ัวเลขจะเปน็ เครื่องบอก
ลำดับที่และตัวเลขในระบบนี้ไม่สามารถนำมาบวก ลบ คูณ หาร ได้ ตัวอย่าง เช่น ระดับการศึกษา ช่วงอายุ ระดับ
พฤตกิ รรมสุขภาพ เป็นตน้
2.3 อนั ตรภาค (interval scale) เปน็ การวัดทีใ่ ห้ค่าเป็นช่วง ซง่ึ แตล่ ะชว่ งจะมีค่าเทา่ ๆ กนั และเป็นข้อมูลที่มีค่า
ตอ่ เน่ืองเป็นการวัดทีไ่ ม่มีศูนยแ์ ท้ (true zero point) เช่น การสอบวิชาสถติ ไิ ด้ 0 คะแนน ไมไ่ ด้หมายถึงว่าผู้นั้นไมม่ คี วามรู้
วชิ าสถติ ิเลย
2.4 อัตราส่วน (ratio scale) เป็นการวัดที่ให้ค่าเป็นช่วง ซึ่งแต่ละช่วงจะมีค่าเท่า ๆ กัน และเป็นข้อมูลที่มีค่าต่อเนื่อง
เช่นเดียวกบั Interval scale แต่มกี ารวดั ท่ีมศี ูนย์แท้ เช่น นำ้ หนกั 0 กิโลกรัม หมายถงึ วา่ ไมม่ นี ำ้ หนกั อย่เู ลย เปน็ ตน้
ในการพิจารณาข้อมูลเลือกใช้สถิติให้เหมาะสมกับข้อมูลอาจจะพิจารณาแบ่งข้อมูลเป็น 2 ประเภท คือ 1)ข้อมูลเชิง
กลมุ่ ประกอบดว้ ย ขอ้ มลู นามบญั ญัติและเรยี งอนั ดับ และ 2) ข้อมูลเชิงปรมิ าณ ประกอบดว้ ย ขอ้ มลู อนั ตรภาคและข้อมูล
อตั ราสว่ น ดงั แผนภาพท่ี 1
แผนภาพท่ี 1 ประเภทและระดับของข้อมูล
4
บทท่ี 2
การจดั กระทำกบั ข้อมูลในการศกึ ษาวิจัยดว้ ยสถิติพรรณนา
การจัดกระทำกับข้อมูลในการศึกษาวิจัยทางระบาดวิทยาด้วยสถิติพรรณนา (descriptive statistics) เป็น
กระบวนการแปลงข้อมูลที่รวบรวมได้ให้เป็นตัวเลข และวิเคราะห์ด้วยสถิติ เช่น ร้อยละ ค่ากลาง (central และค่าการ
กระจาย และการนำเสนอข้อมูลในรูปแบบตาราง หรือ กราฟ เป็นต้น เพื่อให้เห็นภาพรวมของลักษณะของข้อมูลและ
สะดวกในการแปลความหมายข้อมลู ค่าสถติ ิทใี่ ช้ต้องเหมาะสมกับประเภทและมาตรวดั ของข้อมลู แบง่ เปน็ สถติ ิพรรณนา
สำหรับข้อมูลเชงิ กลมุ่ และสถิติพรรณนาสำหรับขอ้ มลู เชิงปริมาณ ดังน้ี
1. การจัดกระทำกับข้อมูลด้วยสถิติพรรณนาเมื่อข้อมูลเป็นข้อมูลเชิงกลุ่มหรือเชิงคุณลักษณะ (qualitative,
categorical, nominal and ordinal data) เป็นการวิเคราะห์และนำเสนอด้วยค่าความถี่ สัดส่วนและร้อยละ ซึ่งเป็น
ค่าสถิติทใี่ ชใ้ นการนบั ความซ้ำของข้อมลู ดังตวั อยา่ ง
ตวั อย่างที่ 1 คา่ ความถ่ีและร้อยละของผลการรักษา (ขอ้ มูลเชิงกลุม่ หรือเชงิ คุณลกั ษณะมาตรวดั นามบัญญตั ิ)
ผลการรกั ษา ความถ่ี ร้อยละ Valid Percent
death 8 8.6 8.6
loss to f/u 19 20.4 20.4
on going 61 65.6 65.6
refer 5 5.4 5.4
Total 93 100.0 100.0
แปลผลจากตารางเป็นข้อมูลผลการรักษาผู้ป่วยทั้งส้ิน 93 ราย พบว่า เสียชีวิต 8 ราย (8.6%) ติดตามไม่ได้ 19
ราย (20.4%) ยังคงรกั ษาอยู่ 61 ราย (65.6%) และ สง่ ไปรกั ษาต่อทอ่ี ื่น 5 ราย (5.4%)
ตวั อยา่ งท่ี 2 คา่ ความถ่ีและร้อยละของผลการรักษา (ขอ้ มูลเชิงกลุ่มหรอื เชิงคุณลักษณะมาตรวัดนามบญั ญตั ิเมอื่ ข้อมูลไม่
ครบ ซง่ึ Valid percent จะไมเ่ ทา่ กับ percent)
ผลการรกั ษา ความถี่ รอ้ ยละ Valid Percent
death 45 48.4 84.9
loss to f/u 1 1.1 1.9
on going 7 7.5 13.2
Total 1 53 57.0 100.0
Missing (ไมม่ ขี ้อมลู ) 40 43.0
Total 2 93 100.0
5
แปลผล (พิจารณาค่าร้อยละจาก valid percent) จากตารางเป็นข้อมูลผลการรักษาผู้ป่วยทั้งสิ้น 93 ราย พบว่า
เสียชีวิต 45 ราย (84.9%) ติดตามไม่ได้ 1 ราย (1.9%) ยังคงรักษาอยู่ 7 ราย (13.2%) และ ไม่ทราบผลการรักษา 53
ราย (13.2%) (ใชข้ อ้ มูล Valid percent คำนวณจากเฉพาะทม่ี ีขอ้ มลู อยใู่ นการนำเสนอ)
ตัวอยา่ งที่ 3 คา่ ความถี่และร้อยละของระดบั รายได้ (ขอ้ มูลเชงิ กลุม่ หรือเชงิ คุณลกั ษณะมาตรวดั เปน็ แบบเรียงอนั ดับ)
รายได้ ความถี่ ร้อยละ Valid Percent
5,000 – 10,000 45 48.4 84.9
10,001 – 15,000 1 1.1 1.9
15,001 – 20,000 7 7.5 13.2
Total 1 53 57.0 100.0
Missing (ไมม่ ขี อ้ มลู ) 40 43.0
Total 2 93 100.0
แปลผลจากตาราง พบวา่ ส่วนใหญ่มรี ายได้ 5,000 – 10,000 บาท จำนวน 45 ราย (84.9%) รองลงมาได้แก่
ผูม้ รี ายได้ 10,001 – 15,000 บาทจำนวน7ราย (13.2%) (เนือ่ งมี Missing data จงึ ใชข้ ้อมูล Valid percent คำนวณจาก
เฉพาะทม่ี ีข้อมลู อยใู่ นการนำเสนอ)
ตัวอยา่ งที่ 4 คา่ ความถี่และร้อยละของประวัตกิ ารด่ืมแอลกอฮอล์ ในผู้ปว่ ย Cirrhosis (ข้อมูล 2 ชุดเปน็ เชิงกลุ่ม
จะแสดงเป็น two way table จากการทำ Crosstabulation)
Hx. Alcohol no Count cirrhosis Total
drinking % within Hx. Alcohol drinking no yes 340
% within cirrhosis 256 84 100.0%
Total 75.3% 24.7% 69.2%
yes Count 77.8% 51.9% 151
% within Hx. Alcohol drinking 73 78 100.0%
% within cirrhosis 48.3% 51.7% 30.8%
Count 22.2% 48.1% 491
% within Hx. Alcohol drinking 329 162 100.0%
% within cirrhosis 67.0% 33.0% 100.0%
100.0% 100.0%
6
แปลผลจากตาราง สามารถแปลได้ 2 ลกั ษณะ คอื
1) ความหมายจาก แถว (Hx. Alcohol drinking) ผู้ที่ไม่มีประวัติดื่มแอลกอฮอล์จำนวน 340 คน พบว่า เป็น
cirrhosis จำนวน 84 คน คิดเป็น 24.7% และอีก 256 คน เป็นคนที่ไม่ป่วยเป็น cirrhosis คิดเป็น 75.3% และผู้ที่มี
ประวัติดื่มแอลกอฮอล์จำนวน 151 คน พบว่า เป็น cirrhosis จำนวน 78 คน คิดเป็น 51.7 % และอีก 73 คน เป็นคนท่ี
ไมป่ ่วยเป็น cirrhosis คดิ เปน็ 48.3%
2) ความหมายจาก คอลัมน์ (cirrhosis) พบว่า ผู้ที่เป็น cirrhosis จำนวน 162 คน พบว่า ไม่มีประวัติด่ืมแอลกอฮอล์
จำนวน 84 คน คิดเป็น 51.9% และอีก 78 คน เปน็ ผทู้ ่ีมีประวัติด่ืมแอลกอฮอล์ คดิ เปน็ 48.1% และผูท้ ไี่ มเ่ ป็น cirrhosis
จำนวน 329 คน พบว่า ไม่มีประวัติดื่มแอลกอฮอล์จำนวน 256 คน คิดเป็น 77.8% และอีก 73 คน เป็นผู้ที่มีประวัติดื่ม
แอลกอฮอล์ คดิ เปน็ 22.2%
2. การจัดกระทำกับข้อมูลด้วยสถิติพรรณนากรณีข้อมูลเป็นข้อมูลเชิงปริมาณ ซึ่งวิเคราะห์ข้อมูลเชิงปริมาณใน 2
ประเดน็ คือ การวิเคราะห์แนวโนม้ เข้าส่สู ว่ นกลางหรือค่ากลาง และ คา่ การกระจาย โดยจะเลอื กสถิติท่ีเหมาะสมจากการ
พิจารณาการแจกแจงของข้อมลู (ตอ้ งตรวจสอบการแจกแจงข้อมลู กอ่ นวา่ เป็น normal distribution หรือไม)่ 2 กรณี คอื
2.1 กรณีข้อมูลกระจายเป็นโค้งปกติ วิเคราะห์ค่ากลางด้วยค่าเฉลี่ยหรือมัชฌิมเลขคณิต และวิเคราะห์ค่าการ
กระจายของขอ้ มูลดว้ ยคา่ เบี่ยงเบนมาตรฐาน ดังนี้
2.1.1 การวิเคราะห์ค่ากลางด้วย “ค่าเฉลี่ยหรือมัชฌิมเลขคณิต (mean or average)” วิเคราะห์โดยนำเอา
ข้อมูลทั้งหมด มารวมกันแล้วหารด้วยจำนวนข้อมูล (ใช้ในข้อมูลเชิงปริมาณที่มีการแจกแจงแบบโค้งปกติสัญลักษณ์ที่ใช้
คือ μ เม่ือเปน็ ค่าเฉลยี่ ในประชากร และ ×̅ เป็นค่าเฉลีย่ ของข้อมูลทเ่ี กบ็ จากกลุ่มตวั อย่าง (sample mean)
ตัวอย่าง การวิเคราะห์คา่ เฉลี่ยผลการตรวจนำ้ ตาล FPG (fasting plasma glucose) จำนวน 30 คน (มี 1 รายที่ไมม่ ี
ขอ้ มูล ดังน้ัน n = 29) ดังนี้
ชาย หญงิ ชาย หญงิ ชาย หญิง ชาย หญงิ ชาย หญิง
199
100 75 70 114 150 188 167 128 169 301
98
208 222 247 212 200 -. 77 84 99
333 251 162 152 144 147 154 88 89
การวิเคราะห์ทำไดโ้ ดย นำคา่ ทุกค่าในตารางมาบวกกนั และหารดว้ ยจำนวนขอ้ มูลทงั้ หมด ดงั น้ี
100+208+333+75+222+251+………………………………………+98 = 159.59
29
2.1.2 การวิเคราะห์การกระจายของข้อมูลด้วยค่าเบี่ยงเบนมาตรฐาน (standard Deviation; SD) ในการ
สรุปลักษณะของข้อมูลที่ศึกษาด้วยการวัดค่ากลางเพียงอย่างเดียวไม่เพียงพอที่จะอธิบายลักษณะของข้อมูลได้ จึงต้อง
วิเคราะห์การกระจายของข้อมูลด้วย โดยค่าเบี่ยงเบนมาตรฐานมีค่าเป็นบวกเท่านั้น และถ้าข้อมูลชุดใดที่มีค่าเบี่ยงเบน
7
มาตรฐานมาก แสดงว่าข้อมูลชุดนั้นมีการกระจายของข้อมูลมาก แต่ถ้าข้อมูลชุดใดไม่มีการกระจายเลย จะมีค่าเบี่ยงเบน
มาตรฐานเทา่ กับศนู ย์ คอื ทุกๆ คา่ ของข้อมูลมีคา่ เทา่ กนั หมด
2.2 กรณีข้อมูลกระจายเป็นเป็นแบบอื่น วิเคราะห์ค่ากลางด้วยค่ามัธยฐาน และวิเคราะห์ค่าการกระจายของ
ขอ้ มูลดว้ ย คา่ พสิ ยั ดงั น้ี
2.2.1 การวเิ คราะห์คา่ กลางดว้ ย “คา่ มัธยฐาน (median)” ซ่ึงเปน็ ค่าของข้อมูลที่อยู่ในตำแหน่งก่ึงกลางของ
ขอ้ มูลทงั้ ชุด เหมาะกับการวเิ คราะหก์ ารแนวโน้มเขา้ สูส่ ่วนกลางหรือ คา่ กลาง ในกรณีที่ข้อมูลเป็นเชิงปริมาณ แต่การแจก
แจงไมเ่ ป็นโค้งปกติ มขี น้ั ตอนวิเคราะห์ ดงั นี้
ขน้ั ท่ี 1) เรยี งขอ้ มูลจากมาก ไปหานอ้ ย หรอื จากนอ้ ยไปหามาก
ขัน้ ที่ 2) หาตำแหนง่ ก่ึงกลางของข้อมลู จากสตู ร N +1 (N คือ จำนวนของขอ้ มลู ทัง้ ชุด)
2
ตัวเลขในตำแหนง่ ที่ได้จากสูตรคือ คา่ มัธยฐาน กรณีที่จำนวนข้อมูลทงั้ ชุดเป็นเลขคู่ จะมีตำแหนง่ ตรงกึ่งกลาง 2 ตัว ให้นำ
ตัวเลข 2 ตัวนัน้ บวกกัน แลว้ หารดว้ ย 2 จงึ จะได้คา่ มธั ยฐาน ตวั อยา่ ง การหาคา่ มัธยฐานของข้อมูล ตอ่ ไปนี้
13 16 23 18 19 14 16
ขั้นที่ 1 เรียงข้อมลู จากมากไปนอ้ ย หรอื นอ้ ยไปมากก่อน ดังนี้
13 14 16 16 18 19 23
ขน้ั ที่ 2 คำนวณหาตำแหน่งกึ่งกลางของข้อมลู จากสูตร N +1 = 7 +1 = 8 = 4
2 22
คำตอบ ค่ามัธยฐานของข้อมลู ชดุ นค้ี อื 16
ตวั อย่างที่ 2 จงหาคา่ มัธยฐานของขอ้ มลู ต่อไปน้ี 19 14 16 17
13 16 23 18
ขน้ั ท่ี 1 เรยี งข้อมูลจากมากไปน้อย หรือ นอ้ ยไปมากก่อน ดังน้ี
23 19 18 17 16 16 14 13
ขน้ั ที่ 2 คำนวณหาตำแหน่งก่ึงกลางของข้อมูลจากสตู ร N +1 = 8 +1 = 9 = 4.5
2 22
ขน้ั ท่ี 3 เลอื กค่าตัวเลขในตำแหน่งท่ี 4 และ 5 มาบวกกนั แล้วหาร 2 คำตอบ คือ 17 +16 = 16.5
2
2.2.2 การวเิ คราะห์การกระจายของขอ้ มลู การสรุปลักษณะของข้อมลู ท่ีศกึ ษาด้วยการวัดคา่ กลางเพียงอย่าง
เดยี วไม่เพยี งพอท่จี ะอธบิ ายลักษณะของข้อมูลได้ จึงต้องมีการวิเคราะห์การกระจายของขอ้ มลู ดว้ ย คือ พิสยั ดังนี้
2.2.2.1 พิสัย (range) ที่ได้จากการนำค่าสูงสุดลบด้วยค่าต่ำสุด เป็นการวิเคราะห์เพื่อแสดงความ
แตกต่างระหวา่ งคา่ ของข้อมูลสูงสดุ กบั ค่าข้อมูลต่ำสุด เหมาะสำหรับวัดการกระจายของข้อมูลอย่างหยาบ มีขอ้ สังเกต คือ
8
ค่าพิสัยคำนวณจากตัวเลข 2 ตัว ดังนั้นถ้าข้อมูลที่รวบรวมได้มีค่ามากหรือน้อยกว่าปกติ การวิเคราะห์การกระจายด้วยพิสัยจะมี
ความผิดพลาดมาก และพสิ ยั ไมบ่ อกลกั ษณะของการกระจายของข้อมูลจึงควรใชเ้ ม่ือตอ้ งการความรวดเรว็ เทา่ นนั้
2.2.2.2 พิสยั ของควอไทล์ (interquartile range: IQR) คือ ผลตา่ งระหว่างค่า ควอไทล์ท่ี 3 (Q3) และ
ควอไทล์ท่ี 1 (Q1) การใช้ IQR เปน็ การวิเคราะห์การกระจายของขอ้ มูล มขี นั้ การคำนวณ ดงั นี้
ขัน้ ที่ 1 นำข้อมลู ทง้ั หมดมาเรียงจากมากไปหาน้อย หรอื น้อยไปหามาก
ขน้ั ท่ี 2 แบ่งข้อมูลออกเป็น 4 ส่วนเทา่ ๆ กนั หรอื ใชเ้ ปอรเ์ ซ็นไทล์ในการแบ่ง จากข้อมูลทั้งหมดคดิ เป็น 100
% ตำแหน่งสดุ ท้ายของข้อมูลในส่วนแรกคือ เปอรเ์ ซน็ ไทล์ที่ 25 หรอื ควอไทลท์ ่ี 1 และ ตำแหน่งสดุ ท้ายของข้อมูลในส่วน
ท่ี 3 คอื เปอร์เซ็นไทลท์ ี่ 75 หรอื ควอไทล์ที่ 3 (ตำแหนง่ สุดทา้ ยของข้อมลู ในส่วนท่ี 2 คือ เปอรเ์ ซ็นไทล์ที่ 50 หรือ ควอ
ไทล์ที่ 2 (Q2) ก็คอื คา่ มัธยฐาน น่ันเอง)
การเลอื กสถิตพิ รรณนาเพื่ออธิบายหรอื สรปุ ข้อมลู เพ่ือแสดงการกระจายของข้อมลู หรอื การกระจายไปตามปัจจัยของการเกิดโรค
หรอื ปัญหาสุขภาพท่ีสนใจ ตอ้ งเลือกสถติ ใิ ห้เหมาะสมกบั ประเภทหรอื ระดับของข้อมลู โดยข้อมูลเชิงกลมุ่ จะใชส้ ถิตความถแี่ ละร้อย
ละ ขณะท่ีข้อมูลเชิงปริมาณต้องพจิ ารณาการแจกแจงข้อมูลว่าเป็นโค้งปกติหรือไม่ ถ้าเปน็ โค้งปกติจะใชค้ ่าเฉลย่ี และคา่ เบย่ี งเบน
มาตรฐาน และเมื่อข้อมูลแจงแจงแบบไม่เปน็ โค้งปกติจะใชค้ ่ามัธยฐานและค่าพสิ ัย ดังแผนภาพท่ี 2
แผนภาพที่ 2 สถติ พิ รรณนาทีเ่ หมาะสมกับประเภทหรอื ระดบั ข้อมูล
9
บทท่ี 3
หลกั การการจดั กระทำกับข้อมลู ในการศกึ ษาวิจยั ด้วยสถิติอนมุ าน
สถิติอนุมาน (inferential statistics) หรือสถิติเพื่อทดสอบสมมติฐาน (hypothesis testing statistics) เป็นสถิติ
ท่ีใชเ้ พอื่ การวิเคราะห์เพ่ือมุ่งหาความเกย่ี วข้อง (association or relation) ระหวา่ งปัจจยั หรือตวั แปร ซึง่ มีทั้งการทดสอบ
ความเกี่ยวขอ้ งระหวา่ ง 2 ตัวแปร (bivariate) และความเกย่ี วขอ้ งแบบหลายตวั แปร (multivariate)
ประเภทและหลกั การการเลือกใชส้ ถติ ิอนุมาน
สถิติอนุมานหรือสถติ ิเพื่อทดสอบสมมติฐาน ซึ่งมีหลายประเภทข้ึนอยูก่ ับลกั ษณะของการแบ่ง เช่น แบ่งตามการแจก
แจงขอ้ มูลหรอื แบง่ ตามจำนวนตัวแปรทศ่ี ึกษา ดงั นี้
1. แบง่ ตามการแจกแจงข้อมูล normal distribution ไดแ้ ก่
1.1 Parametric statistics ใช้ในกรณี ข้อมูลแจกแจงเปน็ normal distribution
1.2 Non - parametric statisticsใช้ในกรณี ขอ้ มูลมีการแจกแจงแบบอื่น
2. แบง่ ตามจำนวนตัวแปรที่ศึกษา (ทดสอบแตล่ ะสมมติฐาน ไม่ใช่ จำนวนตวั แปรทง้ั หมดท่ศี ึกษา) ไดแ้ ก่
2.1 Bivariate เปน็ การวเิ คราะหค์ วามเก่ียวข้องระหวา่ งปจั จยั 2 ตวั
2.2 Multivariate เปน็ การวเิ คราะห์ความเกย่ี วข้องระหวา่ งปจั จัย 3 ตัวข้ึนไป
ในที่นี้จะกล่าวถึงการแบ่งเป็น bivariate ซึ่งมีทั้ง parametric statistics และ non - parametric Statistics
(สำหรบั สถิติอนุมานแบบ multivariate จะใช้หลกั การของ regression ซง่ึ ในบทน้ีเปน็ การสรุปหลักการและสาระสำคัญ
เท่านั้น)
หลักการการเลือกใช้สถติ ิอนุมาน
ในที่นี้จะอธิบายหลักการเลือกใช้เฉพาะสถิติอนุมานประเภท Bivariate เท่านั้น โดยท่ีสถิติอนุมานประเภท
Bivariate เป็นการหาความเกี่ยวข้องระหว่างตัวแปร 2 ตัว (ในแต่ละสมมติฐาน) โดยที่ไม่สนใจตัวแปรอื่น ๆ
(confounder) ถึงแม้ว่าตวั แปรเหลา่ น้นั จะมคี วามเกีย่ วข้องกับตัวแปรหลักทเี่ ราสนใจศึกษา การพิจารณาการเลือกใช้สถิติ
อนุมานให้ถูกต้องเหมาะสมให้พิจารณา “ตัวแปรตาม (dependent) หรือ ตัวแปรผลลัพธ์ (outcome)” เป็นอันดับแรก
ว่าเป็นข้อมูลเชิงกลุ่มหรือเชิงปริมาณ และจึงพิจารณา “ตัวแปรสาเหตุ (exposure หรือ ตัวแปรต้นหรือตัวแปรอิสระ
(independent)” ต่อไปว่าเป็นขอ้ มลู เชงิ กลุ่มหรอื เชงิ ปริมาณ ดังน้ี
1. หลกั การเลอื กใชส้ ถติ ิอนมุ านโดยพิจารณาประเภทหรอื ระดับการวดั ข้อมูลของตัวแปร มหี ลักการเลอื กใช้ ดังนี้
1.1 ตัวแปรตามเปน็ ขอ้ มลู เชิงกลุ่ม ใหพ้ ิจารณาตัวแปรอิสระวา่ เป็นตัวแปรเชงิ กลุม่ หรอื เชิงปริมาณ ซ่ึงสถิติที่
ใช้จะเป็นสถติ ิกล่มุ non-parametric ดงั ต่อไปน้ี
1) ตวั แปรอสิ ระเป็นข้อมลู เชงิ กลุม่ และมจี ำนวนกลุม่ ย่อย 2 กลุม่ หรอื มากกว่า 2 กลุ่ม ดงั นี้
1.1) ตวั แปรอิสระเปน็ ขอ้ มลู เชงิ กลมุ่ 2 กล่มุ ย่อย สถิตทิ ่ีเลือกใช้ไดแ้ ก่ Pearson Chi-square,
Fisher exact test, Connutity Chi-square, Odds ratio, Relative risk, Binary Logistic regression เปน็ ต้น
10
1.2) ตวั แปรต้นเป็นข้อมูลเชงิ กล่มุ ตัง้ แต่ 3 กลมุ่ ย่อยขึน้ ไป สถติ ิที่เลอื กใช้ ไดแ้ ก่ Pearson Chi-square,
Likelihood ratio, Binary Logistic regression เป็นตน้
2) ตวั แปรอสิ ระเปน็ ข้อมลู เชิงปริมาณ สถิตทิ ่เี ลือกใช้ Binary Logistic regression ซงึ่ ใชก้ บั ตวั แปรตาม
เชิงกลมุ่ 2 กลุม่ ย่อยเทา่ นัน้ (สามารถปรับตัวแปรตน้ ให้เป็นเชงิ กลุม่ และเลือกใช้สถิติไดต้ าม 1.1)
1.2 ตัวแปรตามเป็นข้อมลู เชิงปริมาณ ใหพ้ ิจารณาตวั แปรอิสระวา่ เป็นข้อมูลเชงิ กล่มุ หรือเชิงปริมาณ ดงั น้ี
1) ตวั แปรอิสระเปน็ ข้อมลู เชิงกลมุ่ และมีจำนวนกลมุ่ ย่อย 2 กลมุ่ หรอื มากกว่า 2 กลุ่ม ดงั น้ี
1.1) ตวั แปรอสิ ระเปน็ เชงิ กลุ่ม 2 กลุม่ ยอ่ ย สถิตทิ เี่ ลอื กใช้ ได้แก่
- Parametric statistics ได้แก่ t-test, Z-test, One Way Analysis of Variance, Linear regression
- Non-parametric statistics ได้แก่ Mann Whitney U test
1.2) ตัวแปรอิสระเปน็ ขอ้ มลู เชงิ กล่มุ ตงั้ แต่ 3 กลมุ่ ยอ่ ยขึ้นไป สถิตทิ ีเ่ ลือกใช้ ไดแ้ ก่
- Parametric statistics ได้แก่ One Way Analysis of Variance, Linear regression, t-test,
One Way Analysis of Variance, Linear regression
- Non-parametric statistics ไดแ้ ก่ Kruskal Wallis Test
2) ตวั แปรอสิ ระเปน็ ข้อมลู เชงิ ปริมาณ สถติ ทิ เี่ ลอื กใช้ Pearson Product Moment (ถา้ ข้อมูลไมเ่ ปน็ โค้ง
ปกตแิ นะนำให้ปรบั ข้อมลู ใหเ้ ป็นเชงิ กลมุ่ แลว้ เลอื กใช้สถติ ิเมื่อตัวแปรอิสระเปน็ ข้อมลู เชงิ กลุ่ม)
ตารางที่ 1 สถติ ิอนุมานกับประเภทของข้อมูล
11
หมายเหตุ
1. One Way Analysis of Variance สามารถใช้วิเคราะห์การเปรียบเทียบค่าเฉลี่ยตั้งแต่ 2 กลุ่มขึ้นไป ซึ่งค่าสถิติท่ี
วิเคราะห์ได้คือค่า F และพจิ ารณานยั สำคัญทางสถิติแบบ F distribution โดยทคี่ ่า F= t2 ซึ่งค่าสถติ ิ t ได้จากการวเิ คราะห์
สถิติ t -test ทพี่ จิ ารณานยั สำคญั ทางสถิติแบบ t distribution
2. Linear regression ในกรณที ี่ตวั แปรเชิงกลุ่มทมี่ ีจำนวนกลุม่ ย่อยมากกวา่ 2 กลุ่มยอ่ ย ตอ้ งแปลงขอ้ มูลให้มีลักษณะ
เปน็ แปรดัมม่ี (dummy variable)
12
บทท่ี 4
ประเดน็ สำคญั ท่เี ก่ยี วข้องกบั สถิตอิ นมุ าน
ปัจจัยหรือตัวแปร สมมติฐานการวิจัยและสถิติ ค่านัยสำคัญทางสถิติ และความคลาดเคลื่อน เป็นประเด็นสำคัญทีเ่ กี่ยวข้อง
กบั สถติ ิอนมุ านทต่ี ้องทำความเขา้ ใจเพือ่ ชว่ ยในการลือกใชส้ ถิติอา้ งองิ และการแปลผลการวเิ คราะห์ไดถ้ ูกต้อง โดยมีรายละเอียดดังน้ี
1. ปจั จยั หรอื ตัวแปร (factor or variables) หมายถงึ ส่ิงท่ีผูว้ ิจยั สนใจจะศึกษาและเปล่ียนแปลงได้หรือมีความแตกต่างกันในแต่
ละบคุ คล แบง่ เป็น 3 ประเภทดงั ตอ่ ไปนี้
1.1 ปัจจยั หรอื ตัวแปรตาม หรือตวั แปรผลลัพธ์ (dependent or outcome variable) เปน็ ตวั แปรหรือสิ่งท่ีผู้วิจัยจะศึกษา
หลัก ของการศึกษาวิจยั ครัง้ น้ันอาจจะเรียกได้หลายอย่าง ได้แก่ ตัวแปรผลลัพธ์ (outcome) หรือ ตัวแปรผล (effect) หรือ การเป็น
โรค/ไม่เป็นโรค (disease) เป็นปัจจัยที่ถูกตั้งคำถามถึงการกระจาย (distribution) ว่าปัจจัยนี้มีลักษณะอย่างไร มีความชุกหรือ
อบุ ัติการณ์เท่าใด รวมทั้งคน้ หาว่ามีปจั จัยใดท่ีเก่ียวข้องหรือสัมพนั ธห์ รือสง่ ผลหรือมีอทิ ธิพลหรือทำนายการเปลี่ยนแปลงของปัจจัย
น้ีได้ (Polit & Beck. (2014:42)
1.2 ปัจจยั หรอื ตวั แปรตน้ หรือตวั แปรอิสระหรือปัจจัยทเ่ี ป็นสาเหตุ (independent variable or exposure or cause) เป็น
ปัจจัยหรือตัวแปรที่กระตุ้นหรือส่งผลหรือมีอิทธิพลหรือทำนายการเปลี่ยนแปลงของตัวแปรตาม กรณีการศึกษาวิจัยเชิงทดลองตัว
แปรอิสระ คอื intervention ทีใ่ ช้ในการทดลอง
1.3 ปัจจัยหรือตัวแปรเกินหรือตัวแปรรบวน (third variables or confounder) เป็นปัจจัยที่รบกวนความสัมพันธ์ระหว่าง
ปัจจัยสาเหตกุ บั ผลลัพธห์ รือตวั แปรตาม อาจทำให้ลกั ษณะความสัมพนั ธ์มีความคลาดเคลื่อนไปจากความเป็นจริงได้ ควรมีการกำจัด
หรอื ควบคุมอิทธพิ ลของตวั แปรตัวนโ้ี ดยการออกแบบการวจิ ยั หรอื การใช้สถิติเพอ่ื ขจัดอิทธพิ ลของตัวแปรเกิน
หมายเหตุ เปรียบเทียบตวั แปรตามกบั ตวั แปรอิสระ
2. สมมติฐาน (hypothesis) เป็นผลลัพธ์ของการศึกษาที่คาดว่าจะเกิดขึ้นก่อนการเก็บข้อมูล โดยทั่วไปเป็นข้อความ
หรือสัญลักษณ์ท่ีแสดงความเกี่ยวข้อง (association) ระหว่างตัวแปร 2 ตัวขึ้นไป โดยถ้าแสดงเป็นข้อความเรียกว่า
สมมติฐานการวิจัย (research hypothesis) และถ้าเป็นสัญลักษณ์ทางคณิตศาสตร์จะเรียกว่า สมมติฐานทางสถิติ
(statistical hypothesis) ดงั ตัวอย่าง
13
ตัวอยา่ งท่ี 1 การศกึ ษาเชงิ ทดลองเพอ่ื ทดสอบวิธีการสอน 2 วิธี (การสอนรายบุคคล และการสอนเป็นกลุ่ม) ให้ผู้ป่วย
โรคไมต่ ดิ เชอ้ื มคี ะแนนพฤติกรรมการออกกำลงั กายอยา่ งสมำ่ เสมอ
ตวั แปรตาม คือ คะแนนพฤตกิ รรมการออกกำลังกาย และ ตัวแปรสาเหตุ คือ วิธีการสอน 2 วิธี
สมมติฐานการวจิ ยั คือ “วิธีการสอน 2 วิธี มผี ลตอ่ คะแนนพฤติกรรมการออกกำลังกายตา่ งกัน”
หมายเหตุ
สมมตฐิ านการวจิ ยั สามารถแบง่ เปน็ ชนดิ ต่าง ๆ ไดด้ งั น้ี
1. สมมติฐานทีแ่ สดงความเก่ยี วขอ้ งระหว่าง ตวั แปรตามและตัวแปรสาเหตุอยา่ งละ 1 ตวั แปร
2. สมมตฐิ านทีแ่ สดงความเกย่ี วขอ้ งระหวา่ งตวั แปรมากกวา่ 2 ตวั แปรขนึ้ ไป เขยี นขอ้ ความแสดงความสัมพนั ธไ์ ดห้ ลายลกั ษณะ เชน่
- สมมติฐานที่มีตัวแปรสาเหตุมากกว่า 1 ตัวแปร และตัวแปรตาม 1 ตัวแปร เช่น ลักษณะส่วนบุคคลได้แก่ เพศ อายุ ระดับ
การศึกษา การสูบบุหรี่ ภาวะอ้วนลงพุง ไขมันในเลือด มีความสัมพันธก์ ับคะแนนความเสี่ยงต่อการเกิดโรคหัวใจและหลอดเลือด โดยท่ี
ตัวแปรอิสระได้แก่ เพศ อายุ ระดับการศึกษา การสูบบุหรี่ ภาวะอ้วนลงพุง ไขมันในเลือดและตัวแปรตาม คือ ความเสี่ยงต่อการเกิด
โรคหวั ใจและหลอดเลอื ด
- สมมติฐานท่มี ตี วั แปรสาเหตุ 1 ตวั แปรและตวั แปรตามตงั้ แต่ 2 ตวั แปรขึน้ ไป เช่น สตรตี ั้งครรภค์ รัง้ แรกที่ได้รับการสอนให้เล้ียง
บุตรด้วยนมตนเองจะประสบความสำเร็จในการเล้ียงบุตรด้วยนมตนเองและมีความวิตกกังวลนอ้ ยกว่าสตรีท่ีไม่ได้รับการสอน โดยที่ตัว
แปรอสิ ระ คอื การสอนใหเ้ ล้ียงบุตรด้วยนมตนเอง และตัวแปรตาม 2 ตวั แปร ไดแ้ ก่ ความสำเรจ็ ในการเลย้ี งบุตรดว้ ยนมตนเองและการ
ลดความวติ กกังวล
สำหรับสมมติฐานทางสถิติ จะใช้สัญลักษณ์เพื่อระบุความเกี่ยวข้องระหว่างตัวแปรตามและตัวแปรสาเหตุที่แปลงมา
จากสมมติฐานการวจิ ยั มี 2 ประเภท ดังนี้
1) สมมตฐิ านกลาง (Null hypotheses) เปน็ ขอ้ ความท่ีแสดงถึงความไม่เกีย่ วข้องระหวา่ งตวั แปรตามและตัวแปร
สาเหตุ ใช้สัญลกั ษณ์ คอื H0 จะแสดงถึงความไม่ตา่ งกันหรอื ไมส่ มั พนั ธ์กนั ระหวา่ งตวั แปร
2) สมมติฐานทางเลอื ก (Alternative hypothesis) สญั ลักษณ์ คือ H1 หรือ HA โดยทัว่ ไปจะเป็นสมมตฐิ านท่ีคาด
วา่ จะเกิดขึน้ และมลี ักษณะตรงขา้ มกบั สมมติฐานกลาง
ตวั อย่างการเขยี นสมมตฐิ านทางสถิติ สมมตฐิ านทางสถิติ
สมมติฐานการวิจยั H0: µ1 = µ2
คะแนนเฉลี่ยพฤตกิ รรมสง่ เสริมสุขภาพของของเพศหญิง H1: µ1 µ2 หรือ µ1 > µ2 หรือ µ1 < µ2
และชายตา่ งกนั H0: P1 = P2
สดั สว่ นความคิดเหน็ ทีเ่ ห็นด้วยกับการทำแท้งเสรีของ H1: P1 P2 หรอื P1 > P2 หรือ P1 < P2
เพศชายและหญิงต่างกัน
14
3. ค่านัยสำคัญทางสถิติและความคลาดเคลื่อน ในผลการทดสอบสมมติฐานทางสถิติจะมีผลการตัดสินใจ 2 ลักษณะ
คือ 1) ยอมรับ (accept) สมมติฐานทางเลือก เป็นผลการทดสอบที่มีนัยสำคัญทางสถิติ (significant) และ 2) ไม่ยอมรับ
(reject) สมมตฐิ านทางเลอื ก เปน็ ผลจากการทดสอบทไี่ ม่มนี ยั สำคญั ทางสถิติ (non-significant) ดังตัวอยา่ ง
ตวั อยา่ ง
สมมตฐิ านการวจิ ัย : คะแนนเฉลีย่ พฤติกรรมส่งเสรมิ สุขภาพของของเพศหญิงและชายตา่ งกนั
สมมตฐิ านทางสถิติ : H0 : µ1 = µ2 , H1 : µ1 µ2
เมอ่ื µ1 = คะแนนเฉลี่ยพฤตกิ รรมส่งเสรมิ สุขภาพของของเพศหญิง
µ2 = คะแนนเฉลยี่ พฤติกรรมส่งเสรมิ สขุ ภาพของของเพศชาย
ถ้าจากการทดสอบปรากฏว่าปฏเิ สธสมมติฐานวา่ ง (H0 : µ1 = µ2 ) หรือ ยอมรบั สมมติฐานทางเลอื ก
(H1 : µ1 µ2 ) แสดงว่าสนบั สนุนสมมตฐิ านการวิจัยทว่ี ่า คะแนนเฉล่ยี พฤติกรรมสง่ เสริมสขุ ภาพของ
ของเพศหญิงและชายตา่ งกัน
การทดสอบสมมติฐานเป็นการตัดสินใจยอมรับหรือปฏิเสธสมมติฐาน อาจเกิดความผิดพลาดหรือความคลาดเคลื่อน
(Error) ในการตดั สนิ ใจได้ ซง่ึ ความคลาดเคลื่อนแบง่ เป็น 2 ลกั ษณะคือ
1) ความคลาดเคลื่อนชนิดที่ 1 (type I error) แทนด้วยสัญลักษณ์ α (alpha) เป็นความคลาดเคลื่อนที่ยอมรับ
ได้ หมายถงึ อาจเกดิ ผลลัพธ์ที่ไม่สอดคล้องกับสมมตฐิ านทางเลือกได้น้อยกว่าร้อยละ 5 (α <0.05) โดยท่ีมากกว่าร้อยละ
95 (>1- α) สอดคล้องกับสมมติฐานทางเลือก
2) ความคลาดเคล่ือนชนิดท่ี 2 (type II error) แทนด้วยสญั ลักษณ์ β (beta) เป็นความคลาดเคล่ือนท่ีเกิดข้ึนได้
ในการทดสอบสมมตฐิ านทางสถติ ิ ทเ่ี ปน็ ไปได้ที่จะเกิดผลลัพธ์ท่ีสอดคล้องกับสมมติฐานกลาง โดยท่สี มมติฐานกลางนั้นไม่
เปน็ จริง โดยทัว่ ไปจะยอมรับความคลาดเคล่อื นนไ้ี ดท้ น่ี อ้ ยกว่ารอ้ ยละ 20
ในการปฏิเสธสมมตฐิ านกลาง หรอื พบความน่าจะเปน็ ในการเกิดความคลาดเคล่ือนประเภทท่ี 1 จะมีการกำหนด
“ระดับที่ยอมรับได้ของการเกิดความคลาดเคลื่อน” หรือเรียกว่าการกำหนด “ระดับนัยสำคัญ” (level of significance
or α) หมายความว่า ถ้าดำเนินการวิจัยหรือเก็บข้อมูลแบบเดิมและทดสอบสมมติฐานซ้ำ ๆ กัน 100 ครั้ง โอกาสของ
ความน่าจะเป็นที่จะไม่เกิดผลลัพธ์ของการวิจัยท่ีสอดคล้องกันน้อยกว่า 5 ครั้ง ใน 100 ครั้ง แสดงว่าจะเกิดผลลัพธ์ท่ี
สอดคล้องกันมากกว่า 95 ครั้ง (อาจมีการกำหนดเกณฑ์ยอมรับความคลาดเคล่ือนน้อย ๆ ได้ เช่น กำหนดให้ α = 0.01
ซึ่งจะเกดิ ในการวิจยั เปรียบเทยี บประสิทธิภาพของยาใหมแ่ ละยาเกา่ เปน็ ต้น
15
บทที่ 5
สถติ ิอนมุ านกลมุ่ Non – parametric
สถิติเพื่อทดสอบสมมติฐานหรอื สถติ ิอนุมานกลุ่ม non – parametric ใช้เมื่อข้อมูลมีการแจกแจงไม่เป็นโค้งปกติ
(non-normal distribution) และใช้กนั อยา่ งกว้างขวาง เมอ่ื ข้อมูลทไี่ ด้มาไม่เปน็ ไปตามข้อตกลงเบ้ืองตน้ ของสถิตปิ ระเภท
Parametric ไดแ้ ก่
1. สถิตทิ ใ่ี ชเ้ มอื่ ตวั แปรตามและตัวแปรอสิ ระเป็นขอ้ มลู เชงิ กลุ่ม ดงั นี้
1.1 ตัวแปรตามและตัวแปรอิสระเป็นข้อมูลเชิงกลุ่มและมี 2 กลุ่มย่อย หลักการวิเคราะห์คือการวิเคราะห์ร้อยละ
แบบ crosstabulation ซึ่งจะเกิดเซลล์ข้อมลู ท้ังหมดเป็น 2 by 2 เท่ากับ 4 เซลล์ สถิติที่ใชไ้ ด้แก่ Pearson Chi-square,
Odds ratio, Relative risk, Binary Logistic regression ดังตัวอย่างสมมติฐาน Ha: อายุการมีเพศสัมพันธ์ครั้งแรก
สมั พนั ธ์กับการตดิ เชื้อซฟิ ลิ สิ ในเพศชาย
ตารางท่ี 2 การวิเคราะห์ความสัมพันธร์ ะหว่างชว่ งอายุของการมีเพศสมั พนั ธค์ รง้ั แรกกับการตดิ เช้ือซิฟลิ สิ ในเพศชายด้วย
สถิติ Pearson Chi-square
พฤตกิ รรมทางเพศสมั พนั ธ์ Cases Control 2 p
(n = 112) (n = 148)
ชว่ งอายุของการมเี พศสัมพนั ธ์ครง้ั แรก
- ตำ่ กวา่ 20 ปี 84 (75.0) 107 (72.3) 0.239 .625
- 20 ปี ขึ้นไป 28 (25.0) 41 (27.7)
การแปลผล ค่า p > .05 ปฏิเสธ Ha แสดงว่าอายุการมีเพศสัมพันธ์ครั้งแรกสัมพันธ์กับการติดเชื้อซิฟิลิสในเพศชาย
อย่างไม่มนี ัยสำคญั ทางสถติ ิ (2=0.239, p=.625)
การวเิ คราะห์ดว้ ยสถติ ิ Pearson Chi-square
ทมี่ า https://www.socscistatistics.com/tests/chisquare2/default2.aspx
สมมติฐาน Ha: ชว่ งอายขุ องการมเี พศสมั พนั ธค์ ร้งั แรกสัมพันธ์กบั การตดิ เช้ือซฟิ ิลสิ ในเพศชาย
16
ตารางที่ 3 การวิเคราะหค์ วามสัมพันธ์ระหว่างช่วงอายุของการมีเพศสัมพันธ์ครัง้ แรกกับการติดเชื้อซิฟิลิสในเพศชายดว้ ย
สถติ ิ Odds ratio (95%CI)
พฤติกรรมทางเพศสัมพันธ์ Cases Control OR 95%CI
(n = 112) (n = 148)
ชว่ งอายุของการมีเพศสัมพนั ธ์ครัง้ แรก
- ต่ำกวา่ 20 ปี (a) 84 (75.0) (c) 107 (72.3) 1.1906 .682 – 2.08
- 20 ปี ข้นึ ไป (b) 28 (25.0) (d) 41 (27.7)
การแปลผล ค่า มีค่า “1”อยู่ใน 95%CI ปฏิเสธ Ha แสดงว่าอายุการมีเพศสัมพันธ์ครั้งแรกสัมพันธ์กับการติดเชื้อซิฟิลิสในเพศ
ชายอย่างไม่มีนัยสำคัญทางสถิติ หรือ กลุ่มที่มีเพศสัมพันธ์ครั้งแรกเมื่ออายุน้อยกว่า 20 ปี มีโอกาสติดเชื้อซิฟิลิสมากกว่ากลุ่มที่มี
เพศสัมพันธค์ รง้ั แรกเม่อื อายุมากกว่าหรือเท่ากบั 20 ปี 1.19 เทา่ อย่างไมม่ นี ัยสำคัญทางสถติ ิ (OR=1.19, 95%CI=.625)
การวิเคราะห์ด้วยสถิติ Odds ratio, Relative risk, Binary Logistic regression
(คา่ สถิติเป็นคา่ Odds ratio and 95%CI for odds)
Subjects with positive (bad) outcome
a = ผูต้ ิดเชื้อซฟิ ิลิสที่อายุน้อยกว่า 20 ปี = 84 ราย
c = ผู้ไมต่ ดิ เชือ้ ซิฟิลสิ ท่ีอายุน้อยกวา่ 20 ปี = 107 ราย
Subjects with negative (good) outcome
b = ผูต้ ิดเช้ือซฟิ ลิ ิสท่ีอายมุ ากกว่าหรือเท่ากบั 20 ปี = 28 ราย
d = ผูไ้ มต่ ิดเชอ้ื ซิฟิลสิ ท่ีอายมุ ากกวา่ หรอื เทา่ กับ 20 ปี = 41 ราย
ทม่ี า: https://www.medcalc.org/calc/odds_ratio.php
หมายเหตุ
การวเิ คราะห์ด้วย Odds ratio, Relative risk, Binary Logistic regression สามารถใช้วิเคราะห์เมื่อตวั แปรอสิ ระเปน็
ข้อมลู เชิงกลมุ่ 2 กลมุ่ ย่อย หรือขอ้ มูลเชิงปริมาณ
17
1.2 ตัวแปรตามและตัวแปรอิสระเป็นข้อมูลเชิงกลุ่มที่ไม่เป็นอิสระต่อกันหรือมีการวัดซ้ำ เป็นการเปรียบเทียบ
ข้อมูล 2 ชุดที่มีความสัมพันธ์กัน (2-related samples) สถิติที่ใช้คือ McNemar's test (กรณีที่เปรียบเทียบข้อมูล
มากกว่า 2 ชุด จะใช้สถิติ Friedman test) ดังตัวอย่างสมมติฐาน Ha: หลังใชอ้ าหารเสรมิ กลุ่มตัวอยา่ งมภี าวะอ้วนแตกต่าง
จากกอ่ นใชอ้ าหารเสริม
ตารางท่ี 4 การวเิ คราะหภ์ าวะอ้วนกบั การใชอ้ าหารเสริม ด้วยสถติ ิ McNemar's test
หลังใชอ้ าหารเสรมิ Total p
0.267
อ้วน ปกติ
กอ่ นใชอ้ าหารเสรมิ อ้วน 4 (50) 9 (60) 13 (56.5)
ปกติ 4 (50) 6 (40) 10 43.5)
การแปลผล พบว่า กลุ่มตัวอย่างที่ใช้อาหารเสริมทั้งหมด 23 ราย (มีทั้งคนอ้วน และปกติ) หลังใช้อาหารเสริม
นาน 3 เดือน พบว่า คนอ้วน 13 คน เมื่อใช้อาหารเสริม ยังคงอ้วนเหมือนเดิม 4 ราย เปลี่ยนเป็นปกติ 9 ราย ส่วนคน
ปกติทั้งหมด 10 คน เมื่อใช้อาหารเสริมพบว่า เปลี่ยนเป็นคนอ้วน 4 ราย ดังนั้น อาหารเสริมมีผลต่อความอ้วนอย่างไม่มี
นยั สำคญั ทางสถิติ (p=0.267)
1.3 ตัวแปรตามและตัวแปรอิสระเป็นข้อมูลเชิงกลุ่ม (จำนวนกลุ่มย่อยเท่าใดก็ได้) หลักการวิเคราะห์คือการ
วิเคราะห์ร้อยละแบบ Crosstabulation ซึ่งจะเกิดเซลล์ข้อมูลที่มากกว่า 2 by 2 สถิติท่ีใช้ได้แก่ Pearson Chi-square
และ likelihood ratio (สถิติทั้ง 2 ชนิดให้ค่าที่ใกล้เคียงกัน) ดังตัวอย่างสมมติฐาน Ha: ประเภทของโรคไม่ติดต่อเรื้อรัง
สมั พนั ธก์ ับความรอบรูท้ างสขุ ภาพ
ตารางท่ี 5 การวเิ คราะห์ความสมั พนั ธ์ระหว่างประเภทของโรคไมต่ ดิ ต่อเรอ้ื รังกบั ความรอบร้ทู างสุขภาพด้วยสถติ ิ
Pearson Chi-square
ความรอบรทู้ างสุขภาพ 2 p
High Medium Low
ประเภทของโรคไม่ติดต่อเรอ้ื รัง
DM 24(41.37) 12(20.00) 57(37.25) 30.377 <.001
HT 22(37.93) 34(56.67) 32(20.91)
DM with HT 12(20.69) 14(23.33) 64((41.83)
การแปลผล กลุม่ ตวั อย่างท่ีมโี รคไมต่ ิดต่อเรื้อรังแตกตา่ งกนั มีระดับความรอบรทู้ างสุขภาพต่างกนั (สัมพันธ์กัน) อย่าง
มนี ยั สำคญั ทางสถิติ (2 = 30.377, p<.001)
18
Pearson Chi-square > 2 X 2 tables
ตวั แปรตาม คอื ความรอบรู้ทางสขุ ภาพ ( HL: 3
กลุม่ ยอ่ ย คือ High, medium, low)
ตัวแปรอสิ ระ คือ ประเภทของโรคไม่ติดต่อเร้ือรงั
(3 กลุ่มย่อย คือ DM, HT, DM with HT)
ท่มี า : https://www.socscistatistics.com/tests/chisquare2/default2.aspx
1.4 ตัวแปรตามและตัวแปรอิสระเป็นข้อมูลเชิงกลุ่มประเภท ordinal scale หรือเป็นข้อมูลเชิงปริมาณแบบ
non-normal distribution วิเคราะห์ด้วยค่ามัธยฐานและ IQR สถิติที่ใช้ คือ Spearman rho ได้ค่าสถิติ คือ rs (แปลผล
เหมอื นกบั Pearson product moment correlation coefficient)
2. สถิตทิ ใี่ ช้เมอื่ ตวั แปรตามเป็นข้อมูลเชงิ ปรมิ าณและตัวแปรอสิ ระเปน็ ข้อมูลเชงิ กลมุ่ ดงั นี้
2.1 ตวั แปรอสิ ระว่าเป็นข้อมูลเชงิ กลมุ่ สถิตทิ ีเ่ ลือกใช้ ได้แก่ Mann-Whitney U test ใช้เมื่อตวั แปรตามเปน็ ข้อมลู
เชิงปริมาณและตัวแปรอสิ ระเป็นขอ้ มูลเชิงกลมุ่ 2 กลมุ่ ย่อยทเ่ี ป็นอสิ ระต่อกัน ดังตวั อยา่ งสมมตฐิ าน Ha: คะแนนความ
รอบรู้ทางสุขภาพของกลมุ่ A และกลุ่ม B แตกตา่ งกัน
ตารางท่ี 6 การวิเคราะหด์ ว้ ยสถิติ Mann-Whitney U test
กลมุ่ A กลุม่ B p
คะแนนความรอบรู้ทางสุขภาพ Median (min-max) 167 (154 – 178) 157 (143- 170) 0.003
การแปลผล กลมุ่ A และกลุ่ม B มคี ะแนนความรอบรูท้ างสุขภาพแตกตา่ งกันอยา่ งมีนยั สำคัญทางสถติ ิ (p=0.003)
2.2 การเปรยี บเทยี บขอ้ มลู 2 ชดุ ที่สมั พนั ธ์กนั หรือมกี ารวัดซ้ำ (Two related samples test) สถิติที่ใช้ คอื
Wilcoxon signed-rank test ดังตัวอยา่ งสมมตฐิ าน Ha: คะแนนความเข้มแข็งทางอารมณ์ก่อนและหลังเขา้ ร่วมการ
อบรมแตกตา่ งกัน
19
ตารางที่ 7 การวเิ คราะหเ์ ปรียบเทียบคะแนนความเข้มแข็งทางอารมณ์กอ่ นและหลังเข้าร่วมการอบรมดว้ ยสถติ ิ
Wilcoxon signed-rank test
Pre-test Post -test p
(n=22) (n=22)
คะแนนความเข้มแข็งทางอารมณ์ Median (IQR) 44.3 (2.25) 48.4 (2.35) 0.001
การแปลผล คะแนนความเข้มแขง็ ทางอารมณ์ก่อนและหลังเขา้ รว่ มการอบรมแตกตา่ งกันอยา่ งมนี ยั สำคญั ทาง
สถติ ิ (p=0.001)
2.3 การเปรยี บเทยี บคา่ กลางของขอ้ มลู k ประชากร ท่เี ป็นอสิ ระต่อกนั (K-Independent Sample) สถิติที่ใช้ คอื
Kruskal – wallis ดังตัวอย่างสมมติฐาน Ha: กลุม่ ตัวอยา่ งที่มีโรคประจำตัวแตกตา่ งกัน มีคะแนนคะแนนพฤติกรรมสร้าง
เสรมิ สขุ ภาพต่างกัน
ตารางที่ 8 การเปรียบเทียบคะแนนคะแนนพฤติกรรมสร้างเสริมสขุ ภาพของกลมุ่ ตวั อยา่ งทมี่ ีโรคประจำตวั แตกตา่ งกัน
ดว้ ยสถิติ Kruskal - wallis
DM (n=18) HT (n=15) DM with HT (n=22) p
คะแนนพฤติกรรมสร้างเสรมิ สุขภาพ
Median (min - max) 21 (18 - 39) 22 (18 - 42) 19 (19 – 23) 0.023
การแปลผล กลุม่ ตัวอย่างทีม่ ีโรคประจำตวั แตกต่างกัน มีคะแนนคะแนนพฤติกรรมสร้างเสริมสขุ ภาพต่างกนั อยา่ งมี
นยั สำคญั ทางสถิติ (p=0.023)
20
บทท่ี 6
สถติ ิอนมุ านกลมุ่ Parametric
จากหลักการการเลือกใช้สถิติอนุมานประเภท bivariate ที่กล่าวไว้ข้างต้นแล้ว เนื้อหาต่อไปเป็นประเด็นเกี่ยว
รายละเอียดของสถิติอนุมานกลุ่ม parametric ได้แก่ ข้อตกลงหรือเงื่อนไขของการใช้สถิติ และการนำเสนอและแปลผล
การวิเคราะห์สถติ ิอนมุ านกลุ่ม parametric ท่พี บวา่ มีการใชบ้ ่อย ๆ ดงั น้ี
1. การแจกแจงของข้อมลู โดยที่ข้อมูลที่ไดจ้ ากกลุ่มตัวอย่างที่มาจากประชากรทีม่ ีการแจกแจงแบบปกติ (normal
distribution) โดยทัว่ ไปจะเป็นการแจกแจงแบบปกติด้วย สำหรับขอ้ มลู ทางสุขภาพ พฤติกรรมหรอื การเจ็บป่วยส่วนใหญ่
ของประชากรมักมีการแจกแจงแบบไม่ปกติหรือเป็นการแจกแจงแบบอื่น (non – normal distribution) การแจกแจง
ของขอ้ มลู แบบปกตเิ ปน็ เงื่อนไขของการใช้สถิติอา้ งอิงกลุ่มพาราเมตริกทุกชนดิ ซึง่ ลักษณะของข้อมูลที่มีการแจกแจงแบบ
ปกตจิ ะมีลกั ษณะสำคญั ดังนี้
1. plot กราฟแบบฮิสโตรแกรมจะได้กราฟมีลักษณะโค้งระฆังคว่ำและ 2 ด้านเท่ากัน (Symmetric bell-
shaped curve)
2. คา่ เฉล่ีย คา่ มัธยฐาน และฐานนยิ มมีค่าเทา่ หรือใกล้เคียงกัน
3. ความโด่ง (skew) และความเบ้ (kurtosis) มีค่าเทา่ กับศนู ย์
4. พื้นที่ใต้โค้งมีค่าความน่าจะเป็น (probability) เท่ากับ 1 หรือ 100% โดยแบ่งพื้นที่ใต้โค้งเป็น ×̅1SD = .68
(68%), ×̅2SD = .95 (95%), ×̅3SD = .99 (99%) อาจกล่าวไดว้ ่ามีข้อมลู ของกลุ่มตวั อย่างทีน่ ้อยกว่า 5% ที่ไม่อยู่ภายใต้พื้นที่
ของ ×̅2SD
5. การทดสอบ normal Distribution ของข้อมูลควรทดสอบก่อนท่ีจะเลอื กใช้สถิติอนุมานกลุ่มพาราเมตริก
มวี ิธกี ารทดสอบหลายวธิ ีทนี่ ยิ มและสะดวกในการใช้ ไดแ้ ก่
1) พิจารณาค่าเบยี่ งเบนมาตรฐาน และคา่ เฉลยี่ ถ้าคา่ เบี่ยงเบนมาตรฐานมคี า่ เขา้ ใกลห้ รือมากกวา่ ค่าเฉลี่ยแสดงว่า
ขอ้ มลู มีการแจกแจงแบบอนื่ (การดคู ่าความโด่งและความเบ้ ตลอดจนการดูจากกราฟตา่ ง ๆ อาจจะดูได้ยาก)
2) การทดสอบดว้ ยสถติ ิ Shapiro-Wilk’s W test หรอื Komogorov-Smirnov D test โดยพจิ ารณาค่า
นัยสำคญั ทางสถติ ิ (p-value) ถ้าน้อยกว่า .05 แสดงวา่ ขอ้ มูลมกี ารแจกแจงแบบอืน่
2. ความสมั พันธ์เชงิ เสน้ ตรง (linearity) โดยทคี่ วามสัมพันธเ์ ชิงเสน้ ตรงของข้อมูล 2 ชุด เป็นเง่อื นไขสำคัญของการ
วิเคราะห์สถิติสหสัมพันธ์ (Pearson product moment correlation or Pearson correlation) และ Linear
regression การทดสอบความสัมพันธ์เชิงเส้นด้วยการ plot กราฟข้อมูลแบบ scatter plots หรือการใช้สถิติ Pearson
correlation ทดสอบพร้อมกับการวิเคราะห์สหสัมพันธ์ของข้อมูลได้เลย ซึ่งผลการวิเคราะห์จะแปลผลเหมือนกัน
(รายละเอยี ดอยใู่ นสถิติวิเคราะห์ Pearson correlation)
3. ความสอดคล้องกนั ของความแปรปรวนของข้อมลู (homogeneity of variance) เปน็ การทดสอบว่าข้อมลู ในแต่ละกลุ่มน้ัน
มีความแปรปรวน (Variance) สอดคล้องหรือต่างกันหรือไม่ สามารถทดสอบด้วยสถิติ F-test (Levene’s test of homogeneity of
variance) และเม่ือผลการวิเคราะห์พบวา่ แตกต่างอยา่ งไมม่ นี ยั สำคัญทางสถติ ิ (p>.05) แสดงวา่ ข้อมลู ในแต่ละกลมุ่ ย่อยน้ันมีความ
แปรปรวนทสี่ อดคลอ้ งกัน เงอื่ นไขเป็นเงือนไขของการใชส้ ถติ ิ Independent t – test และ One Way ANOVA เปน็ ตน้
21
สถิติอนุมานกลุ่ม Parametric ของการวิเคราะห์แบบ bivariate มีสถิติที่พบว่ามีการใช้บ่อย ๆ ได้แก่ t-test One - way
ANOVA และ Pearson product moment correlation coefficient มีการนำเสนอและแปลผลการวิเคราะห์ ดงั น้ี
1. สถิติ t-test ประกอบดว้ ย Independent t-test และ Dependent t-test ดังนี้
1.1 Independent t-test ใช้เมื่อตัวแปรตามเป็นข้อมูลเชิงปริมาณและตัวแปรอิสระเป็นข้อมูลเชิงกลุ่ม 2 กลุ่ม
ย่อยที่เป็นอิสระต่อกัน เป็นการเปรียบเทียบค่าเฉลี่ยของข้อมูล 2 กลุ่มย่อย ดังตัวอย่างสมมติฐาน Ha: ค่าเฉลี่ย
โคเลสเตอรอลรวมของเพศชายและเพศหญงิ แตกต่างกัน แสดงผลคา่ สถติ ิทไ่ี ด้จากการวิเคราะห์ดงั ตารางดา้ นล่าง
ตารางที่ 9 การวิเคราะห์ดว้ ย Independent t-test
Group โคเสเตอรอลรวม N t df p
Mean SD <0.001
male 215.43 7.55 69 7.9633 144
77
female 204.98 8.23
การแปลผล พิจารณาจากคา่ p < .05 จงึ ยอมรับ Ha สรุปผลวา่ คา่ เฉลีย่ โคเลสเตอรอลรวมของเพศชายและเพศ
หญงิ แตกตา่ งกันอยา่ งมีนยั สำคัญทางสถิติ หรือเพศชายมีค่าเฉลย่ี โคลเสเตอรอลรวมมากกว่าเพศหญิงอยา่ งมนี ยั สำคัญทาง
สถติ ิ หรือเพศสัมพนั ธ์กับค่าเฉลีย่ โคเลสเตอรอลรวม
1.2 Dependent t-test หรอื Paired t-test ใช้เมอ่ื ตวั แปรตามเป็นขอ้ มูลเชิงปรมิ าณและตวั แปรอิสระเปน็ ข้อมูล
เชิงกลุ่ม 2 กลุ่มย่อยที่ไม่เป็นอิสระต่อกัน (Two related samples test) เป็นการเปรียบเทียบค่าเฉลี่ยขอ้ มูล 2 ชุดท่ีการ
ได้มาของข้อมูลไม่เป็นอิสระต่อกันหรือการวัดซ้ำในกลุ่มตัวอย่างกลุ่มเดียวกัน ดังตัวอย่างสมมติฐาน Ha : ค่าเฉล่ีย
โคเลสเตอรอลรวมก่อนและหลงั เขา้ ร่วมโปรแกรมแตกต่างกัน แสดงผลคา่ สถติ ิทไี่ ด้จากการวเิ คราะหด์ งั ตารางดา้ นล่าง
ตารางที่ 10 การวิเคราะห์ด้วย Dependent t-test
โคลเสเตอรอลรวม N t df p
<0.001
Mean SD
ก่อนเข้ารว่ มโปรแกรม 279.65 11.20 90 48.834 178
90
หลังเขา้ ร่วมโปรแกรม 202.43 9.98
การแปลผล พจิ ารณาจากค่า p < .05 จึงยอมรบั Ha สรุปผลวา่ คา่ เฉลี่ยโคเลสเตอรอลรวมกอ่ นและหลงั เขา้ ร่วม
โปรแกรมแตกต่างกนั อยา่ งมีนัยสำคัญทางสถิติ หรอื คา่ เฉล่ียโคเลสเตอรอลรวมหลงั เขา้ ร่วมโปรแกรมลดลงอยา่ งมี
นัยสำคัญทางสถิติ หรือโปรแกรมสามารถทำให้คา่ เฉลยี่ โคเลสเตอรอลรวมลดลงได้
2. One - way ANOVA ใช้เมื่อตัวแปรตามเป็นข้อมูลเชิงปรมิ าณและตัวแปรอิสระเป็นข้อมูลเชิงกลุ่ม 2 กลุ่มย่อยขึ้น
ไปที่เป็นอิสระต่อกัน (K-Independent Sample) เป็นการเปรียบเทียบค่าเฉลี่ยของข้อมูล k กลุ่มกรณีที่ข้อมูลไม่เป็น
อิสระต่อกันหรือมีการวัดซ้ำ (K-Related samples) สถิติที่ใช้คือ One - way ANOVA with Repeated measures ใน
22
ที่นี้จะยกตัวอย่างเฉพาะ One - way ANOVA โดยใช้การวิเคราะห์ด้วยเครื่องมือคำนวณจาก Website:
https://www.danielsoper.com/statcalc/calculator.aspx?id=43 (Copyright © 2006 - 2021 by Dr. Daniel Soper) ดั ง
ตัวอย่างสมมติฐาน Ha : ประเภทผ้ปู ่วยท่มี โี รคประจำตัวแตกต่างกัน มโี คเลสเตอรอลรวมตา่ งกัน แสดงผลค่าสถิติที่ได้จาก
การวเิ คราะห์ดงั ตาราง 11 - 12
ตารางที่ 11 ค่าเฉลี่ย ค่าเบยี่ งเบนมาตรฐาน และจำนวนกลุ่มตวั อยา่ งของคา่ โคเลสเตอรอลรวม
ประเภทผูป้ ว่ ย โคเลสเตอรอลรวม N
Mean SD
122
เบาหวาน (G1) 178.63 7.79 127
110
ความดนั โลหติ สงู (G2) 177.74 8.11
เบาหวานร่วมกบั ความดันโลหิตสงู (G3) 212.66 9.12
ตารางท่ี 12 การวเิ คราะห์ด้วย One - way ANOVA
SS df MS F p
Between 90,775.179 2 45,387.589
Within 24,696.070 356 69.371 654.273 <0.001
Total 115,471.249 358 -
(Soper, D.S. (2021). Analysis of Variance (ANOVA) Calculator - One-Way ANOVA from Summary Data [Software].
Available from https://www.danielsoper.com/statcalc)
การแปลผล พจิ ารณาจากคา่ p < .05 จงึ ยอมรบั Ha สรปุ ผลว่า ประเภทผปู้ ว่ ยที่มโี รคประจำตัวแตกต่างกนั มโี คเลสเตอรอลรวม
ต่างกนั อย่างน้อย 1 คูอ่ ย่างมนี ยั สำคญั ทางสถิติ หรอื ค่าเฉลี่ยโคเลสเตอรอลรวมสัมพันธ์กบั ประเภทผู้ปว่ ย
3. Pearson product moment correlation coefficient และการวิเคราะห์การถดถอยเชิงเส้นตรง (linear regression) ใช้
ทดสอบความสัมพนั ธ์เชิงเสน้ ตรงระหว่างตัวแปร 2 ตัว ทีเ่ ปน็ ขอ้ มลู เชิงปรมิ าณ และมีการแจกแจงข้อมลู เป็นโค้งปกติ (กรณีที่ตัวแปร
ตามเป็นขอ้ มลู เชิงปรมิ าณ และตวั แปรตน้ เปน็ ข้อมูลเชิงกลมุ่ 2 กลมุ่ ยอ่ ย จะวเิ คราะห์ด้วย Biserial Correlation) ดงั นี้
3.1 Pearson product moment correlation coefficient ค่าสถิติที่ได้จากการวิเคราะห์จะใช้ตัวอักษร “r” ซึ่ง
ค่า “r” จะมคี า่ ระหวา่ ง -1 ถงึ +1 โดยแปลผลลัพธ์การทดสอบความสัมพนั ธด์ งั น้ี
กรณคี ่า r = 0 แปลวา่ ไมม่ คี วามสัมพันธ์เชงิ เสน้ ตรง
r > 0 แปลวา่ มีความสัมพนั ธ์ทางบวก (ทศิ ทางเดยี วกัน) หมายถึง เมือ่ คา่ ของตวั แปรใดตัวแปรหน่ึงเพิ่มข้ึนค่าของ
ตวั แปรอกี ตัวกจ็ ะเพม่ิ ขึน้ ด้วย หรือเมอ่ื คา่ ของตวั แปรใดตัวแปรหนง่ึ ลดลง ค่าของตวั แปรอีกตัวก็จะลดลงด้วย
r < 0 แปลว่ามีความสัมพันธ์ทางลบ (ทิศทางตรงกันข้าม) หมายถึง เมื่อค่าของตัวแปรใดตัวแปรหนึ่งเพิ่มขึ้นค่า
ของตัวแปรอกี ตัวกจ็ ะลดลง หรือเมอื่ ค่าของตัวแปรใดตัวแปรหนึง่ ลดลง ค่าของตัวแปรอกี ตัวก็จะเพิม่ ขน้ึ
23
r=0.736 p<0.001 r=-0.022 p=0.856 r=-0.935 p <0.001
r>0 r=0 (ใกลเ้ คียง 0) r<0
ตวั อยา่ งการทดสอบดว้ ย Pearson product moment correlation coefficient
สมมติฐานข้อที่ 1. การรับรู้อุปสรรคต่อการมีพฤติกรรมป้องกันโรคหลอดเลือดหัวใจกับพฤติกรรมป้องกันโรคหลอด
เลอื ดหวั ใจกับพฤตกิ รรมป้องกนั โรคหลอดเลอื ดหวั ใจมีความสัมพนั ธ์ทางลบ สมมตฐิ านทางสถิติ คือ r < 0
สมมติฐานข้อที่ 2. การรับรู้ความสามารถของตนเองต่อการมีพฤติกรรมป้องกันโรคหลอดเลือดหัวใจกับพฤติกรรมป้องกันโรค
หลอดเลือดหวั ใจกับพฤตกิ รรมป้องกนั โรคหลอดเลอื ดหัวใจมคี วามสมั พันธท์ างบวก สมมติฐานทางสถิติ คอื r > 0
ตารางที่ 13 ค่าสัมประสิทธ์สหสัมพันธ์ (r)และค่านัยสำคญั ทางสถติ ิ (p) แสดงความสัมพันธ์ระหว่าง การรับรู้อุปสรรคตอ่
การมีพฤติกรรมป้องกันโรคหลอดเลือดหัวใจและการรับรู้ความสามารถของตนเองต่อการมีพฤติกรรมป้องกันโรคหลอด
เลอื ดหัวใจกบั พฤตกิ รรมปอ้ งกันโรคหลอดเลือดหวั ใจ (n=92)
พฤตกิ รรมป้องกนั
ปจั จยั โรคหลอดเลอื ดหัวใจ
rp
1. การรบั รู้อุปสรรคต่อการมีพฤติกรรมปอ้ งกนั โรคหลอดเลือดหวั ใจ -0.568 <0.001
2. การรับรคู้ วามสามารถของตนเองต่อการมพี ฤติกรรมป้องกันโรคหลอดเลอื ดหัวใจ 0.562 <0.001
การแปลผล จากตารางผลการวเิ คราะห์ค่าสมั ประสิทธ์ิสหสมั พันธ์พบวา่ การรับรอู้ ปุ สรรคต่อการมพี ฤติกรรมป้องกันโรคหลอด
เลอื ดหวั ใจมคี วามสมั พนั ธ์ทางลบกบั พฤตกิ รรมป้องกนั โรคหลอดเลอื ดหวั ใจอยา่ งมนี ัยสำคญั ทางสถิติ (r= -.569, p<.001) การรับรู้
ความสามารถของตนเองต่อการมพี ฤติกรรมป้องกันโรคหลอดเลือดหัวใจมีความสัมพันธท์ างบวกกับพฤติกรรมป้องกนั โรคหลอดเลอื ด
หวั ใจอยา่ งมีนยั สำคัญทางสถิติ (r=.562, p<.001)
3.2 การถดถอยเชงิ เสน้ ตรง (linear regression) เป็นเทคนคิ ที่ใช้วเิ คราะห์ความสมั พนั ธ์ และทำนายหรือพยากรณ์อิทธิพลของ
ตัวแปรอิสระ ที่มีผลต่อตัวแปรตาม แบ่งเป็น linear regression และ logistic regression ในบทนี้จะกล่าวถึงเฉพาะ การวิเคราะห์
การถดถอยเชิงเส้นอย่างง่าย (simple linear regression) ใช้วิเคราะห์ตัวแปรเชิงปริมาณ 2 ตัวแปร เพื่อทำนายหรือ
พยากรณ์ ค่าของตวั แปรตามจากตัวแปรอสิ ระ ในการใช้ simple linear regression จะมีเงอื่ นไขท่วั ไป ไดแ้ ก่
1) ตัวแปรตาม (Y) และ ตวั แปรอิสระ (X) ต้องเปน็ ตัวแปรเชงิ ปรมิ าณ อย่างละ 1 ตวั (ตัวแปรอิสระเป็นขอ้ มูลเชงิ
กลมุ่ ชนิด dichotomous ได้ กรณีมากกว่า 2 กลุ่มยอ่ ยต้องทำ dummy variable ก่อน)
2) ขอ้ มูลมีการกระจายเป็นโค้งปกติ ซ่งึ มีความสัมพันธก์ ันเชิงเส้นทไี่ ดจ้ ากสมการเส้นตรง คอื
Y = + X + e (ประชากร) หรือ Y = a + bX (กลมุ่ ตัวอยา่ ง) โดยท่ี
a, = ส่วนตดั แกน y
b, = เม่อื ตวั แปร X1 เพ่มิ ขนึ้ 1 หน่วย จะทำให้ Y เปลี่ยนไป
24
ตวั อยา่ ง
Pearson Correlation (r) พฤติกรรมสขุ ภาพ พฤติกรรมสขุ ภาพ การรับรสู้ มรรถนะแหง่ ตน
Sig. (1-tailed) การรับรสู้ มรรถนะแหง่ ตน 1.000 .562
N พฤตกิ รรมสุขภาพ .562 1.000
การรับรสู้ มรรถนะแหง่ ตน . .000
พฤติกรรมสขุ ภาพ .000 .
การรับรสู้ มรรถนะแห่งตน 92 92
92 92
R R2 Adjusted R2 Std. Error of the Estimate
.562a .316 .309 .26534
Unstandardized Standardized t Sig.
Coefficients Coefficients
B Std. Error Beta
(Constant) 1.773 .183 - 9.695 <0.001
การรบั รสู้ มรรถนะแห่งตน
.362 .056 .562 6.453 <0.001
การแปลผล พฤตกิ รรมสุขภาพสัมพันธ์ทางบวกกับการรับรสู้ มรรถนะแหง่ ตนอยา่ งมีนยั สำคัญทางสถิติ (r=0.562,
p<0,001) และการรับรู้สมรรถนะแห่งตนสามารถอธิบายการเปลี่ยนแปลงพฤติกรรมสุขภาพได้ร้อยละ 30.9 (Adjusted
R2 =0.309) หรอื สรุปไดว้ า่ พฤติกรรมสุขภาพของบคุ คลจะดหี รือไม่ดีข้ึนอยู่กบั อิทธิพลของปัจจัยการรบั รสู้ มรรถนะแห่งตน
ประมาณร้อยละ 30 ทีเ่ หลอื เป็นอิทธพิ ลของปจั จยั อื่น ๆ
หมายเหตุ
สถิตอิ นุมานกล่มุ Non – parametric มีวิธกี ารกำหนดสมมติฐาน และการแปลผลเหมือนกับ สถิตอิ นุมานกลุ่ม Non – parametric
ดังตาราง การเปรียบเทียบการทดสอบสมมติฐานโดยใชส้ ถติ ิ Parametric และ Nonparametric
ตาราง การเปรยี บเทียบการทดสอบสมมติฐานโดยใชส้ ถิติ Parametric และ Nonparametric
Non - parametric Parametric
- Mann-Whitney U test Independent t-test
- Kruskal - wallis One - way ANOVA
- Wilcoxon signed - rank test Dependent t-test
- Friedman test One - way ANOVA with Repeated measures
- Spearman rank order Pearson product moment correlation coefficient
25
การทดสอบสมมตฐิ านด้วยการวิเคราะหแ์ บบ Multivariate เปน็ การหาความเกยี่ วข้องระหวา่ งตวั แปร 3 ตวั ขนึ้ ไป
มวี ตั ถุประสงค์ในการใช้ ดังน้ี
1) เพื่อควบคุมอิทธิพลของตัวแปรเกิน ทสี่ ง่ ผลตอ่ ตวั แปรศกึ ษา
2) เพื่อวิเคราะห์ความเก่ียวขอ้ งหรือการทำนายหรอื อิทธิพล (เฉพาะ) ของตัวแปรนน้ั โดยการใชส้ ถติ ิควบคุม
อิทธพิ ลตวั แปรอ่ืน ๆ ไว้
3) เพื่อสร้างสมการพยากรณ์ หรอื สมการทำนาย การเกดิ outcome
4) เพ่ือวเิ คราะห์ขนาดของอทิ ธพิ ลของชุดตัวแปรทำนาย (model) วา่ ส่งผลตอ่ การเกิดตัวแปรตามหรอื ไม่
การเลือกใช้สถิติ multivariate analysis ตามลักษณะของ 3rd variable ดงั น้ี
1. Mantel – Haenszel และ ANCOVA ใช้เมื่อ 3rd variable สัมพนั ธ์กบั ตวั แปร Y และ ตวั แปร X เรียกวา่
Confounding Variable: Confounder
2. Mantel - Haenszel, ANCOVA และ Multiple Linear or Logistic Regression ใชเ้ มื่อ 3rd variable
สัมพันธ์กบั ตัวแปร Y ไม่สัมพันธก์ บั ตัวแปร X หรือ
3. Two-way ANOVA, Two-way ANCOVA ใช้เม่อื 3rd variable ร่วมกบั ตัวแปร X จงึ สัมพนั ธ์กับตวั แปร Y
เรยี กว่า Interaction Effect: Effect Modifier เปน็ ตัวแปรท่ีมปี ฏสิ มั พันธก์ บั ตวั แปรอสิ ระแลว้ ทำใหต้ ัวแปรตาม
เปลีย่ นไป แตเ่ ป็นตวั แปรที่ไม่มีความสัมพันธก์ บั ตัวแปรตามโดยตรง
หมายเหตุ
กรณี 3rd variable ไมส่ มั พันธก์ ับตัวแปร Y แตส่ ัมพนั ธ์กับตวั แปร X วิธแี ก้ไขคือ ตัดทิง้ หรือถ้าเกือบจะมีความสัมพนั ธ์
(เกอื บ significant และมเี หตุผล หรอื มีการศกึ ษาสนบั สนุนว่าตวั แปรตวั น้ีน่าจะมผี ลต่อตัวแปร Y กส็ ามารถนำตวั แปรนน้ั มา
เปน็ ตัวแปร X ท่ีเราสนใจอกี 1 ตัว เลือกใช้ Mantel - Haenszel, ANCOVA, Multiple Linear or Logistic Regression
ตารางที่ 14 แนวทางการเลือกใช้การวิเคราะห์ความเกย่ี วขอ้ งของตัวแปรมากกว่า 2 ตวั
เทคนคิ ตัวแปรตาม ตัวแปรอิสระ
1. Two-way ANOVA เชงิ ปรมิ าณ 1 ตัว เชิงกลมุ่ 2 ตัวทีค่ าดว่ามีอทิ ธิพลรว่ มหรอื
ปฏสิ ัมพันธ์
2. ANCOVA: Analysis of เชิงปริมาณ 1 ตวั เชงิ กลุ่ม 1 ตวั
covariance เชิงปริมาณ 1 ตวั (Covariate)
3. Mantel - Haenszel ตวั แปรเชงิ กลมุ่ 1 ตัว ตวั แปรเชงิ กลมุ่ 1 ตัว
ตัวแปรเกิน 1 ตัว
4. Multiple Regression เชงิ ปรมิ าณ 1 ตวั เชิงปริมาณ หรือเชิงกลมุ่ อย่างน้อย 2 ตวั
5. Multiple Logistic Regression เชิงกลมุ่ 2 ระดับขนึ้ ไป เชงิ ปรมิ าณ หรอื เชิงกลมุ่ อย่างนอ้ ย 2 ตวั
6. MANOVA เชิงปริมาณ 2 ตวั ขนึ้ ไป เชิงปรมิ าณ หรือเชงิ กล่มุ อย่างน้อย 2 ตวั
(สัมพนั ธก์ นั )
26
เอกสารอา้ งองิ
1. จรนิต แก้วกงั วาน. (2562). คมู่ อื นกั วจิ ัยมอื ใหม่. กรุงเทพฯ: จ.ี เอส.เอม็ .เทรดด้ิง จำกดั .
2. ปณธิ ี ธัมมวจิ ยะ. (2557). บทท่ี 4 วชิ าสถติ เิ บอ้ื งต้นสำหรบั นกั ระบาดวทิ ยาภาคสนาม ใน คำนวณ อง้ึ ชศู กั ด์ิ
ปฐม สวรรค์ปญั ญาเลศิ วทิ ยา สวสั ดิพทุ ธพิ งศ์ และ ชลุ ีพร จิระพงษา บรรณาธกิ าร. พ้นื ฐานระบาดวิทยา. กราฟฟคิ . กรงุ เทพฯ.
3. Polit, D., F. and Beck, C., T. (2014). Essentials of nursing research: appraising evidence for nursing
practice. 8th ed. Wolters Kluwer Health/Lippincott Williums & Wilkins.
4. Levesque, R., and SPSS Inc. (2006). SPSS Programming and Data Management, 3rd Edition: A Guide
for SPSS and SAS Users. USA. Available from: http://spsstools.net/static/spss-programming-book/SPSS-
Programming-and-Data-Management-3rd-Edition.pdf
5. LoBiondo-Wood, G., and Haber, J., (2014). Nursing research: methods and critical appraisal for
evidence – based practice. 8th ed. Mosby, an important of Elsevier Inc.
6. Social Science Statistics. (2018). https://www.socscistatistics.com/tests/chisquare2/default2.aspx
7. MedCalc Software. (2021). https://www.medcalc.org/calc/odds_ratio.php
8. Soper, D. (2021). https://www.danielsoper.com/statcalc/calculator.aspx?id=43