การใชโปรแกรม R เพ่ือการวิจัย
ดร.วนิดา พงษศ ักดช์ิ าติ
การใชโปรแกรม R เพ่อื การวจิ ัย ดร.วนดิ า พงษศ กั ด์ชิ าติ
2
บทท่ี 1
โปรแกรม
R เปน โปรแกรมคอมพิวเตอรโปรแกรมหนง่ึ ที่มีความสามารถสูงในการวเิ คราะหขอมูลเชงิ สถติ ิ ซง่ึ ใน
ปจ จุบนั R เปนที่รจู กั ของนกั วิจัยในสาขาตา ง ๆ และถกู นำมาใชอยางแพรหลาย สาเหตุท่ี R ไดรับความ
นิยมมากในปจ จุบันก็เนือ่ งจาก R เปน ซอฟแวรประเภท Open source ที่ทุกคนสามารถนำมาใชไ ดโดยไมมีคา
ใชจายใด ๆ และผใู ชไ มตอ งกงั วลกับเร่ืองของการละเมดิ ลิขสทิ ธิ์เหมือนกับโปรแกรมสำเรจ็ รูปทางสถิติอ่นื ๆ
R เปนโปรแกรมท่ีอยูภายใตการดแู ลของมลู นธิ ิท่ีไมแสวงหากำไรชอ่ื R Foundation โดยมี Robert
Gentleman และ Ross Ihaka จากภาควิชาสถิติ มหาวิทยาลยั Auckland เปน ผูที่เรม่ิ พัฒนา R ขน้ึ และมี
สมาชกิ หลักจำนวนหนึ่งซง่ึ ดแู ลและจดั การเกี่ยวกับ R ใหกบั ผูใชตง้ั แตป 1997 จนถงึ ปจจุบัน (รายละเอยี ด
สามารถดูไดจาก http://www.r-project.org) R เปน สวนหนึ่งในโครงการของ GNU การใช R สามารถใชได
ท้ังบนระบบปฏบิ ตั ิการ Unix Macintosh และ Windows ขอมลู ตาง ๆ เก่ยี วกับ R และตวั โปรแกรมสามารถ
หาไดจ าก http://www.r-project.org
R เปนโปรแกรมท่ีดีมากสำหรบั ใชในการเรยี นรูทางสถติ ิ เนื่องจากสามารถทำใหผูเรียนเกดิ ความเขา ใจใน
กระบวนการทางสถติ ิไดดียิง่ ขึ้น อกี ทัง้ ยงั เปน โปรแกรมท่ีมีความยืดหยนุ ในการวเิ คราะหทางสถติ ิ จึงทำใหผูใช
สามารถขยายกระบวนการวิเคราะหอ อกไปไดตามความตองการ
เน่ืองจาก R เปน open-source ทำใหผ ใู ชส ามารถหามาใชไดงาย นอกจาก R จะเหมาะกบั นักศึกษาเพื่อ
ใชในการเรยี นรูท างสถติ ิแลว R ยังเหมาะกบั นกั วิจยั ที่ตองการใชวธิ เี ชิงสถิติในการวเิ คราะหขอมูลอีกดวย
1.1 การดาวนโ หลดและติดต้งั R
โปรแกรม R สามารถดาวนโ หลดไดจาก http://www.r-project.org/ เลือก Download CRAN (Com-
prehensive R Archive Network) จากนนั้ เลอื กดาวนโ หลดจากเวปไซตทอี่ ยใู กลกับเรามากทีส่ ุด เพอ่ื ความเร็ว
ในการดาวนโ หลด เมอื่ เลอื ก mirror แลวใหเลือก Download R for Windows แลวเลือก base เลอื ก Down-
load R 3.2.3 for Windows แลว บันทึกไฟลนไ้ี วในโฟลเ ดอรทต่ี องการ
3
การใชโปรแกรม R เพ่อื การวจิ ัย ดร.วนดิ า พงษศ กั ด์ชิ าติ
4
การใชโปรแกรม R เพื่อการวิจัย ดร.วนิดา พงษศ ักดิช์ าติ
เมอื่ ดาวนโหลด R เรียบรอ ยแลวก็เร่ิมทำการตดิ ต้งั R ซึ่งสำหรบั ระบบปฏิบตั ิการ Windows สามารถ
ทำไดงา ยมากโดยการเปดไฟล R-3.2.3-win.exe ท่ีบันทกึ ไว แลว คลกิ Next ไปเรือ่ ย ๆ R จะถกู ตดิ ต้ังทันที เมอ่ื
ติดต้ัง R เรยี บรอ ยแลว เราสามารถเริ่มใชงาน R ไดโดย double-click icon ของ R จะปรากฎหนาตา งของ
โปรแกรม R ดงั น้ี
หนาตา ง R จะแบง เปน สองหนา ตางยอยคอื R Console และ R Graphics โดยหนาตา ง R Console
เปนหนา ตางสำหรับการเขยี นคำสัง่ และแสดงผลลัพธ สวนหนาตา ง R Graphics เปนหนา ตางสำหรับแสดง
กราฟ ซ่ึงจะปรากฏขน้ึ เมอื่ มกี ารสรา งกราฟเทานั้น
Note ทุก ๆ 6 เดอื น จะมีการออกรุนใหมข อง R ผูใ ชจงึ ควรอพั เกรดโปรแกรม R อยเู สมอ
5
การใชโ ปรแกรม R เพื่อการวจิ ยั ดร.วนดิ า พงษศ ักด์ชิ าติ
1.2 การใช R เบ้อื งตน
1.2.1 การใช R เปน เครอ่ื งคิดเลข
การใช R แบบงา ย ๆ แบบหน่ึงคอื การใชเสมือนเปน เคร่อื งคดิ เลข R จะใชเครอื่ งหมายทางคณิตศาสตรที่
เราคุนเคยกันดีอยูแลว เชน +, -, * และ / และใช ^ เปน เคร่ืองหมายของการยกกำลัง ตัวอยา งตอไปนี้แสดงให
เหน็ ถึงการใช R เปน เครือ่ งคดิ เลข
> 2+2
[1] 4
> 2^2
[1] 4
> (1-2)*3
[1] -3
> -2*3
[1] -6
ผลที่ไดจากการคำนวณจะปรากฏในบรรทดั ถดั มาพรอมดว ย [1] (จะอธิบายถงึ สัญลกั ษณนี้ตอไปในเรอ่ื งของ
data vector)
Functions ใน R มีฟง กชันทางคณติ ศาสตรและสถิติที่สามารถนำมาใชไ ดมากมาย และมีวธิ ีใชที่คลายคลงึ กบั
การใชฟงกช นั ทางคณติ ศาสตรในเคร่อื งคิดเลข และโปรแกรมคอมพวิ เตอรอน่ื ๆ เชน EXCEL เปนตน เวลาใช
ฟงกชนั เหลานี้ ใหพิมพช ื่อของฟง กช ันที่ตอ งการใช ตามดวยวงเล็บ, ( ) ซง่ึ ในวงเลบ็ นี้เราจะใส argument เขาไป
ตัวอยางตอ ไปน้แี สดงการใชฟ งกช นั ใน R
> sqrt(2)
[1] 1.414214
> sin(pi)
[1] 1.224606e-16
> exp(1)
[1] 2.718282
> log(10)
[1] 2.302585
ฟงกช ันหลายฟงกชันใน R มี argument ที่นอกเหนอื จากท่ีใชไปแลว ซึง่ ทำใหเราสามารถเปลี่ยน defualt ท่ี
กำหนดไวในฟงกชนั ได เชน ฟงกช ัน log() โดย default แลว เปน log ฐาน e แตถา เราตองการใช log ฐาน 10
สามารถทำไดด ังนี้
> log(10,10)
[1] 1
> log(10,base=10)
[1] 1
สำหรบั คำสง่ั แรกจะใชไ ดเม่ือเราทราบอยูแลววา argument ที่สองเปน การกำหนดฐานของ log ในคำสง่ั ที่สอง
เราใชชอื่ ของ argument ไดแ ก base = บอกใหฟง กช นั ทราบวา เราตองการใช log ฐาน 10 แบบแรกน้นั มี
ประโยชนค อื ประหยดั เวลาในการพิมพ แตใ นแบบทสี่ องนน้ั งา ยตอการจำและการอาน
6
การใชโปรแกรม R เพอื่ การวจิ ัย ดร.วนดิ า พงษศักด์ิชาติ
1.2.2 Assignment
โดยปกติเรามักตอ งการกำหนดชอ่ื ใหกับคาบางคา เพื่อนำไปใชในคราวตอ ไปไดโดยไมตองพมิ พคาน้นั อกี
เชน
> x=2
> x+3
[1] 5
> e=exp(1)
> e^2
[1] 7.389056
การกำหนดชื่อตัวแปรสามารถใชไ ดทง้ั ตัวอกั ษร ตัวเลข และ "." หรือ " " แตไมสามารถใชเครอ่ื งหมายของ
การคำนวณทางคณิตศาสตร เชน +, -, *, / ได ตัวอยางของการต้งั ชอื่ ตวั แปร
> x=2
> n=25
> a.really.long.number = 123456789
> AReallySmallNumber = 0.000000001
การต้ังชือ่ ตวั แปรควรระวงั ในเรื่องของการใชตวั อกั ษรตวั ใหญหรอื ตวั เลก็ เนอื่ งจาก R จะถอื วา ตัวอักษรตัวใหญ
หรอื ตัวเล็กไมใ ชต ัวแปรเดยี วกนั
1.3 ชนิดและรปู แบบของขอ มลู ใน R
ขอ มลู ท่ใี ชใน R สามารถจำแนกไดเ ปน 3 ชนิดใหญ ๆ คือ
Numeric เปนขอ มลู ท่ีมีคาเปนตวั เลข หรอื ในทางสถติ ิเรยี กขอมลู ชนิดน้ีวา ขอ มลู เชิงปริมาณ (Quantitative
data) เชน อายุ รายได และคะแนนสอบ เปน ตน ซึง่ ขอมูลชนดิ นี้สามารถนำมาคำนวณหาคาทางสถิติ
ตา ง ๆ เชน คาเฉลยี่ คา เบ่ยี งเบนมาตรฐาน เปนตน
Character เปนขอ มลู ท่คี า ของมันไมใ ชตัวเลข โดยปรกติมักเปนขอความ หรือตัวอกั ษร ในทางสถติ ิเรียกขอ มูล
ชนดิ นี้วาขอ มลู เชิงคณุ ภาพ (Qualitative data) เชน เพศ (ชาย, หญิง) ระดบั การศกึ ษา (มธั ยมศึกษา,
ปริญญาตรี, ปริญญาโท) เปน ตน ขอ มลู ชนิดน้ีไมสามารถนำมาคำนวณเพื่อหาคา ทางสถิติได แตมีวิธีเชงิ
สถติ ิบางวิธีที่สามารถใชในการวิเคราะหเพอื่ หาคำตอบที่ผูวจิ ัยตองการจากขอมลู ชนิดนี้ได ซงึ่ โดยทวั่ ไป
จะใชว ิธกี ลุมของสถติ ิไมอิงพารามิเตอร (Nonparametric statistics)
Logical เปนขอ มูลเชิงตรรกทีม่ ีคาอยูสองคาเทานั้น คอื TRUE แทนคาเปน จรงิ หรือ FALSE แทนคาท่ีเปน เทจ็
ขอมูลทใ่ี ชใ น R สามารถเกบ็ ไวใ นรปู ของ object ท่มี อี ยดู วยกนั หลายชนดิ ไดแก
Factor เปนลกั ษณะการเก็บขอมูลที่เปนขอมูลเชงิ กลุม (categorical data) หรอื ขอมลู เชิงคุณภาพ ที่ไมไดมี
คาเปน ตัวเลขอยา งแทจริง แตใชในการจำแนกขอ มลู ออกเปนกลุม ๆ ตามลักษณะเฉพาะท่ีสนใจ เชน
เพศ (ชาย, หญงิ ) เปนตน
7
การใชโ ปรแกรม R เพื่อการวิจัย ดร.วนิดา พงษศกั ดิช์ าติ
Vector ขอ มลู ที่อยูในรูปของเวกเตอรอาจเปนตัวเลข หรอื ตวั อกั ษร กไ็ ด โดยสมาชกิ ในเวกเตอรตอ งเปนขอมูล
ชนิดเดียวกนั ลักษณะการเกบ็ ขอมูลของเวกเตอรใน R จะเปนเวกเตอรแ ถว (row vector)
Matrix เปน ลักษณะของการเกบ็ ขอมูลในสองมติ ิ (2 dimensions) ขอมลู ท่ีอยูในรูปของเมทริกซอาจเปน
ตวั เลข หรอื ตวั อกั ษรก็ได แตสมาชิกทกุ ตวั ในเมทริกซห นึง่ ตองเปนขอ มูลชนดิ เดียวกนั เทานน้ั
Data frame เปน ลักษณะการเกบ็ ขอมลู ในรูปตาราง ท่ีประกอบดวยเวกเตอรหนง่ึ หรอื หลายเวกเตอรมารวม
กนั โดยแตล ะเวกเตอรอาจเปน ขอ มูลชนดิ เดียวกันหรือตา งชนิดกันก็ได แตความยาวของทกุ เวกเตอร
ตอ งเทา กนั
List เปน ลกั ษณะการเกบ็ ขอ มูลที่สามารถนำ object แตล ะแบบมารวมกนั เก็บเปน list ได จะเปนขอ มูลชนิด
เดียวกันหรอื ไมก ็ได และไมจ ำกัดในเร่อื งของขนาดและความยาวของ objects ทม่ี ารวมกนั ซึ่งโดยท่วั ไป
ผลการวเิ คราะหข อง R มักอยใู นรปู ของ list
1.4 R Commander
เนอื่ งจากการใช R ในรปู ของ RGui ผูใชมักประสบปญ หาในการใชฟง กชันตาง ๆ เน่ืองจากจำรูปแบบของ
คำสง่ั ไมได หรือกำหนดคา argument ตา ง ๆ ไมถกู ตอง ทำใหผูเร่มิ ตน ใช R ในการวเิ คราะหขอมลู เชงิ สถติ ิมี
ความรสู กึ วา R เปน โปรแกรมที่ยงุ ยากซบั ซอ น และผูใ ชจ ำเปนตองมีความรใู นเร่อื งของการโปรแกรมพอสมควร
ซึ่ง Prof. John Fox ไดทราบถงึ ปญหาน้ี จึงไดพฒั นาแพคเกจของ R ชอ่ื วา [Rcmdr] ซึ่งชว ยใหการทำงาน
ใน R งายขึ้น โดยแพคเกจนี้จะสรา งอินเตอรเฟส (interface) ท่ีมีลักษณะการทำงานแบบเมนู คลายคลึงกบั
โปรแกรมสำเรจ็ รูปทางสถิติอ่นื ๆ เชน SPSS หรือ MINITAB ดงั น้นั ผูใชจงึ สามารถใช R ในการวเิ คราะหขอมลู
ไดงา ยขนึ้ อยา งไรก็ตาม หากผูใชตอ งการทำงานที่มีความซับซอ น หรอื งานที่นอกเหนอื จากท่ี Rcmdr ทำได ก็
จำเปนตอ งใช RGui เชน เดิม
1.4.1 การติดตงั้ R Commander
1. เปด โปรแกรม R ทต่ี ดิ ต้งั ไวแลว ขน้ึ มา ปรากฏหนาตาง RGui
2. เลือกเมนู Packages -> Install package(s)... จะปรากฏหนาตา ง CRAN mirror
3. ใหเ ลือก mirror ทีอ่ ยใู กลท ีส่ ดุ นน่ั คอื ของประเทศไทย จากนั้นคลกิ OK จะปรากฏหนา ตาง Packages
4. เลอื กแพคเกจช่อื Rcmdr จากนัน้ คลิก OK
5. โปรแกรมจะทำการติดตงั้ R commander ให โดยจะมีขอ ความถามวาตองการตดิ ต้งั แพคเกจที่ใชรว ม
กบั R commander หรือไม ใหตอบ YES จากนัน้ การตดิ ต้งั จะเสร็จสมบรู ณ
1.4.2 การใช R Commander
1. เปดโปรแกรม R
2. ไปท่ีเมนู Packages -> Load package จะปรากฏหนาตา ง Select one -> เลือก Rcmdr จะปรากฏ
หนาตา ง R Commander ดงั น้ี
8
การใชโ ปรแกรม R เพอ่ื การวจิ ยั ดร.วนิดา พงษศ ักดิ์ชาติ
Note: เราสามารถกำหนดให R โหลด R Commander อตั โนมตั ิทุกครัง้ ทีม่ กี ารเปด โปรแกรม R ไดโ ดยการ
เพ่ิมคำสั่งตอไปนี้ลงในไฟลช อ่ื Rprofile.site ในไดเรกทอรย่ี อ ยของ R ชอ่ื etc
local({
old <- getOption("defaultPackages")
options(defaultPackages = c(old, "Rcmdr"))
})
หนาตางของ R Commander ประกอบดว ยหนา ตา งยอยอกี 4 หนา ตาง คือ
Script Window: ท่ีหนาตา งนีผ้ ใู ชส ามารถพมิ พคำสั่ง R ไดที่นี่ จากนนั้ คลิก Submit แลว R จะทำการ
ประมวลผลคำส่ังท่ีไดรบั นอกจากนนั้ ผูใชสามารถเลอื กการใชคำส่ังตาง ๆ ในการวเิ คราะหขอมูล
จากเมนูท่ีอยูดา นบนของหนา ตา งได และสามารถบนั ทกึ ชุดคำสงั่ ที่ใชลงไฟลเพ่อื เรียกใชในคราวตอ
ไปได หรือสามารถเปด ไฟลคำส่งั (script file) ทีม่ อี ยูแลว มาใชก็ได
R Markdown: ใชสำหรบั การสรา งรายงานการทำงานของผูใช
Output Window: เปน พนื้ ทส่ี ำหรับแสดงผลการทำงานตามคำสั่งจาก Script Window
Message Window: เปนพื้นทแ่ี สดงขอ ความตา ง ๆ ท่ีเกดิ จากการใชง านคำสง่ั โดยขอ ความที่เปนสีแดง
คอื Error message ขอความสเี ขียวคือ Warnings และขอ ความสนี ำเงนิ คอื ขอมลู อน่ื ๆ
Note: กราฟจะปรากฏในอีกหนา ตา งหนึง่ แยกตางหาก เปน R Graphics Device Window โดยกราฟ
ที่ปรากฏจะเปน กราฟรปู ลา สุดท่ีประมวลผล หากตองการดูกราฟกอ นหนาใหใช page up และ page down
keys
ท่ดี า นบนของหนา ตา ง R Commander ประกอบดว ยเมนตู า งๆ ดงั นี้
9
การใชโปรแกรม R เพ่อื การวจิ ัย ดร.วนิดา พงษศ ักดิช์ าติ
File ประกอบดวยคำสัง่ ที่ใชในการเปด หรือบนั ทกึ ไฟลประเภทตา ง (Open, Save) เชน ไฟลคำส่ัง และ
ไฟลผลลพั ท และยงั มคี ำสง่ั ที่ใชในการออกจากโปรแกรมดวย (Exit)
Edit ประกอบดว ยคำสง่ั ตัด คดั ลอก วาง (Cut, Copy, Paste, เปน ตน) ที่ใชในการแกไ ขรายละเอยี ดของ
หนา ตาง script หรือ output
Data ประกอบดวยเมนยู อ ย ที่มคี ำสัง่ ในการสรางขอ มลู ใหม อา นขอมูลจากไฟล หรอื จดั การขอ มูล
Statistics ประกอบดวยเมนยู อยท่มี คี ำสัง่ เกยี่ วกับการวิเคราะหเชงิ สถติ เิ บือ้ งตน ตา ง ๆ
Graphs ประกอบดวยคำสั่งในการสรางกราฟทางสถิติ
Models ประกอบดว ยเมนูยอ ยและคำสงั่ ในการหาคา สรุปทางสถิติ การสรางชวงความเชอ่ื มั่น การ
ทดสอบสมมตฐิ าน การตรวจสอบขอ สมมติเบ้ืองตนของตวั แบบทางสถติ ิ และกราฟตาง ๆ ที่ใช
ในการตรวจสอบขอ สมมตขิ องตัวแบบทางสถิติ
Distributions ประกอบดว ยคำสง่ั เก่ียวกับการแจกแจงความนา จะเปนทางสถิติ
Tools ประกอบดว ยคำสง่ั ในการโหลดแพคเกจของ R และ Rcmdr plug-in มาใชงาน
Help ใหขอมลู เกยี่ วกบั R Commander และความชวยเหลือในการใช R Commander
1.5 การนำขอ มูลมาใชด ว ย R Commamder
การนำขอมูลเขามาใชใน R Commander สามารถทำไดหลายวิธีดว ยกัน เชน การปอ นขอ มูลเขา ไปใหม
การเรยี กไฟลข อมูลทม่ี อี ยแู ลวในรูปแบบตา ง ๆ เขามาใชงาน
1.5.1 การปอ นขอ มูลใหม
การปอ นขอ มลู ใหมโดยตรงเปน วิธที ี่เหมาะกับขอมลู ที่มีขนาดเลก็ โดยทำไดดงั น้ี
1. เลือกเมนู Data -> New data set จะปรากฏหนา ตาง New Data Set
10
การใชโ ปรแกรม R เพ่อื การวจิ ยั ดร.วนดิ า พงษศักดช์ิ าติ
2. ใสชอ่ื ของชุดขอมลู ลงไป -> OK จะปรากฏหนาตา ง Data Editor ท่มี ลี ักษณะเปน spreadsheet
3. ที่หนา ตาง Data Editor เราปอ นขอมลู งไปไดตามตองการ โดยการกำหนดชอื่ ตวั แปรใหคลกิ ท่ีชอื่
คอลมั น (V1) และสามารถพมิ พชอ่ื ตวั แปรท่ีตองการลงไปแทนท่ีไดเลย และสามารถเพม่ิ คอลมั นไดใน
กรณีที่ขอ มลู ประกอบดวยตวั แปรหลายตวั โดยคลกิ ท่ปี ุม Add column
11
การใชโ ปรแกรม R เพอ่ื การวจิ ัย ดร.วนิดา พงษศ กั ด์ิชาติ
เม่ือกำหนดช่ือตัวแปรเรยี บรอยแลว ผูใชสามารถปอ นขอ มลู ในหนาตา งนี้ไดเลย โดยปอ นขอ มูลลงไป
ตาม cell ในตารางขอมลู
4. เมื่อปอ นขอ มลู เสรจ็ ชดุ ขอ มูลน้ีจะอยูในรูปของ data frame และพรอมใชงาน จากนนั้ ใหปด หนา ตา งน้ี
ชดุ ขอมลู ทส่ี รางไวน สี้ ามารถเรยี กมาดูหรือแกไขไดโ ดยการคลิกเรียกที่ปมุ Edit data set
5. ขอมลู ชดุ ที่สรางไวน้ีมีอยูในหนวยความจำเทา นน้ั ยังไมไดถกู บนั ทกึ เปน ไฟล การบันทกึ ชุดขอมูลลงไฟล
ใหเลอื กเมนู Data -> Active data set -> Save active data set...
1.5.2 การนำขอ มลู เขา มาใชใน R จาก Textfile, EXCEL, SPSS และ MINITAB
โดยสวนใหญผูใชมกั มีการบันทึกขอ มูลไวกอ นท่ีจะทำการวิเคราะหเชงิ สถติ ิแลว ซ่งึ ไฟลเหลา นน้ั อาจอยูใน
รปู แบบตาง ๆ เชน textfile SPSS EXCEL หรอื MINITAB การเรยี กขอ มลู ท่ีอยูในไฟลรปู แบบเหลา นี้มาใชงาน
ใน R สามารถทำไดโดยงายตามชนิดของไฟล สำหรบั ไฟลขอมูลท่ีเปน textfile ขอมลู ตองถูกจัดอยูในรูปแบบ
ของ data frame โดยแตละคอลัมนคอื แตล ะตัวแปร เชน เพศ อายุ รายได เปน ตน แตละแถวคอื แตล ะ case
หรอื ขอมลู ของแตล ะคน และแถวบนสุดของไฟลคือชื่อตวั แปร
สว นไฟลขอมลู ทีเ่ ปน .xlsx ไฟล มีวธิ ีการ import file ดังน้ี
1. Data -> Import data -> from Excel file...
12
การใชโปรแกรม R เพื่อการวจิ ยั ดร.วนิดา พงษศักดิ์ชาติ
ปรากฎหนา ตาง
2. ใสชอื่ ของชุดขอ มลู สำหรับการเรยี กใชใ น R จากนัน้ คลิก OK
3. เลือกโฟลเดอร และชอื่ ไฟลท ่ตี อ งการเปด และเปด ไฟลขอมูล
4. ตรวจสอบวา ไฟลข อมูลทเ่ี ปดนน้ั ถูกตอ ง คอื ครบทุกคอลัมน ทกุ แถวหรอื ไม
5. เรียกดชู ุดขอ มลู โดยใช View data set ทห่ี นา ตา ง R Commander
สว นไฟลประเภทอนื่ ๆ กท็ ำไดเชน เดยี วกนั
13
การใชโปรแกรม R เพ่อื การวจิ ัย ดร.วนิดา พงษศ กั ด์ิชาติ
14
บทที่ 2
การใช R Commander ในการวิเคราะหขอ มูล
เบอ้ื งตน
ในบทน้ีจะศึกษาถึงการใช R Commander ในการวิเคราะหขอ มลู เบอื้ งตน ซง่ึ มีอยูดวยกันหลายวธิ ี เชน
การแจกแจงความถี่ การคำนวณหาคา สถติ ิตา ง ๆ เพื่ออธิบายเกี่ยวกบั ลักษณะของขอมลู เชน คา เฉลี่ย คา เบี่ยง
เบนมาตรฐาน เปนตน นอกจากนัน้ ยงั มีการใชก ราฟรปู แบบตาง ๆ ในการนำเสนอขอมลู ดวย
2.1 ขอ มูลและชนิดของขอ มูล
กอ นท่จี ะเร่มิ ทำการวิเคราะหขอ มูลในทางสถติ ิ เราตองทำความเขา ใจเก่ยี วกับชนิดของขอมลู กอ น เนือ่ งจาก
ขอ มูลแตละชนิดจะมีวิธีการวเิ คราะหที่แตกตางกัน ซง่ึ หากเราใชวิธีเชิงสถิติท่ีไมสอดคลองกับชนดิ ของขอ มูล จะ
ทำใหผลการวิเคราะหที่ไดไมถกู ตอ ง ไมนา เชอื่ ถือ และไมสามารถนำมาใชประโยชนได ในทางสถิติไดแบง ชนดิ
ของขอมูลออกเปนสองกลมุ ใหญ ๆ คือ
1. ขอมลู เชงิ คณุ ภาพหรอื ขอ มลู เชงิ กลมุ (Qualitative variable) คา ของขอมูลชนดิ นี้ไมใชตัวเลข แตเปน
ขอ ความ เชน เพศ (ชาย, หญงิ ) ระดบั การศกึ ษา (ตำ่ กวา ปรญิ ญาตร,ี ปรญิ ญาตร,ี ปรญิ ญาโท, สงู กวา
ปริญญาโท) เปนตน
2. ขอ มลู เชิงปรมิ าณ (Quantitative variable) ขอ มูลชนิดนี้จะมีคาเปน ตวั เลขอยา งแทจริง อาจเปนคา
แบบตอเน่อื ง หรอื ไมต อเนื่องก็ได เชน อายุ รายได คะแนนสอบ จำนวนลูกคา เปน ตน
2.2 การเตรียมขอ มูลเพื่อการวิเคราะห
เครือ่ งมือที่ใชในการเก็บรวบรวมขอ มลู มีอยูหลายชนิด เชน แบบสอบถาม แบบสัมภาษณ และแบบสังเกต
เปนตน ไมวา ผูวจิ ยั จะใชเครอื่ งมือใดในการเกบ็ รวบรวมขอ มลู เม่อื ไดขอ มลู มาแลวจะตอ งมีการจัดเตรยี มกอน
เร่ิมตนวิเคราะหขอ มูล ในท่ีนี้จะสมมตวิ าใชแบบสอบถามเปน เคร่อื งมือ ดังตวั อยา งตอไปน้ี
การสรา งรหัส และการกำหนดชอ่ื ตวั แปร
ตัวอยา งแบบสอบถาม
15
การใชโปรแกรม R เพอื่ การวิจัย ดร.วนดิ า พงษศ ักด์ิชาติ
สว นที่ 1 ขอ มลู สวนบุคคล สำหรบั เจา หนา ท่ี
[ ] [ ] ID
1. เพศ [ ] 1. ชาย [ ] 2. หญงิ
[ ] SEX
2. อายุ ป [ ] AGE
[ ] STATUS
3. สถานภาพ
[ ] 1. โสด [ ] 2. แตงงาน [ ] 3. หมาย/หยา
จากตัวอยาง ตัวแปร ID คอื หมายเลขแบบสอบถาม มี 2 ชอง หมายความวา ตัวเลขท่ีใชจะเปน ตวั เลขสอง
หลัก
ในขอ 1. ตัวแปร SEX ใชเ ลข 1 แทนเพศชาย และเลข 2 แทนเพศหญงิ
ในขอ 2. ตัวแปร AGE ใชตัวเลขอายทุ ี่ผตู อบแบบสอบถามตอบ
ในขอ 3. ตัวแปร STATUS ใชเ ลข 1 แทนโสด 2 แทนแตงงาน 3 แทนหมายหรอื หยา
ตัวอยา งการลงรหัสแบบสอบถาม
สวนท่ี 1 ขอ มลู สวนบุคคล สำหรบั เจาหนา ท่ี
[0] [1] ID
1. เพศ [ ] 1. ชาย [ ] 2. หญงิ
[1] SEX
2. อายุ 20 ป [20] AGE
[1] STATUS
3. สถานภาพ
[ ] 1. โสด [ ] 2. แตง งาน [ ] 3. หมา ย/หยา
16
การใชโปรแกรม R เพ่ือการวิจยั ดร.วนดิ า พงษศ กั ดช์ิ าติ
แบบสอบถามท่ขี อคำถามผูตอบสามารถเลอื กคำตอบหลายคำตอบ [ ] TV1
[ ] TV2
โปรดเลือกรายการโทรทศั นท่ีทานชอบดู (เลอื กไดม ากกวา 1 ขอ ) [ ] TV3
[ ] 1. ขา ว [ ] TV4
[ ] 2. สารคดี
[ ] 3. ละคร
[ ] 4. เกมโชว
จากตัวอยา งนี้จะเหน็ ไดวา ผูตอบสามารถเลอื กตอบไดมากกวา 1 ตวั เลือก ดงั นน้ั การลงรหสั จะใหเลข 1
แทนความหมายที่ผูตอบเลอื กตอบตัวเลอื กน้ัน และ 0 แทนความหมายท่ผี ตู อบไมเลือกตอบตวั เลอื กนัน้ ดงั น้ี
โปรดเลอื กรายการโทรทัศนทท่ี า นชอบดู (เลอื กไดมากกวา 1 ขอ) [1] TV1
[ ] 1. ขา ว [1] TV2
[ ] 2. สารคดี [0] TV3
[ ] 3. ละคร [0] TV4
[ ] 4. เกมโชว
ขอคำถามทีใ่ หผตู อบเรยี งลำดับขอคำตอบ
ใหทานเรยี งลำดับรายการโทรทศั นที่ทานชอบมากทส่ี ุดเปน ลำดบั ที่ 1 และรายการท่ีทานชอบรองลงมา
เปน ลำดบั ที่ 2 3 และ 4 [2] TV1
[2] 1. ขาว
[1] 2. สารคดี [1] TV2
[3] 3. ละคร [3] TV3
[4] 4. เกมโชว [4] TV4
จากตวั อยาง เปนการลงรหัสโดยใชอันดับท่ีเลอื ก เชน ผูตอบเลือกสารคดีเปน อนั ดับท่ี 1 จึงใส 1 ในชอง
TV2 เลอื กขาวเปนอนั ดับท่ี 2 จงึ ใส 2 ในชอ ง TV1 เลอื กละครเปนอนั ดบั ที่ 3 จึงใส 3 ในชอง TV3 และเลอื กเกม
โชวเ ปน อันดบั ท่ี 4 จงึ ใส 4 ในชอ ง TV4
หลงั จากที่กำหนดวธิ ีการลงรหัสแบบสอบถามเรยี บรอยแลว ซ่ึงข้นั ตอนนี้ควรทำกอ นการเกบ็ ขอมูล เมอื่
เกบ็ ขอ มลู เรยี บรอ ยแลว นำแบบสอบถามท่ีรวบรวมไดทง้ั หมดมาลงรหสั โดยสามารถทำไดโดยใชโปรแกรมท่ี
เหมาะกบั การเก็บขอ มูล เชน R Commander EXCEL SPSS หรอื Textfile ก็ได
สมมติไดขอมูลดงั นี้
17
การใชโปรแกรม R เพ่อื การวิจยั ดร.วนดิ า พงษศ ักด์ชิ าติ
ID SEX AGE STATUS
01 1 28 1
02 2 35 2
03 1 29 1
04 1 32 3
05 2 34 2
06 1 28 2
07 2 25 1
08 1 32 1
09 2 33 1
10 2 38 2
11 2 39 3
12 2 34 3
13 2 32 1
14 1 26 1
15 1 27 2
16 2 36 2
17 1 32 2
18 1 33 1
19 1 29 1
20 2 25 3
เม่ือนำขอ มลู ชุดน้ีมาวเิ คราะหตอ งมีการกำหนดชนดิ ของตวั แปรกอ น ซง่ึ ในขอ มลู ชุดนี้ ตัวแปร SEX และ
STATUS เปน ตวั แปรเชงิ กลุม สวนตวั แปร AGE เปน ตวั แปรเชิงปรมิ าณ เมอื่ ใช R Commander จงึ ตองมีการ
กำหนดชนดิ ของตัวแปร SEX และ STATUS ใหเปน Factor ดงั นี้
1. เลอื กเมนู Data -> Manage variables in active data set -> Convert numeric variable to
factors...
จะไดหนาตา ง
18
การใชโ ปรแกรม R เพ่อื การวจิ ยั ดร.วนดิ า พงษศกั ด์ชิ าติ
2. เลือกตัวแปรท่ีตอ งการเปลีย่ นใหเปน factor เชน SEX
3. ผูใชสามารถกำหนดให R เก็บคาของตวั แปรที่เปลยี่ นแปลงแลว ในตวั แปรใหมกไ็ ด หรือเก็บไวในชื่อเดมิ
กไ็ ด ในตัวอยา งนจ้ี ะเกบ็ ไวในชื่อเดิม
4. หากคลกิ เลือกที่ชอ ง Supply level names แลวคลิก OK จะไดหนา ตางสำหรับการกำหนดช่อื ของ
แตล ะระดบั ของตวั แปร ดังน้ี
จากตัวอยา ง กำหนดให 1 เปน Male และ 2 เปน Female
สำหรับตวั แปร STATUS กำหนดดงั น้ี
19
การใชโปรแกรม R เพื่อการวิจัย ดร.วนดิ า พงษศักดชิ์ าติ
ซ่งึ จากตัวอยาง กำหนดให 1 เปน Single ให 2 เปน Married และ 3 เปน Divorce
เราสามารถตรวจสอบชนิดของตัวแปรไดด วยการใชคำสงั่
Statistics -> Summaries -> Active data set
ไดผลดงั น้ี
ID SEX AGE STATUS TV
1 : 1 Male :10 Min. :25.00 Single :9 Min. :1.00
2 : 1 Female :10 1st Qu. :28.00 Married :7 1st Qu. :1.75
3 :1 Median :32.00 Divorce :4 Median :2.00
4 :1 Mean :31.35 Mean :2.40
5 :1 3rd Qu. :34.00 3rd Qu. :3.00
6 :1 Max. :39.00 Max. :4.00
(Other) :14
จากผลท่ีได จะเห็นไดวา ตัวแปร ID เปนตัวอักษร (character) ซ่ึงไมสามารถนำมาวิเคราะหได ตัวแปร
SEX และ STATUS เปนตวั แปรเชิงกลุมหรือ factor แบงเปนระดบั ตามท่ีเรากำหนด และ AGE เปน ตวั แปรเชิง
ปริมาณมคี าตำ่ สุดเทากับ 25 คา สุงสุดเทากับ 39 และคาเฉลี่ยเทากับ 31.35 เปน ตน
ในขน้ั ตอนนี้ หากตรวจสอบแลวพบวา ตวั แปรในชุดขอมูลไมไดมีชนิดของตวั แปรตามท่ีควรจะเปน ก็
สามารถทำการเปล่ยี นได
20
การใชโปรแกรม R เพ่อื การวิจัย ดร.วนดิ า พงษศ ักดิ์ชาติ
2.3 การแจกแจงความถี่
การแจกแจงความถเี่ ปน วธิ ีเชงิ สถติ ิท่ใี ชก บั ตวั แปรเชงิ กลุม หรือตวั แปรเชงิ คุณภาพ
2.3.1 การใช R Commander สำหรบั การแจกแจงความถแี่ บบทางเดยี ว
1. เลอื กเมนู Statistics -> Summaries -> Frequency distributions...
จะปรากฏหนาตา ง Frequency Dsitributions ดงั นี้
ตัวแปรทีป่ รากฏจะเปนตัวแปรเชงิ กลุมเทานนั้
2. เลือกตวั แปรที่ตองการแจกแจงความถ่ี ในที่นี้จะเลือกตวั แปร SEX และ STATUS ไดผลการวิเคราะห
ดังนี้
Male Female
10 10
Male Female
50 50
Single Married Divorce
974
Single Married Divorce
45 35 20
โดย output ในสวนแรกจะแสดงความถี่ของแตล ะกลมุ และ output สวนท่สี องจะแสดงรอยละของแตละกลมุ
2.3.2 การใช R Commander สำหรับการแจกแจงความถแ่ี บบสองทาง
1. เลอื กเมนู Statistics -> Contingency tables -> Two-way tables...
จะปรากฏหนา ตาง Two-Way Table ดังนี้
21
การใชโปรแกรม R เพ่อื การวจิ ัย ดร.วนดิ า พงษศักดชิ์ าติ
2. ท่ีชอ ง Row variable ใหเลอื กตัวแปรท่ีตอ งการไวดา นแถวของตาราง จากตวั อยางเลอื ก SEX ท่ีชอง
Column variable ใหเ ลือกตวั แปรที่ตองการไวด านคอลมั น จากตวั อยางเลอื ก STATUS
3. คลิกทป่ี ุม Statistics ปรากฎหนาตาง
22
การใชโปรแกรม R เพื่อการวจิ ยั ดร.วนิดา พงษศักดช์ิ าติ
เลอื กการแสดงรอยละตามตอ งการ ตองการรอ ยละทางดา นใด ใหค ลกิ ท่ีชองที่ตองการ
รอ ยละดา นแถว เลอื ก Row percentages
รอยละดา นคอลัมน เลอื ก Column percenterages
รอยละรวม เลอื ก Percentages of total
ไมต องการรอยละ เลือก No percentages
ในท่นี ้ีเลือกรอ ยละดานแถว ไดผลดงั นี้
STATUS
SEX Single Married Divorce
Male 6 3 1
Female 3 4 3
> rowPercents(.Table) # Row Percentages
STATUS
SEX Single Married Divorce Total Count
Male 60 30 10 100 10
Female 30 40 30 100 10
ตารางบนแสดงความถห่ี รอื จำนวนนับในแตล ะกลมุ ตารางลางแสดงคา รอ ยละดานแถว
23
การใชโปรแกรม R เพอ่ื การวิจยั ดร.วนิดา พงษศ ักดช์ิ าติ
2.4 การคำนวณคาสถติ เิ บื้องตน
สำหรบั ขอมูลเชงิ ปริมาณ เราสามารถอธิบายถึงลักษณะของขอ มลู เบื้องตนได โดยใชคาสถิติ เชน คา เฉล่ยี
คามธั ยฐาน และคาเบยี่ งเบนมาตรฐาน เปน ตน
การใช R Commander ในการหาคาสถติ เิ หลา นี้ ทำไดดงั น้ี
1. เลอื กเมนู Statistics -> Summaries -> Numerical Summaries...
จะไดห นาตางตอ ไปน้ี
2. เลือกตวั แปรที่ตอ งการคำนวณคาสถติ ิเบื้องตน โดยคลิกท่ีตวั แปรนนั้ จะเห็นวา R แสดงเฉพาะตัวแปร
ทม่ี ีชนิดเปน numeric เทา นน้ั
3. เลือกคาสถิติทีต่ องการหา
24
การใชโ ปรแกรม R เพอื่ การวิจยั ดร.วนิดา พงษศักดิ์ชาติ
4. คลิก OK ไดผ ลลพั ธดังน้ี
mean sd cv 0% 25% 50% 75% 100% n
31.35 4.107439 0.1310188 25 28 32 34 39 20
นอกจากการคำนวณคา สถิติเบ้ืองตน ตามตวั แปรแตล ะตัวแปรแลว เรายังสามารถใช คำนวณคา สถติ ิเหลา น้ี
จำแนกตามกลมุ ยอ ยของตวั แปรเชงิ กลุมที่สนใจไดอีกดว ย เชน เราตอ งการหาอายุเฉลย่ี ของผูตอบแบบสอบถาม
จำแนกตามเพศ สามารถทำไดดังนี้
1. เลอื กเมนู Statistics -> Summaries -> Numerical Summaries...
2. เลอื กตัวแปรทต่ี อ งการ ในทน่ี ค้ี อื AGE
3. คลกิ Summarize by groups... จะปรากฏหนาตา ง
4. เลือกตวั แปรเชิงกลมุ ที่ตอ งการ ในทีน่ ีค้ ือ SEX จากน้นั คลิก OK
5. คลิกท่ีปมุ Statistics เลอื กคา สถติ ทิ ี่ตอ งการ ในที่นเี้ ลือก Mean
25
การใชโปรแกรม R เพ่อื การวจิ ัย ดร.วนดิ า พงษศักด์ิชาติ
6. คลกิ OK ไดผ ลลพั ธด งั นี้
mean n
Male 29.6 10
Female 33.1 10
2.5 การสรางกราฟเพอ่ื การนำเสนอขอ มูล
การนำเสนอขอมูลดว ยกราฟเปนวิธกี ารของสถิติเชิงพรรณณา ซึง่ กราฟที่ใชมีอยดู ว ยกันหลายรูปแบบ ไดแ ก
กราฟแทง กราฟวงกลม และฮสิ โตแกรม เปน ตน
2.5.1 การสรา งกราฟสำหรบั ขอ มลู เชิงกลมุ
สำหรับขอ มลู เชงิ กลุม กราฟท่ีนิยมใชในการนำเสนอขอ มูล ไดแ ก กราฟแทง และกราฟวงกลม การใช R
Commander สรางกราฟเหลา น้ี ทำไดโดย
1. เลือกเมนู Graphs -> Bar graph... จะปรากฏหนา ตาง
26
การใชโปรแกรม R เพ่อื การวิจยั ดร.วนิดา พงษศักดชิ์ าติ
2. เลอื กตวั แปรทต่ี อ งการสรางกราฟ (ในท่นี ี้เลอื กตวั แปร STATUS) จากนั้นคลกิ OK จะไดกราฟดงั รปู
27
การใชโปรแกรม R เพ่ือการวจิ ัย ดร.วนดิ า พงษศ ักด์ิชาติ
Note: การสรางกราฟวงกลมทำไดดว ยวธิ ีเดียวกนั เพยี งแตเปล่ยี นจากคำสัง่ Bar graph เปน Pie
chart เทานน้ั
2.5.2 กราฟสำหรบั ขอมลู เชิงปริมาณ
สำหรับขอมูลเชิงปรมิ าณ กราฟที่นิยมใชในการนำเสนอขอ มูลไดแ ก ฮิสโตแกรม stem and leaf display
และ boxplot การใช R Commander ในการสรางกราฟเหลา นที้ ำได ดังนี้
การสรา งฮสิ โตแกรม
1. เลอื กเมนู Graphs -> Histogram จะปรากฏหนา ตาง Histogram ดังนี้
2. เลอื กตัวแปรทตี่ องการสรา งกราฟ (ตองเปนตัวแปรเชงิ ปริมาณ) ในทนี่ ้ีเลือก AGE
28
การใชโ ปรแกรม R เพื่อการวจิ ัย ดร.วนิดา พงษศักด์ชิ าติ
3. เลอื กลักษณะการแสดงกราฟ วาจะใหแสดงในรูปความถี่ (Frequency counts) รอยละ (Percentage)
หรือความนาจะเปน (Density) ใหคลิกที่ Options ไดหนาตา งดังนี้
ในทน่ี ีเ้ ลอื ก Percentages
นอกจากน้ันยังสามารถใสช อ่ื กราฟไดท่ี Graph title ในรปู นีใ้ สค ำวา "Histigram for Age"
4. คลกิ OK จะไดก ราฟดังรปู ขา งลา ง
การสรา งกราฟ Stem and Leaf
กราฟ Stem and Leaf เปน กราฟท่ีมีลักษณะคลา ยกราฟแทงในแนวนอน แตใชคาจรงิ ของขอ มูลมาแสดง
ในกราฟแทน การใช R Commander สรา งกราฟชนดิ นี้ทำไดด ังน้ี
29
การใชโ ปรแกรม R เพอ่ื การวิจยั ดร.วนดิ า พงษศักดิ์ชาติ
1. เลอื กเมนู Graphs -> Stem and leaf display... จะปรากฏหนา ตา ง Stem and Leaf Display
ดงั นี้
2. คลิกเลือกตวั แปรทต่ี องการสรา งกราฟ (ตอ งเปน ตวั แปรเชิงปรมิ าณเทาน้นั ) ในทน่ี เี้ ลือก AGE
3. คลิกทป่ี ุม Options เพือ่ เลอื กตวั เลือกตา ง ๆ ตามความตอ งการ
30
การใชโ ปรแกรม R เพือ่ การวิจัย ดร.วนดิ า พงษศ ักด์ชิ าติ
Leaf Digit ใชก ำหนดหนว ยของ leaf ท่สี ามารถปรับไดครัง้ ละ 10 หนวย
Parts Per Stem ใชกำหนดจำนวน stem ดังนี้
• ถา กำหนดใหเปน 1 จะมีจำนวน stem เปน 0 1 2 3 4
• ถากำหนดเปน 2 จะมจี ำนวน stem เปน 00 11 22 33 44
Style of Divided Stem ใชกำหนดวธิ ีการแบง stem ในที่น้ใี ช Repeated stem digits
Other Options ใชเ ปลี่ยนวธิ กี ารแสดงคาตาง ๆ ในผลลพั ธ
Trim outliers ใชจัดการเก่ยี วกับคาผดิ ปกติของตวั แปร โดยใหแยกคาผิดปกติแสดงออกมา
ตา งหากไมตองไปรวมไวใ น stem and leaf
Show depth ใหแสดงจำนวนขอ มลู ท่ีแสดงในแถวนนั้ ๆ
Reverse negative leaves กรณีทีม่ ีขอมลู มีคา เปนลบ ใหเ รียงลำดับขอมลู ตามหลักคณิตศาสตร
4. คลกิ OK จะไดผลลัพธดงั น้ี
1 | 2: represents 12
leaf unit: 1
n: 20
2 2 | 55
4 2 | 67
8 2 | 8899
3|
(6) 3 | 222233
6 3 | 445
3 3|6
2 3 | 89
จากกราฟที่ได จะสรุปไดวา อายุของผูตอบแบบสอบถามที่นอ ยที่สุดคอื 25 ป อายุมากท่ีสุดคือ 39 ป และ
มอี ายุ 32 ถงึ 33 ปมากทส่ี ดุ
การสราง Boxplot
1. เลือกเมนู Graphs -> Boxplot... จะปรากฏหนา ตาง ดังน้ี
31
การใชโ ปรแกรม R เพ่ือการวิจยั ดร.วนิดา พงษศ ักดิช์ าติ
2. เลอื กตัวแปรท่ตี อ งการสรางกราฟ ในท่นี ้เี ลอื ก AGE
3. หากตอ งการสราง boxplot แยกตามกลุมของตวั แปรเชงิ กลุม ท่ีสนใจ เชน เพศ ใหคลิกเลอื ก Plot by
groups... จะปรากฏหนา ตาง Groups ดงั น้ี
4. ในหนา ตางจะปรากฏเฉพาะตัวแปรท่ีกำหนดไวเปน Factor เทา น้นั ใหคลิกเลือกตวั แปรท่ีตองการ ในที่
น้ีเลอื ก SEX จากนน้ั คลกิ OK
5. ที่ปมุ Options สามารถเลอื กกำหนดการแสดงคา Outlier ได
32
การใชโ ปรแกรม R เพ่ือการวจิ ยั ดร.วนิดา พงษศ กั ด์ชิ าติ
6. คลิก OK
33
การใชโปรแกรม R เพ่อื การวจิ ัย ดร.วนิดา พงษศ กั ด์ิชาติ
34
บทท่ี 3
การทดสอบสมมตุ ิฐานทางสถิติ
3.1 หลักการของการทดสอบสมมตุ ิฐาน
การทดสอบสมมุตฐิ านทางสถติ ิเปน วิธีการที่ผูวิจัยสามารถนำมาใชในการตรวจสอบขอสมมตุ ิหรือขอ สงสัย
เก่ียวกับการวิจัยได ซ่งึ ขอ สมมุติหรอื ขอ สงสยั นี้เรยี กวา สมมตุ ิฐานทางการวจิ ัย (Research hypothesis) ซ่ึง
การทดสอบสมมตุ ิฐานนี้จะใชความรูจากขอมลู ตวั อยางท่ีเก็บรวบรวมมาได โดยเปลี่ยนสมมตุ ฐิ านทางการวจิ ยั
ใหเปนสมมุติฐานทางสถิติ (Statistical hypothesis) ซึ่งข้นั ตอนของการทดสอบสมมตุ ิฐานสรุปไดดงั น้ี
1. ตง้ั สมมตุ ฐิ านทางสถติ ิ
2. กำหนดระดับนัยสำคัญของการทดสอบ
3. เลือกวธิ กี ารทางสถิติที่เหมาะสม
4. หาขอบเขตของการตดั สินใจ
5. คำนวณคาสถิติจากขอมลู ตวั อยาง
6. ตดั สินใจวาจะปฏิเสธหรือยอมรับสมมตุ ิฐาน
7. สรุปผลการทดสอบท่ไี ด
3.1.1 การตั้งสมมุตฐิ านทางสถติ ิ
เปน ขนั้ ตอนแรกของการทดสอบสมมตุ ฐิ าน โดยสมมุติฐานทางสถิตมิ ีอยดู วยกนั 2 ชนดิ ไดแก
1. สมมุตฐิ านหลัก (Null hypothesis) ใชสญั ลักษณ H0 โดยตอ งกำหนดไวในความหมายวา เทากบั ไม
แตกตาง ไมนอ ยกวา ไมมากกวา ไมม ีความสมั พนั ธกัน เปน ตน ซึ่งอาจกำหนดในรูปสญั ลักษณทางสถิติ
เชน µ (คาเฉลี่ยของประชากร) p สดั สวนของสง่ิ ท่ีสนใจในประชากร หรือกำหนดในรูปขอความกไ็ ด เชน
H0 : รายไดเฉล่ียตอเดือนของคนไทยเทากับ 5000 บาท หรอื H0 : µ = 5000
35
การใชโ ปรแกรม R เพ่อื การวจิ ยั ดร.วนิดา พงษศักดช์ิ าติ
2. สมมุติฐานทางเลอื ก (Alternative hypothesis) ใชส ญั ลักษณ Ha เปน สมมุตฐิ านท่ีตอ งตง้ั คูและมีความ
หมายตรงขา งกบั สมมตุ ิฐานหลกั เสมอ เชน
Ha : รายไดเ ฉล่ียตอเดอื นของคนไทยไมเทา กับ 5000 บาท หรือ H0 : µ ̸= 5000
การตงั้ สมมุติฐานทางสถิติจะตองใชส มมตุ ิฐานทางการวจิ ยั เปน แนวทาง ดังตัวอยางตอไปน้ี
สมมุติฐานทางการวิจัย สมมุติฐานทางสถติ ิ
1. คนไทยมีอายขุ ยั เฉลีย่ 73 ป
H0 : µ = 73
Ha : µ ≠ 73
2. คนไทยอายุ 15 ปข ้ึนไป มากกวา รอ ยละ 30 มภี าวะอว น H0 : p ≤ 0.30
Ha : p > 0.30
3. คนไทยเพศหญงิ มอี ายุยนื กวา เพศชาย H0 : µหญงิ ≤ µชาย
Ha : µหญิง > µชาย
4. ผหู ญงิ ปว ยเปนโรคมะเร็งปอดนอ ยกวาผชู าย H0 : pหญงิ ≥ pชาย
Ha : pหญงิ < pชาย
ประเภทของสมมตุ ฐิ าน
การทดสอบสมมุตฐิ านในทางสถิติจะมีอยูดว ยกันสองประเภท ไดแ ก
1. การทดสอบแบบสองทาง (Two-tail test) เปนการทดสอบท่ีใหผลสรปุ แบบกวาง ๆ ในความหมาย
ของ การเทากับ หรือ ไมเทา กบั มคี วามสมั พันธ หรอื ไมม ีความสัมพนั ธ เชน ตวั อยา งท่ี 1 ในตารางดาน
บน
2. การทดสอบแบบทางเดียว (One-tail test) เปนการทดสอบที่สามารถสรปุ ผลไดดานใดดา นหน่งึ เชน
มากกวา นอ ยกวา เชน ตัวอยางที่ 2 - 4 ในตารางดา นบน
3.1.2 การกำหนดระดบั นัยสำคัญ
ระดบั นยั สำคญั ที่ใชในการทดสอบสมมุตฐิ าน ถอื เปน เกณฑในการตัดสนิ ใจวาผูวิจัยจะยอมรบั (Accept)
หรือปฏิเสธ (Reject) สมมุติฐานหลักในทางสถติ ิ โดยระดบั นัยสำคญั (Level of significant) ใชสัญลักษณ α
หมายถงึ ความนาจะเปนหรอื โอกาสที่ผูวจิ ยั จะปฏเิ สธ H0 เมื่อ H0 เปน จริงหรอื ถกู ตอง ซงึ่ ถือวา เปน โอกาสท่ีผู
วิจยั จะตัดสนิ ใจผิด การตดั สินใจผิดแบบนี้ เรียกวา ความคลาดเคลือ่ นประเภทที่ 1 (Type I error)
ในวจิ ัยโดยทั่วไป ผูวิจยั จะเปน ผูกำหนดระดับนยั สำคัญไวลวงหนา กอนการทดสอบสมมุตฐิ านเสมอ โดย
ระดับนยั สำคญั ที่นิยมใช คอื 0.01 0.05 และ 0.10 การเลือกระดบั นยั สำคัญเทา ใดนนั้ ขึน้ อยูกบั ความเหมาะสม
และความเสยี ที่จะเกดิ ขึ้นหากมคี วามคลาดเคลื่อนของการตดั สินใจเกดิ ข้นึ หากผลเสียท่ีเกดิ ขึน้ ไมร นุ แรงมากนกั
เชน ไมไดทำใหเกิดการบาดเจบ็ ลมตาย ก็อาจระดบั นยั สำคญั 0.05 หรือ 0.01 แตหากผลเสยี ท่ีเกดิ ขึน้ อาจกอ
36
การใชโปรแกรม R เพ่ือการวจิ ยั ดร.วนิดา พงษศ กั ดิ์ชาติ
ใหเกดิ ความเสยี หายอยา งมาก กอ็ าจตอ งใชระดบั นัยสำคัญตำ่ ๆ เชน ในงานวจิ ัยทางการแพทยอ าจตองใชระดับ
นัยสำคญั 0.01 หรือ 0.001
3.1.3 การเลอื กวธิ ีการทางสถติ ิหรอื ตวั สถติ ิทดสอบ
การเลือกวธิ ีการทางสถิติหรอื ตวั สถติ ิทดสอบเปน ขนั้ ตอนที่ตอ งอาศยั ความรูในทางสถิติของผูวิจัยพอ
สมควร เพอ่ื ใหวิธีการทางสถติ ิที่เลอื กเปนวธิ ีท่ีถกู ตองเหมาะสม ซ่ึงจะสงผลใหผลการทดสอบและขอสรุปท่ี
ไดถกู ตองและเช่อื ถือได ในการทดสอบเรื่องหน่ึง มกั มีวิธีการทางสถิติใหเลอื กใชไดหลายชนดิ แตวธิ ีใดจะเปน
วิธีท่ีเหมาะสม ผูวิจยั ตองพิจารณาถงึ ขอ สมมุติเบื้องตน (Assumption) หรอื ขอ กำหนดของวิธีการนั้น ๆ วา
สอดคลอ งกับชนิดของขอ มูลและลกั ษณะของขอมูลที่มีอยูหรอื ไม รวมทั้งตอ งคำนึงดวยวาตัวสถติ ิทดสอบนนั้
สามารถใชในการตอบวัตถปุ ระสงคของการวจิ ัยไดหรอื ไม และผูวิจัยควรคำนงึ ไวเสมอวา ผูวจิ ยั ควรตวั สถติ ิ
ทดสอบที่งา ยทสี่ ุดที่สามารถตอบวัตถุประสงคของการวิจัยได คำวา "งาย" ในที่นี้หมายความวา งา ยตอการใช
งายตอการวเิ คราะหการคำนวณ และงายตอ การแปลความหมายของคาสถิติท่ีได เพราะหากผูวจิ ยั เลือกวิธีการ
ทางสถิติท่ีซับซอ นมากเกนิ ไป โดยที่ไมม ีความรูทางสถติ ิในเรอ่ื งนัน้ ๆ อยา งเพยี งพออาจทำใหเกิดผลเสยี ได น่นั
คือ อาจมีการคำนวณและขอมลู ผดิ พลาด และการแปลความหมายของคา สถติ ิตาง ๆ จะมีความซับซอนและ
ยากมากข้ึน ซงึ่ อาจทำใหไดขอ สรุปที่ผิดไปจากความเปน จรงิ ได อยางไรกต็ าม หากในงานวจิ ยั นั้นจำเปนตองใช
วิธีการทางสถิติข้นั สงู ซง่ึ มีความซบั ซอ น ผูวิจยั ควรจะศึกษาถึงหลักการและเงอ่ื นไขของวิธีเหลา นัน้ ใหเขาใจเสยี
กอนที่จะนำไปใช หรืออาจนำงานวจิ ยั นั้นไปปรกึ ษานกั สถิติเพอื่ ขอคำแนะนำในการใชวิธีการทางสถิติท่ีเหมาะ
สมได
3.1.4 ขอบเขตของการตัดสนิ ใจ
ขอบเขตของการตัดสนิ ใจคือคา ทางสถิติที่ใชสำหรบั การตัดสนิ ใจวาจะยอมรับหรือปฏเิ สธสมมตุ ฐิ านหลัก
ซึง่ โดยทว่ั ไปมอี ยูดวยกนั 2 วิธี ไดแ ก
• ใชต ารางสถิติ
• ไมใชตารางสถิติ
ในทน่ี ้เี ราจะพิจารณาถึงเฉพาะวธิ ที ี่ 2 เทาน้ัน เนอ่ื งจากวธิ ีแรกนน้ั นักวิจยั ตองมีตารางสถิติสำหรับวธิ ีการทดสอบ
ทางสถติ ิท่ีใชอยูดวยทกุ ครงั้ ซ่งึ ไมคอยสะดวกในการทำงานมากนัก อกี ประการหนง่ึ ตารางสถติ ิสำหรบั วิธีการ
ทางสถติ ิวิธีหนึง่ อาจมีอยูหลายตาราง และมีวิธีการอานคา ที่แตกตา งกัน ทำใหผูใชท่ีไมมีความรูทางสถิติดีพอ
อาจเกิดความสับสน และอานคา ผดิ ได สว นวธิ ีท่ีสองนนั้ ไมจำเปน ตอ งใชตารางสถิติแตจะใชคา สถิติคาหนึ่งแทน
คา สถติ ินี้เรยี กวาคา p-value หมายถึงความนาจะเปน หรอื โอกาสคา สถิติทดสอบจะมีคามากกวาคาท่ีคำนวณ
ไดจากขอมลู ตวั อยา ง หรือคอื ความนาจะเปน ท่ีจะปฏเิ สธสมมุติฐานหลกั ท่ีคำนวณไดจากขอมูลตวั อยาง เม่ือ
สมมตุ ิฐานหลักเปนจรงิ เนอื่ งจาก p-value เปนความนา จะเปนจึงมีคา 0 - 1 เทา น้ัน จะสงั เกตเห็นไดวา คา p-
value และระดบั นยั สำคญั α มีความหมายเหมอื นกนั นั่นคอื ทงั้ สองคา ตา งก็เปนความนา จะเปน ในการปฏิเสธ
สมมตุ ิฐานหลกั เม่ือสมมุติฐานหลักเปน จริงทัง้ คู แตทม่ี าของคาสองคา น้ีแตกตา งกัน โดยท่ีระดบั นัยสำคัญ α นัน้
ผูว จิ ยั เปนผกู ำหนดเอง เรยี กวา nominal value แตคา p-value นน้ั ไดม าจากการคำนวณโดยใชข อ มูลตวั อยา ง
ทีเ่ กบ็ รวบรวมมา ดังนนั้ ในการทดสอบสมมตุ ิฐาน เราจงึ สามารถใชค า p-value เปรียบเทียบกบั ระดบั นยั สำคัญ
α ในการตดั สนิ ใจได ซึง่ วิธีการใชคา p-value ในการตดั สินใจท่จี ะปฏเิ สธหรอื ยอมรับสมมุตฐิ านหลกั ทำไดด ังน้ี
• ยอมรับสมมุติฐานหลกั H0 เม่ือ p-value มากกวา หรือเทา กบั ระดับนยั สำคัญ α
37
การใชโ ปรแกรม R เพ่อื การวจิ ยั ดร.วนิดา พงษศ ักด์ชิ าติ
• ปฏเิ สธสมมุติฐานหลกั H0 เมือ่ p-value นอ ยกวา ระดบั นัยสำคญั α
3.1.5 การหาคาสถติ ิทดสอบจากขอมูลตัวอยาง
คาสถิติทดสอบน้ีคำนวณหาไดจากขอ มูลตัวอยา งท่ีเก็บรวบรวมมาได โดยมีสตู รหรือวธิ ีการคำนวณท่ีแตก
ตางกันไปตามตวั สถติ ิทดสอบท่ีเลอื กใช เมือ่ ไดคา สถิติทดสอบแลวจึงจะนำคา ท่ีไดไปเปรียบเทยี บกบั ขอบเขต
ของการตดั สินใจดังท่กี ลาวมาแลว
3.1.6 การตัดสนิ ใจทจ่ี ะปฏเิ สธหรอื ยอมรบั สมมตุ ิฐาน
ในการตดั สินใจที่จะปฏเิ สธหรอื ยอมรับสมมตุ ฐิ านหลักน้ัน ผูวจิ ัยตอ งนำคา สถติ ิทดสอบที่ไดไปเปรยี บเทียบ
กบั เกณฑหรือขอบเขตของการตดั สนิ ใจที่หาไวกอนหนานี้ แลว จงึ ทำการตัดสนิ ใจวา จะปฏิเสธหรือยอมรับ
สมมุติฐานหลกั (การตดั สนิ ในจะกระทำกับสมมุตฐิ านหลกั เทา นัน้ เน่ืองจากสมมุตฐิ านหลักและสมมุตฐิ านทาง
เลือกมีความหมายตรงขา มกนั ดังนนั้ เม่อื ปฏิเสธ H0 กเ็ ทา กบั ยอมรบั Ha นั่นเอง)
3.1.7 การสรปุ ผลการทดสอบ
การสรปุ ผลการทดสอบเปนขั้นตอนสุดทา ยของการทดสอบสมมุติฐาน ผูวิจัยตองสรปุ ผลการทดสอบท่ีได
เพ่อื นำไปสูขอ สรปุ ของการวิจัย ซงึ่ ในการสรุปผลผูวิจยั ควรระบุเกณฑท่ีใชในการทดสอบ หรือระดบั นยั สำคญั
α ดว ย ในการสรุปผลไมจำเปน ตอ งใชสัญลกั ษณทางสถิติ แตควรใชภาษาหรอื คำอธิบายท่ีเขาใจงา ย คนท่วั ไป
สามารถเขาใจได โดยยดึ สมมตุ ฐิ านทางการวิจยั เปนหลกั ในการสรปุ ผล เชน สมมตุ ฐิ านทางการวจิ ัยกำหนดไววา
"คนไทยมีรายไดเฉลยี่ ตอ เดอื นนอยกวา 6000 บาท" ซ่งึ มสี มมุติฐานทางสถิตคิ ือ
H0 : µ ≥ 6000
Ha : µ < 6000
จากขอมลู ตัวอยางท่ีเกบ็ รวบรวมมาได เมือ่ ทำการทดสอบสมมุติฐานพบวา เกดิ การปฏิเสธสมมุติฐานหลัก จงึ
สรุปไดว า "คนไทยมีรายไดเฉลย่ี นอยกวา 6000 บาทตอเดอื น ทรี่ ะดบั นัยสำคญั 0.05 (หรือท่เี กณฑ 5%)"
3.2 การทดสอบคา เฉล่ยี ของประชากรหนึง่ กลุม (µ)
ในการทดสอบสมมุติฐานเกยี่ วกับคา เฉลีย่ ของประชากรหน่ึงกลุม มีวิธกี ารทดสอบอยู 2 วธิ ี คอื t test และ
z test โดยมเี งือ่ นไขในการใชต า งกัน ดังน้ี
• t test ใชเม่อื ตวั อยา งมีขนาดเล็ก (n < 30) และไมทราบคา เบย่ี งเบนมาตรฐานของประชากร σ โดย
ประชากรของขอมูลตองมีการแจกแจงปรกติหรือใกลเคียง ดงั นั้น กอ นท่ีจะใช t test ในการทดสอบ
สมมตุ ฐิ าน จะตอ งมีการตรวจสอบกอนเสมอวา ขอมลู ตวั อยา งนนั้ มาจากประชากรท่ีมีการแจกแจง
ปรกติหรอื ไม ซึ่งวิธีการตรวจสอบมีอยูดว ยกันหลายวธิ ี วธิ ีที่นยิ มใชมากไดแ ก การพิจารณาจากกราฟ
เชน ฮิสโตแกรม stem and leaf display หรือ boxplot
• z test ใชเ มือ่ ตวั อยางมขี นาดใหญ (n ≥ 30) หรือทราบคาเบีย่ งเบนมาตรฐานของประชากร (σ)
38
การใชโปรแกรม R เพอ่ื การวิจัย ดร.วนดิ า พงษศ ักดช์ิ าติ
Note: สำหรับ z test กรณีท่ีเราจะทราบคา เบยี่ งเบนมาตรฐานของประชากรเปน ไปไดยาก เน่ืองจาก σ
เปนคาพารามเิ ตอรที่ไมทราบคา สวนในกรณีท่ีตวั อยางมีขนาดใหญ หากตวั อยางมีขนาดใหญมาก ๆ เราอาจใช
t test แทน z test ได เนื่องจากคุณสมบัติของการแจกแจงแบบ t น่นั คือ เมอ่ื n มีขนาดใหญขึน้ การแจกแจง
แบบ t จะมคี ณุ สมบัตใิ กลเ คียงการแจกแจงปรกติมาตรฐาน ทำใหใ นโปรแกรมสำเร็จรูปบางโปรแกรม เชน SPSS
จะไมมี z test มีแต t test เทา นนั้
การใช R ในการทดสอบคา เฉลีย่ ของประชากร 1 กลุม
จากขอมลู เกี่ยวกบั การสำรวจการดูรายการโทรทัศนในบทท่ีแลว หากเราตองการทดสอบวาอายุเฉลีย่
ประชากรมากกวา 30 ป หรือไม ตง้ั สมมตุ ิฐานทางสถติ ิ คอื
H0 : µ ≤ 30
Ha : µ > 30
ในการทดสอบสมมตุ ิฐานสำหรับขอมูลชดุ นี้ เน่อื งจากขอ มูลมีจำนวนนอ ยกวา 30 เมอ่ื จะใช t test ในการ
ทดสอบตองทำการตรวจสอบลกั ษณะการแจกแจงของขอมลู กอน เนอื่ งจากขอมูลมีจำนวนนอย กราฟท่ีเหมาะ
สมคอื stem and leaf display สำหรบั ขอ มูลชุดไดก ราฟมลี ักษณะดังนี้
1 | 2: represents 12
leaf unit: 1
n: 20
2 2 | 55
4 2 | 67
8 2 | 8899
3|
(6) 3 | 222233
6 3 | 445
3 3|6
2 3 | 89
จากกราฟจะเหน็ ไดวา ขอมลู มีการแจกแจงคลา ยรปู ระฆงั ควำ่ ซึ่งเปนลักษณะของการแจกแจงปรกติ จงึ สรปุ ได
วาขอ มูลชดุ น้ีมาจากประชากรท่ีมีการแจกแจงปรกติ ซึง่ ตรงกับขอ สมมุติเบ้อื งตน หรอื ขอ กำหนดของ t test ดงั
นน้ั เราจะใช t test ทดสอบสมมุติฐาน ดังน้ี
1. เลือกเมนู Statistics -> Means -> Single-sample t-test... จะไดหนาตา ง
39
การใชโ ปรแกรม R เพื่อการวจิ ัย ดร.วนิดา พงษศักดิ์ชาติ
2. เลอื กตัวแปรท่ตี อ งการทดสอบ ในทีน่ ้ีเลือก AGE
3. กำหนดคาพารามเิ ตอรท่ีตอ งการทดสอบ จากตวั อยา งเราตอ งการทดสอบวาอายุเฉล่ียมากกวา 30 หรือ
ไม จึงกำหนด Null hypothesis: mu= 30
4. เลือกรูปแบบของสมมตุ ิฐานทางเลือกทต่ี องการทดสอบ โดยคลกิ เลือกท่ี Alternative Hypothesis
Population mean != mu0 เปน การทดสอบสมมตุ ฐิ านแบบสองทาง (Two tailed Test)
Population mean < mu0 เปน การทดสอบสมมุติฐานแบบทางเดียวทางซาย (Left tailed test)
Population mean > mu0 เปน การทดสอบสมมุติฐานแบบทางเดยี วทางขวา (Right tailed test)
ในที่นี้เราเลือกทดสอบสมมุตฐิ านแบบทางเดยี วทางดา นมากกวาตามสมมุตฐิ านท่ีต้ังไว ดังน้ัน คลกิ เลือก
ที่ Population mean > mu0
5. คลิก OK ไดผ ลลัพธดงั น้ี
One Sample t-test
data: tv$AGE
t = 1.4699, df = 19, p-value = 0.07898
alternative hypothesis: true mean is greater than 30
95 percent confidence interval:
29.76188 Inf
sample estimates:
mean of x
31.35
ผลการวิเคราะหท ไี่ ดม คี วามหมายดงั นี้
40
การใชโ ปรแกรม R เพือ่ การวจิ ยั ดร.วนดิ า พงษศ กั ดชิ์ าติ
1. คา t=1.4699 คือคา สถติ ิทดสอบ t ท่ีคำนวณไดจากขอมลู ตัวอยาง มีจำนวนองศาเสรีเทา กบั 19 และมี
คา p-value=0.07898 หากเรากำหนดระดบั นยั สำคญั α = 0.05 จะเหน็ ไดวา คา p-value นนั้ มีคา
มากกวาระดับนยั สำคัญที่กำหนด จึงยอมรบั สมมุตฐิ านหลกั H0 หมายความวา ที่ระดบั นยั สำคญั 0.05
อายเุ ฉล่ียของประชากรเปา หมายน้ันไมไดมากกวา 30 ป
2. สำหรบั คา 95 percent confidence interval (29.76188 Inf) คือชวงความเชือ่ มั่นทางดา นขวาของ
คา เฉล่ียของประชากร หมายความวาประชากรเปาหมายมีอายเุ ฉลี่ยตง้ั แต 29.7 ป
3. สว นของ mean of x หมายถึงคาเฉล่ยี ของขอมูลตัวอยา ง ในที่น้ีเทากบั 31.35 ป หมายความคนที่ถูก
สมุ มาเปนตวั อยา งมีอายุเฉลีย่ เทา กับ 31.35 ป
3.3 การทดสอบคา เฉลีย่ ของประชากร 2 กลมุ
การทดสอบความแตกตา งระหวา งคา เฉลี่ยของประชากร 2 กลมุ เปนการทดสอบเพือ่ เปรยี บเทียบวา
ประชากรสองกลุมนน้ั มีลกั ษณะแตกตา งกันอยา งไร เชน คนไทยผูชายและผูหญงิ มีอายุขยั โดยเฉลี่ยแตกตา ง
กนั หรือไม หรอื ผูช ายไทยมีรายไดเฉล่ียตอปมากกวา ผูหญงิ หรือไม โดยขอมูลท่ีสามารถนำมาทดสอบคา เฉลยี่ ได
ตอ งอยใู นมาตราแบบชวงขึ้นไป คือตองเปน ขอ มลู เชงิ ปริมาณ วิธกี ารทางสถติ ิทีใ่ ช ไดแ ก t test และ z test โดย
แตละวธิ ีจะขอ กำหนดท่ีแตกตางกัน อยางไรกต็ าม ในการทดสอบคาเฉลย่ี ของประชากร 2 กลุมนี้ ตอ งคำนงึ ถงึ
ลกั ษณะของขอ มูลดว ย โดยจะจำแนกลกั ษณะของขอมลู เปน 2 ประเภท คือ
1. ตัวอยางสองกลุมทส่ี มุ มาเปน อสิ ระกัน (Independent samples)
2. ตัวอยางสองชุดทีส่ ุมมาไมเ ปนอสิ ระกนั (Dependent samples)
การจำแนกลกั ษณะของกลุมตัวอยาง 2 ประเภทน้ี มีความสำคญั มาก เพราะวิธีการวิเคราะหท่ีใชจะมีความ
แตกตางกนั ดงั นั้น ผูวจิ ยั ตองจำแนกใหไดวากลมุ ตัวอยา งในงานวิจยั ของตนเปนประเภทไหน เชน ตองการ
เปรยี บอายขุ ัยเฉลย่ี ของผชู ายและผูหญงิ ลักษณะเชนน้ีถอื เปนกรณีท่ีตัวอยางสองกลมุ เปน อสิ ระกัน แตถา ผูวจิ ัย
ตองการเปรียบเทียบรายไดเฉลย่ี ของน้ำหนกั เฉลี่ยกอ นและหลงั เขาโปรแกรมลดนำ้ หนัก ลกั ษณะเชน นี้ตองใช
กรณีทก่ี ลมุ ตัวอยา งสองกลุมเปนอสิ ระกนั
3.3.1 การทดสอบความแตกตางของคา เฉลย่ี 2 กลุม เมอ่ื กลมุ ตัวอยางเปนอิสระกนั
การทดสอบความแตกตางของคา เฉล่ียของประชากร 2 กลมุ เม่ือกลุมตัวอยา งเปนอสิ ระกัน ดวย t test
หรอื z test ขอมลู ตวั อยา งทั้งสองกลุม ตองเปนขอ มูลเชงิ ปรมิ าณและมีวิธกี ารเลอื กวิธีทดสอบ ดงั น้ี
z test ใชเม่ือตัวอยา งทั้งสองกลุมมีขนาดใหญ (n1 และ n2 มากกวา 30) หรือทราบคา เบี่ยงเบนมาตรฐานของ
ประชากรท่ีหนึ่งและสอง (ทราบคา σ1 และ σ2)
t test ใชเมอื่ ตัวอยา งมีขนาดเล็ก (n1 หรอื n2 นอยกวาหรือเทา กับ 30) และไมทราบคา σ1 และ σ2 เมื่อ
ประชากรทง้ั สองกลุมมีการแจกแจงปรกตหิ รือใกลเคียง
เชน เดียวกบั การทดสอบสมมุติฐานเกี่ยวกบั คาเฉลยี่ ของประชากรหนง่ึ กลมุ ในกรณีของ z test การท่ีเราจะ
ทราบคาของ σ1 และ σ2 เปนไปไดยาก และเม่ือ n1 และ n2 มีขนาดใหญ การแจกแจงแบบ t จะใกลเคียง
41
การใชโ ปรแกรม R เพ่ือการวิจยั ดร.วนิดา พงษศ ักดิ์ชาติ
การแจกแจงปรกติมาตรฐาน ทำใหเราสามารถใช t test แทน z test ได ดังนน้ั ในท่ีนี้จะกลาวถึงเฉพาะ t test
เทาน้ัน
อยางไรก็ตาม การทดสอบโดยใช t test ยงั แบงเปน 2 กรณี ดังนี้
1. σ1 = σ2 ในกรณนี ้ี คา สถิติทดสอบคือ
t0 = (¯x1√− ¯x2) − (µ1 − µ2)
{ 1 1}
n1 + n2
s2p
ซึ่งมีการแจกแจงแบบ t ดว ยองศาเสรเี ทากับ n1 + n2 − 2
2. σ1 ≠ σ2 ในกรณนี ้ี คาสถิติทดสอบคือ
t0 = (¯x1 −√¯x2)ns12−1 +(µns1222− µ2)
ซึ่งมกี ารแจกแจงแบบ t ดว ยองศาเสรีเทากบั + (s22/n2)]2
df = [(s12/n1) [s22/n2]2
[s12/n1]2 n2 − 1
n1 − 1 +
ดังน้ันในการตัดสนิ ใจวา จะใช t test กรณีใดจึงเหมาะสม เราตองทำการทดสอบกอนวา คา เบ่ียงเบนมาตรฐาน
ของประชากร 2 กลมุ แตกตา งกันหรอื ไม ซงึ่ การทดสอบทำไดโ ดยการใช F test
จากตัวอยา งการสำรวจขอ มลู การดูโทรทัศน หากเราตองการทดสอบวา อายุเฉลย่ี ของผชู ายและผูหญิงที่
เปน กลุมเปาหมายน้ันแตกตา งกัน มีสมมตุ ิฐานทางสถติ ิคือ
H0 : µชาย = µหญงิ (3.1)
Ha : µชาย ̸= µหญิง (3.2)
วิธีใช R Commander ทดสอบสมมุตฐิ านนี้ ทำไดโดยการทดสอบกอนวาคา เบย่ี งเบนมาตรฐานของ
ประชากร 2 กลมุ เทากันหรอื ไม ดังนี้
1. เลอื กเมนู Statistics -> Variances -> Two-variance F-test...
42
การใชโ ปรแกรม R เพ่อื การวจิ ยั ดร.วนิดา พงษศ ักดช์ิ าติ
2. ท่ี Groups (pick one) เลือกตัวแปรแบงกลุม ในที่น้ีคอื SEX และท่ี Response variable (pick
one) เลือกตวั แปรที่ตอ งการทดสอบ ในทน่ี ีค้ ือ AGE
3. คลิกปมุ Options ไดห นา ตา ง
Alternative hypothesis คลกิ เลอื ก Two-sided
4. คลิก OK ไดผลลพั ธดังน้ี
F test to compare two variances
data: AGE by SEX
F = 0.2655, num df = 9, denom df = 9, p-value = 0.0612
alternative hypothesis: true ratio of variances is not equal to 1
95 percent confidence interval:
0.06594529 1.06888278
sample estimates:
ratio of variances
0.2654954
การใชผลลพั ธที่ไดทดสอบความแตกตางของคา เบ่ยี งเบนมาตรฐานของประชากร 2 กลุม ใหดูที่คา F =
0.2655 และคา p-value = 0.0612 หากกำหนดระดบั นัยสำคญั ของการทดสอบเทากบั 0.05 จะเหน็ ไดวา คา
p-value มากกวา 0.05 จึงสรปุ ไดวาคาเบยี่ งเบนมาตรฐานของประชากร 2 กลมุ น้ี ไมแตกตางกัน ท่ีระดับนัย
สำคัญ 0.05
ดงั น้ัน ในการทดสอบความแตกตา งของคา เฉล่ยี ของประชากร 2 กลุม จึงใช t test ในกรณีท่ี σ1 ̸= σ2
ดงั น้ี
1. เลือกเมนู Statistics -> Means -> Independent-sample t-test...
43
การใชโ ปรแกรม R เพอ่ื การวิจยั ดร.วนดิ า พงษศ ักดชิ์ าติ
2. ท่ี Groups (pick one) เลอื กตวั แปรแบง กลุม คือ SEX และที่ Response Variable (pick one)
เลือกตัวแปรทตี่ องการทดสอบ คอื AGE
3. คลิกที่ปมุ Options ไดหนา ตา งดงั น้ี
4. ท่ี Alternative Hypothesis เลอื กสมมุตฐิ านทางเลอื กท่ีตอ งการทดสอบ ในที่น้ีเลอื ก Two-sided
เนือ่ งจากสมมตุ ิฐานท่ีกำหนดไวเปน สมมตุ ฐิ านสองทาง
5. ที่ Assume equal variances? เลอื ก Yes เนือ่ งจากในการทดสอบความแตกตา งของคาเบย่ี งเบน
มาตรฐาน พบวา ความเบีย่ งเบนมาตรฐานของประชากร 2 กลมุ ไมแตกตา งกนั (แตถา หากใช F test
ทดสอบแลวพบวา σ1 ≠ σ2 ใหเ ลือก No)
6. คลิก OK ไดผลลพั ธดังนี้
44
การใชโ ปรแกรม R เพือ่ การวิจัย ดร.วนดิ า พงษศ กั ดิ์ชาติ
Two Sample t-test
data: AGE by SEX
t = -2.062, df = 18, p-value = 0.05395
alternative hypothesis: true difference in means is not equal to 0
95 percent confidence interval:
-7.06607063 0.06607063
sample estimates:
mean in group Male mean in group Female
29.6 33.1
ในการใชผลลพั ธที่ไดทดสอบสมมตุ ฐิ านท่ีกำหนดไว ใหพจิ ารณาที่คาสถติ ิทดสอบ t = -2.062 และ p-
value = 0.05395 หากเรากำหนดระดับนัยสำคญั ของการทดสอบเทา กับ 0.05 จะเห็นไดว า p-value มากกวา
ระดับนัยสำคญั 0.05 จงึ ยอมรับสมมุติฐานหลกั หมายความวาอายุเฉลย่ี ของผชู ายและผูหญิงในประชากรเปา
หมายนั้นไมแ ตกตางกัน ทรี่ ะดบั นัยสำคญั 0.05
3.3.2 การทดสอบความแตกตา งระหวา งคาเฉลย่ี ประชากร 2 กลมุ เม่ือกลุมตัวอยางไม
เปนอสิ ระกัน
การทดสอบความแตกตา งระหวา งคา เฉล่ยี ของประชากร 2 กลุม เมอ่ื กลุม ตวั อยางไมเปน อสิ ระกนั ซ่งึ ขอ มลู
ที่ไดจากกลมุ ตัวอยางอาจไดจากการวัดคาจากกลมุ ตวั อยา งเดียวกัน 2 คร้งั เชน การเปรียบเทียบน้ำหนักกอน
และหลงั การเขาโปรแกรมลดน้ำหนักของคนกลุมเดยี วกนั หรอื การเปรยี บเทยี บคะแนนกอ นเรยี นกบั หลังเรยี น
ของนิสิตกลมุ เดียวกัน เปนตน หรืออกี กรณีหนง่ึ ขอมลู ไดมาโดยการวดั คาจากการจับกลุมตัวอยา งเปน คู ๆ โดย
ใชค ุณลกั ษณะบางอยาง เชน การเปรยี บเทยี บระดับ IQ ของฝาแฝด หรือการเปรียบเทียบรายไดเรม่ิ ตน ของผูจบ
การศกึ ษาสาขาบรหิ ารชายและหญงิ ที่มี GPA เทา กนั
สำหรบั การทดสอบสมมตุ ิฐานเพอ่ื เปรียบเทียบคาเฉล่ียของประชากร 2 กลุม เม่อื กลมุ ตวั อยา งไมเปน อสิ ระ
กนั ใชว ิธีการทดสอบ t ท่ีเรียกวา Dependent t test หรือ Match paired t test
ตัวอยางตอไปน้ีเปน ขอมลู คะแนนสอบกลางภาคและปลายภาคของนสิ ติ 44 คน และเราตอ งการทดสอบ
วา นิสิตมีพัฒนาการในการทำขอ สอบหรอื ไม นัน่ คือ ตอ งการทดสอบวา คะแนนสอบปลายภาคมากกวา คะแนน
สอบปลายภาคหรอื ไม
i Midterm Final
1 0.81 4.72
2 2.84 8.19
3 12.16 10.24
··· ··· ···
42 3.65 2.83
43 17.57 19.06
44 17.16 15.75
45
การใชโ ปรแกรม R เพือ่ การวิจัย ดร.วนดิ า พงษศ กั ด์ชิ าติ
จากตารางขอ มูล จะเห็นไดวามีตัวแปร 2 ตัวแปร คือ Midterm คือคะแนนสอบกลางภาค และ Final คอื
คะแนนสอบปลายภาค โดยไมม ีตัวแปรแบงกลมุ จะเห็นวา ลกั ษณะการเกบ็ ขอ มลู จะไมเหมอื นกบั การทดสอบ
ความแตกตางระหวา งคาเฉล่ียของประชาการ 2 กลุม ท่ีเปน อสิ ระกัน
สำหรับตัวอยางนี้ สมมุตฐิ านทางสถติ ทิ ีท่ ดสอบ คือ
H0 : µD ≤ 0 (คะแนนสอบปลายภาคไมม ากกวา คะแนนสอบกลางภาค)
Ha : µD > 0 (คะแนนสอบปลายภาคมากกวาคะแนนสอบกลางภาค)
ใช R Commander ทำการทดสอบโดยใช Dependent t test ดงั นี้
1. เลอื กเมนู Statistics -> Means -> Paired t-test... จะไดหนาตา ง
2. ที่ First variable เลอื กตัวแปรตัวที่ 1 ในที่นี้เลอื ก Final และท่ี Second variable เลอื กตวั แปร ใน
ท่ีน้ีเลือก Midterm
3. คลกิ ปมุ Options ไดห นา ตา งดงั น้ี
4. ที่ Alternative Hypothesis เลอื กชนิดของสมมุตฐิ านทางเลอื กที่ตองการทดสอบ ในที่นี้เลอื ก Dif-
ference > 0 ตามสมมตุ ิฐานทางสถติ ิท่ตี ัง้ ไว)
5. คลิก OK ไดผลลพั ธ ดังนี้
46
การใชโปรแกรม R เพื่อการวิจยั ดร.วนดิ า พงษศกั ด์ชิ าติ
Paired t-test
data: score$Final and score$Midterm
t = 0.3707, df = 43, p-value = 0.3564
alternative hypothesis: true difference in means is greater than 0
95 percent confidence interval:
-0.7966742 Inf
sample estimates:
mean of the differences
0.2253381
จากผลลัพธที่ได ไดคา t = 0.3707 จำนวนองศาเสรี df = 43 และ p-value = 0.3564 หากเรากำหนด
ระดับนยั สำคญั ของการทดสอบเทากับ 0.05 จะเหน็ ไดวา คา p-value มากกวา ระดับนยั สำคัญ จงึ ยอมรับ
สมมุตฐิ านหลัก สรุปไดวา ที่ระดับนยั สำคัญ 0.05 คะแนนสอบปลายภาคเฉล่ียของนิสิตไมไดมากกวา คะแนน
สอบกลางภาคเฉลี่ย หรืออกี นยั หนงึ่ นิสติ ไมม ีพัฒนาการในการทำขอสอบ เน่อื งจากคะแนนสอบปลายภาคไม
ไดดกี วา คะแนนสอบกลางภาค
47