The words you are searching are inside this book. To get more targeted content, please make full-text search by clicking here.

Home Explore คู่มือการใช้งานโปรแกรมR-1

View in Fullscreen

คู่มือการใช้งานโปรแกรมR-1

Like this book? You can publish your book online for free in a few minutes!

Download PDF

Related Publications

Discover the best professional documents and content resources in AnyFlip Document Base.

Published by Narisorn Nas, 2020-03-06 03:35:04

คู่มือการใช้งานโปรแกรมR-1

Pages:

1 - 47

คู่มือการใช้งานโปรแกรมR-1

การใชโปรแกรม R เพ่ือการวิจัย

ดร.วนิดา พงษศ ักดช์ิ าติ

การใชโปรแกรม R เพ่อื การวจิ ัย ดร.วนดิ า พงษศ กั ด์ชิ าติ

2

บทท่ี 1

โปรแกรม

R เปน โปรแกรมคอมพิวเตอรโปรแกรมหนง่ึ ที่มีความสามารถสูงในการวเิ คราะหขอมูลเชงิ สถติ ิ ซง่ึ ใน
ปจ จุบนั R เปนที่รจู กั ของนกั วิจัยในสาขาตา ง ๆ และถกู นำมาใชอยางแพรหลาย สาเหตุท่ี R ไดรับความ
นิยมมากในปจ จุบันก็เนือ่ งจาก R เปน ซอฟแวรประเภท Open source ที่ทุกคนสามารถนำมาใชไ ดโดยไมมีคา
ใชจายใด ๆ และผใู ชไ มตอ งกงั วลกับเร่ืองของการละเมดิ ลิขสทิ ธิ์เหมือนกับโปรแกรมสำเรจ็ รูปทางสถิติอ่นื ๆ

R เปนโปรแกรมท่ีอยูภายใตการดแู ลของมลู นธิ ิท่ีไมแสวงหากำไรชอ่ื R Foundation โดยมี Robert
Gentleman และ Ross Ihaka จากภาควิชาสถิติ มหาวิทยาลยั Auckland เปน ผูที่เรม่ิ พัฒนา R ขน้ึ และมี
สมาชกิ หลักจำนวนหนึ่งซง่ึ ดแู ลและจดั การเกี่ยวกับ R ใหกบั ผูใชตง้ั แตป 1997 จนถงึ ปจจุบัน (รายละเอยี ด
สามารถดูไดจาก http://www.r-project.org) R เปน สวนหนึ่งในโครงการของ GNU การใช R สามารถใชได
ท้ังบนระบบปฏบิ ตั ิการ Unix Macintosh และ Windows ขอมลู ตาง ๆ เก่ยี วกับ R และตวั โปรแกรมสามารถ
หาไดจ าก http://www.r-project.org

R เปนโปรแกรมท่ีดีมากสำหรบั ใชในการเรยี นรูทางสถติ ิ เนื่องจากสามารถทำใหผูเรียนเกดิ ความเขา ใจใน
กระบวนการทางสถติ ิไดดียิง่ ขึ้น อกี ทัง้ ยงั เปน โปรแกรมท่ีมีความยืดหยนุ ในการวเิ คราะหทางสถติ ิ จึงทำใหผูใช
สามารถขยายกระบวนการวิเคราะหอ อกไปไดตามความตองการ

เน่ืองจาก R เปน open-source ทำใหผ ใู ชส ามารถหามาใชไดงาย นอกจาก R จะเหมาะกบั นักศึกษาเพื่อ
ใชในการเรยี นรูท างสถติ ิแลว R ยังเหมาะกบั นกั วิจยั ที่ตองการใชวธิ เี ชิงสถิติในการวเิ คราะหขอมูลอีกดวย

1.1 การดาวนโ หลดและติดต้งั R

โปรแกรม R สามารถดาวนโ หลดไดจาก http://www.r-project.org/ เลือก Download CRAN (Com-
prehensive R Archive Network) จากนนั้ เลอื กดาวนโ หลดจากเวปไซตทอี่ ยใู กลกับเรามากทีส่ ุด เพอ่ื ความเร็ว
ในการดาวนโ หลด เมอื่ เลอื ก mirror แลวใหเลือก Download R for Windows แลวเลือก base เลอื ก Down-
load R 3.2.3 for Windows แลว บันทึกไฟลนไ้ี วในโฟลเ ดอรทต่ี องการ

3

การใชโปรแกรม R เพ่อื การวจิ ัย ดร.วนดิ า พงษศ กั ด์ชิ าติ

4

การใชโปรแกรม R เพื่อการวิจัย ดร.วนิดา พงษศ ักดิช์ าติ

เมอื่ ดาวนโหลด R เรียบรอ ยแลวก็เร่ิมทำการตดิ ต้งั R ซึ่งสำหรบั ระบบปฏิบตั ิการ Windows สามารถ
ทำไดงา ยมากโดยการเปดไฟล R-3.2.3-win.exe ท่ีบันทกึ ไว แลว คลกิ Next ไปเรือ่ ย ๆ R จะถกู ตดิ ต้ังทันที เมอ่ื
ติดต้ัง R เรยี บรอ ยแลว เราสามารถเริ่มใชงาน R ไดโดย double-click icon ของ R จะปรากฎหนาตา งของ
โปรแกรม R ดงั น้ี

หนาตา ง R จะแบง เปน สองหนา ตางยอยคอื R Console และ R Graphics โดยหนาตา ง R Console
เปนหนา ตางสำหรับการเขยี นคำสัง่ และแสดงผลลัพธ สวนหนาตา ง R Graphics เปนหนา ตางสำหรับแสดง
กราฟ ซ่ึงจะปรากฏขน้ึ เมอื่ มกี ารสรา งกราฟเทานั้น

Note ทุก ๆ 6 เดอื น จะมีการออกรุนใหมข อง R ผูใ ชจงึ ควรอพั เกรดโปรแกรม R อยเู สมอ
5

การใชโ ปรแกรม R เพื่อการวจิ ยั ดร.วนดิ า พงษศ ักด์ชิ าติ

1.2 การใช R เบ้อื งตน

1.2.1 การใช R เปน เครอ่ื งคิดเลข

การใช R แบบงา ย ๆ แบบหน่ึงคอื การใชเสมือนเปน เคร่อื งคดิ เลข R จะใชเครอื่ งหมายทางคณิตศาสตรที่
เราคุนเคยกันดีอยูแลว เชน +, -, * และ / และใช ^ เปน เคร่ืองหมายของการยกกำลัง ตัวอยา งตอไปนี้แสดงให
เหน็ ถึงการใช R เปน เครือ่ งคดิ เลข

> 2+2
[1] 4
> 2^2
[1] 4
> (1-2)*3
[1] -3
> -2*3
[1] -6

ผลที่ไดจากการคำนวณจะปรากฏในบรรทดั ถดั มาพรอมดว ย [1] (จะอธิบายถงึ สัญลกั ษณนี้ตอไปในเรอ่ื งของ
data vector)
Functions ใน R มีฟง กชันทางคณติ ศาสตรและสถิติที่สามารถนำมาใชไ ดมากมาย และมีวธิ ีใชที่คลายคลงึ กบั
การใชฟงกช นั ทางคณติ ศาสตรในเคร่อื งคิดเลข และโปรแกรมคอมพวิ เตอรอน่ื ๆ เชน EXCEL เปนตน เวลาใช
ฟงกชนั เหลานี้ ใหพิมพช ื่อของฟง กช ันที่ตอ งการใช ตามดวยวงเล็บ, ( ) ซง่ึ ในวงเลบ็ นี้เราจะใส argument เขาไป
ตัวอยางตอ ไปน้แี สดงการใชฟ งกช นั ใน R

> sqrt(2)
[1] 1.414214
> sin(pi)
[1] 1.224606e-16
> exp(1)
[1] 2.718282
> log(10)
[1] 2.302585

ฟงกช ันหลายฟงกชันใน R มี argument ที่นอกเหนอื จากท่ีใชไปแลว ซึง่ ทำใหเราสามารถเปลี่ยน defualt ท่ี
กำหนดไวในฟงกชนั ได เชน ฟงกช ัน log() โดย default แลว เปน log ฐาน e แตถา เราตองการใช log ฐาน 10
สามารถทำไดด ังนี้

> log(10,10)
[1] 1
> log(10,base=10)
[1] 1

สำหรบั คำสง่ั แรกจะใชไ ดเม่ือเราทราบอยูแลววา argument ที่สองเปน การกำหนดฐานของ log ในคำสง่ั ที่สอง
เราใชชอื่ ของ argument ไดแ ก base = บอกใหฟง กช นั ทราบวา เราตองการใช log ฐาน 10 แบบแรกน้นั มี
ประโยชนค อื ประหยดั เวลาในการพิมพ แตใ นแบบทสี่ องนน้ั งา ยตอการจำและการอาน

6

การใชโปรแกรม R เพอื่ การวจิ ัย ดร.วนดิ า พงษศักด์ิชาติ

1.2.2 Assignment

โดยปกติเรามักตอ งการกำหนดชอ่ื ใหกับคาบางคา เพื่อนำไปใชในคราวตอ ไปไดโดยไมตองพมิ พคาน้นั อกี
เชน

> x=2
> x+3
[1] 5
> e=exp(1)
> e^2
[1] 7.389056

การกำหนดชื่อตัวแปรสามารถใชไ ดทง้ั ตัวอกั ษร ตัวเลข และ "." หรือ " " แตไมสามารถใชเครอ่ื งหมายของ
การคำนวณทางคณิตศาสตร เชน +, -, *, / ได ตัวอยางของการต้งั ชอื่ ตวั แปร

> x=2
> n=25
> a.really.long.number = 123456789
> AReallySmallNumber = 0.000000001

การต้ังชือ่ ตวั แปรควรระวงั ในเรื่องของการใชตวั อกั ษรตวั ใหญหรอื ตวั เลก็ เนอื่ งจาก R จะถอื วา ตัวอักษรตัวใหญ
หรอื ตัวเล็กไมใ ชต ัวแปรเดยี วกนั

1.3 ชนิดและรปู แบบของขอ มลู ใน R

ขอ มลู ท่ใี ชใน R สามารถจำแนกไดเ ปน 3 ชนิดใหญ ๆ คือ

Numeric เปนขอ มลู ท่ีมีคาเปนตวั เลข หรอื ในทางสถติ ิเรยี กขอมลู ชนิดน้ีวา ขอ มลู เชิงปริมาณ (Quantitative
data) เชน อายุ รายได และคะแนนสอบ เปน ตน ซึง่ ขอมูลชนดิ นี้สามารถนำมาคำนวณหาคาทางสถิติ
ตา ง ๆ เชน คาเฉลยี่ คา เบ่ยี งเบนมาตรฐาน เปนตน

Character เปนขอ มลู ท่คี า ของมันไมใ ชตัวเลข โดยปรกติมักเปนขอความ หรือตัวอกั ษร ในทางสถติ ิเรียกขอ มูล
ชนดิ นี้วาขอ มลู เชิงคณุ ภาพ (Qualitative data) เชน เพศ (ชาย, หญิง) ระดบั การศกึ ษา (มธั ยมศึกษา,
ปริญญาตรี, ปริญญาโท) เปน ตน ขอ มลู ชนิดน้ีไมสามารถนำมาคำนวณเพื่อหาคา ทางสถิติได แตมีวิธีเชงิ
สถติ ิบางวิธีที่สามารถใชในการวิเคราะหเพอื่ หาคำตอบที่ผูวจิ ัยตองการจากขอมลู ชนิดนี้ได ซงึ่ โดยทวั่ ไป
จะใชว ิธกี ลุมของสถติ ิไมอิงพารามิเตอร (Nonparametric statistics)

Logical เปนขอ มูลเชิงตรรกทีม่ ีคาอยูสองคาเทานั้น คอื TRUE แทนคาเปน จรงิ หรือ FALSE แทนคาท่ีเปน เทจ็

ขอมูลทใ่ี ชใ น R สามารถเกบ็ ไวใ นรปู ของ object ท่มี อี ยดู วยกนั หลายชนดิ ไดแก

Factor เปนลกั ษณะการเก็บขอมูลที่เปนขอมูลเชงิ กลุม (categorical data) หรอื ขอมลู เชิงคุณภาพ ที่ไมไดมี
คาเปน ตัวเลขอยา งแทจริง แตใชในการจำแนกขอ มลู ออกเปนกลุม ๆ ตามลักษณะเฉพาะท่ีสนใจ เชน
เพศ (ชาย, หญงิ ) เปนตน

7

การใชโ ปรแกรม R เพื่อการวิจัย ดร.วนิดา พงษศกั ดิช์ าติ

Vector ขอ มลู ที่อยูในรูปของเวกเตอรอาจเปนตัวเลข หรอื ตวั อกั ษร กไ็ ด โดยสมาชกิ ในเวกเตอรตอ งเปนขอมูล
ชนิดเดียวกนั ลักษณะการเกบ็ ขอมูลของเวกเตอรใน R จะเปนเวกเตอรแ ถว (row vector)

Matrix เปน ลักษณะของการเกบ็ ขอมูลในสองมติ ิ (2 dimensions) ขอมลู ท่ีอยูในรูปของเมทริกซอาจเปน
ตวั เลข หรอื ตวั อกั ษรก็ได แตสมาชิกทกุ ตวั ในเมทริกซห นึง่ ตองเปนขอ มูลชนดิ เดียวกนั เทานน้ั

Data frame เปน ลักษณะการเกบ็ ขอมลู ในรูปตาราง ท่ีประกอบดวยเวกเตอรหนง่ึ หรอื หลายเวกเตอรมารวม
กนั โดยแตล ะเวกเตอรอาจเปน ขอ มูลชนดิ เดียวกันหรือตา งชนิดกันก็ได แตความยาวของทกุ เวกเตอร
ตอ งเทา กนั

List เปน ลกั ษณะการเกบ็ ขอ มูลที่สามารถนำ object แตล ะแบบมารวมกนั เก็บเปน list ได จะเปนขอ มูลชนิด
เดียวกันหรอื ไมก ็ได และไมจ ำกัดในเร่อื งของขนาดและความยาวของ objects ทม่ี ารวมกนั ซึ่งโดยท่วั ไป
ผลการวเิ คราะหข อง R มักอยใู นรปู ของ list

1.4 R Commander

เนอื่ งจากการใช R ในรปู ของ RGui ผูใชมักประสบปญ หาในการใชฟง กชันตาง ๆ เน่ืองจากจำรูปแบบของ
คำสง่ั ไมได หรือกำหนดคา argument ตา ง ๆ ไมถกู ตอง ทำใหผูเร่มิ ตน ใช R ในการวเิ คราะหขอมลู เชงิ สถติ ิมี
ความรสู กึ วา R เปน โปรแกรมที่ยงุ ยากซบั ซอ น และผูใ ชจ ำเปนตองมีความรใู นเร่อื งของการโปรแกรมพอสมควร
ซึ่ง Prof. John Fox ไดทราบถงึ ปญหาน้ี จึงไดพฒั นาแพคเกจของ R ชอ่ื วา [Rcmdr] ซึ่งชว ยใหการทำงาน
ใน R งายขึ้น โดยแพคเกจนี้จะสรา งอินเตอรเฟส (interface) ท่ีมีลักษณะการทำงานแบบเมนู คลายคลึงกบั
โปรแกรมสำเรจ็ รูปทางสถิติอ่นื ๆ เชน SPSS หรือ MINITAB ดงั น้นั ผูใชจงึ สามารถใช R ในการวเิ คราะหขอมลู
ไดงา ยขนึ้ อยา งไรก็ตาม หากผูใชตอ งการทำงานที่มีความซับซอ น หรอื งานที่นอกเหนอื จากท่ี Rcmdr ทำได ก็
จำเปนตอ งใช RGui เชน เดิม

1.4.1 การติดตงั้ R Commander

1. เปด โปรแกรม R ทต่ี ดิ ต้งั ไวแลว ขน้ึ มา ปรากฏหนาตาง RGui

2. เลือกเมนู Packages -> Install package(s)... จะปรากฏหนาตา ง CRAN mirror

3. ใหเ ลือก mirror ทีอ่ ยใู กลท ีส่ ดุ นน่ั คอื ของประเทศไทย จากนั้นคลกิ OK จะปรากฏหนา ตาง Packages

4. เลอื กแพคเกจช่อื Rcmdr จากนัน้ คลิก OK

5. โปรแกรมจะทำการติดตงั้ R commander ให โดยจะมีขอ ความถามวาตองการตดิ ต้งั แพคเกจที่ใชรว ม
กบั R commander หรือไม ใหตอบ YES จากนัน้ การตดิ ต้งั จะเสร็จสมบรู ณ

1.4.2 การใช R Commander

1. เปดโปรแกรม R

2. ไปท่ีเมนู Packages -> Load package จะปรากฏหนาตา ง Select one -> เลือก Rcmdr จะปรากฏ
หนาตา ง R Commander ดงั น้ี

8

การใชโ ปรแกรม R เพอ่ื การวจิ ยั ดร.วนิดา พงษศ ักดิ์ชาติ

Note: เราสามารถกำหนดให R โหลด R Commander อตั โนมตั ิทุกครัง้ ทีม่ กี ารเปด โปรแกรม R ไดโ ดยการ
เพ่ิมคำสั่งตอไปนี้ลงในไฟลช อ่ื Rprofile.site ในไดเรกทอรย่ี อ ยของ R ชอ่ื etc

local({
old <- getOption("defaultPackages")
options(defaultPackages = c(old, "Rcmdr"))
})

หนาตางของ R Commander ประกอบดว ยหนา ตา งยอยอกี 4 หนา ตาง คือ

Script Window: ท่ีหนาตา งนีผ้ ใู ชส ามารถพมิ พคำสั่ง R ไดที่นี่ จากนนั้ คลิก Submit แลว R จะทำการ
ประมวลผลคำส่ังท่ีไดรบั นอกจากนนั้ ผูใชสามารถเลอื กการใชคำส่ังตาง ๆ ในการวเิ คราะหขอมูล
จากเมนูท่ีอยูดา นบนของหนา ตา งได และสามารถบนั ทกึ ชุดคำสงั่ ที่ใชลงไฟลเพ่อื เรียกใชในคราวตอ
ไปได หรือสามารถเปด ไฟลคำส่งั (script file) ทีม่ อี ยูแลว มาใชก็ได

R Markdown: ใชสำหรบั การสรา งรายงานการทำงานของผูใช

Output Window: เปน พนื้ ทส่ี ำหรับแสดงผลการทำงานตามคำสั่งจาก Script Window

Message Window: เปนพื้นทแ่ี สดงขอ ความตา ง ๆ ท่ีเกดิ จากการใชง านคำสง่ั โดยขอ ความที่เปนสีแดง
คอื Error message ขอความสเี ขียวคือ Warnings และขอ ความสนี ำเงนิ คอื ขอมลู อน่ื ๆ

Note: กราฟจะปรากฏในอีกหนา ตา งหนึง่ แยกตางหาก เปน R Graphics Device Window โดยกราฟ
ที่ปรากฏจะเปน กราฟรปู ลา สุดท่ีประมวลผล หากตองการดูกราฟกอ นหนาใหใช page up และ page down
keys

ท่ดี า นบนของหนา ตา ง R Commander ประกอบดว ยเมนตู า งๆ ดงั นี้

9

การใชโปรแกรม R เพ่อื การวจิ ัย ดร.วนิดา พงษศ ักดิช์ าติ

File ประกอบดวยคำสัง่ ที่ใชในการเปด หรือบนั ทกึ ไฟลประเภทตา ง (Open, Save) เชน ไฟลคำส่ัง และ
ไฟลผลลพั ท และยงั มคี ำสง่ั ที่ใชในการออกจากโปรแกรมดวย (Exit)

Edit ประกอบดว ยคำสง่ั ตัด คดั ลอก วาง (Cut, Copy, Paste, เปน ตน) ที่ใชในการแกไ ขรายละเอยี ดของ
หนา ตาง script หรือ output

Data ประกอบดวยเมนยู อ ย ที่มคี ำสัง่ ในการสรางขอ มลู ใหม อา นขอมูลจากไฟล หรอื จดั การขอ มูล

Statistics ประกอบดวยเมนยู อยท่มี คี ำสัง่ เกยี่ วกับการวิเคราะหเชงิ สถติ เิ บือ้ งตน ตา ง ๆ

Graphs ประกอบดวยคำสั่งในการสรางกราฟทางสถิติ

Models ประกอบดว ยเมนูยอ ยและคำสงั่ ในการหาคา สรุปทางสถิติ การสรางชวงความเชอ่ื มั่น การ
ทดสอบสมมตฐิ าน การตรวจสอบขอ สมมติเบ้ืองตนของตวั แบบทางสถติ ิ และกราฟตาง ๆ ที่ใช
ในการตรวจสอบขอ สมมตขิ องตัวแบบทางสถิติ

Distributions ประกอบดว ยคำสง่ั เก่ียวกับการแจกแจงความนา จะเปนทางสถิติ

Tools ประกอบดว ยคำสง่ั ในการโหลดแพคเกจของ R และ Rcmdr plug-in มาใชงาน

Help ใหขอมลู เกยี่ วกบั R Commander และความชวยเหลือในการใช R Commander

1.5 การนำขอ มูลมาใชด ว ย R Commamder

การนำขอมูลเขามาใชใน R Commander สามารถทำไดหลายวิธีดว ยกัน เชน การปอ นขอ มูลเขา ไปใหม
การเรยี กไฟลข อมูลทม่ี อี ยแู ลวในรูปแบบตา ง ๆ เขามาใชงาน

1.5.1 การปอ นขอ มูลใหม

การปอ นขอ มลู ใหมโดยตรงเปน วิธที ี่เหมาะกับขอมลู ที่มีขนาดเลก็ โดยทำไดดงั น้ี

1. เลือกเมนู Data -> New data set จะปรากฏหนา ตาง New Data Set
10

การใชโ ปรแกรม R เพ่อื การวจิ ยั ดร.วนดิ า พงษศักดช์ิ าติ

2. ใสชอ่ื ของชุดขอมลู ลงไป -> OK จะปรากฏหนาตา ง Data Editor ท่มี ลี ักษณะเปน spreadsheet

3. ที่หนา ตาง Data Editor เราปอ นขอมลู งไปไดตามตองการ โดยการกำหนดชอื่ ตวั แปรใหคลกิ ท่ีชอื่
คอลมั น (V1) และสามารถพมิ พชอ่ื ตวั แปรท่ีตองการลงไปแทนท่ีไดเลย และสามารถเพม่ิ คอลมั นไดใน
กรณีที่ขอ มลู ประกอบดวยตวั แปรหลายตวั โดยคลกิ ท่ปี ุม Add column
11

การใชโ ปรแกรม R เพอ่ื การวจิ ัย ดร.วนิดา พงษศ กั ด์ิชาติ

เม่ือกำหนดช่ือตัวแปรเรยี บรอยแลว ผูใชสามารถปอ นขอ มลู ในหนาตา งนี้ไดเลย โดยปอ นขอ มูลลงไป
ตาม cell ในตารางขอมลู

4. เมื่อปอ นขอ มลู เสรจ็ ชดุ ขอ มูลน้ีจะอยูในรูปของ data frame และพรอมใชงาน จากนนั้ ใหปด หนา ตา งน้ี
ชดุ ขอมลู ทส่ี รางไวน สี้ ามารถเรยี กมาดูหรือแกไขไดโ ดยการคลิกเรียกที่ปมุ Edit data set

5. ขอมลู ชดุ ที่สรางไวน้ีมีอยูในหนวยความจำเทา นน้ั ยังไมไดถกู บนั ทกึ เปน ไฟล การบันทกึ ชุดขอมูลลงไฟล
ใหเลอื กเมนู Data -> Active data set -> Save active data set...

1.5.2 การนำขอ มลู เขา มาใชใน R จาก Textfile, EXCEL, SPSS และ MINITAB

โดยสวนใหญผูใชมกั มีการบันทึกขอ มูลไวกอ นท่ีจะทำการวิเคราะหเชงิ สถติ ิแลว ซ่งึ ไฟลเหลา นน้ั อาจอยูใน
รปู แบบตาง ๆ เชน textfile SPSS EXCEL หรอื MINITAB การเรยี กขอ มลู ท่ีอยูในไฟลรปู แบบเหลา นี้มาใชงาน
ใน R สามารถทำไดโดยงายตามชนิดของไฟล สำหรบั ไฟลขอมูลท่ีเปน textfile ขอมลู ตองถูกจัดอยูในรูปแบบ
ของ data frame โดยแตละคอลัมนคอื แตล ะตัวแปร เชน เพศ อายุ รายได เปน ตน แตละแถวคอื แตล ะ case
หรอื ขอมลู ของแตล ะคน และแถวบนสุดของไฟลคือชื่อตวั แปร

สว นไฟลขอมลู ทีเ่ ปน .xlsx ไฟล มีวธิ ีการ import file ดังน้ี

1. Data -> Import data -> from Excel file...

12

การใชโปรแกรม R เพื่อการวจิ ยั ดร.วนิดา พงษศักดิ์ชาติ

ปรากฎหนา ตาง

2. ใสชอื่ ของชุดขอ มลู สำหรับการเรยี กใชใ น R จากนัน้ คลิก OK
3. เลือกโฟลเดอร และชอื่ ไฟลท ่ตี อ งการเปด และเปด ไฟลขอมูล
4. ตรวจสอบวา ไฟลข อมูลทเ่ี ปดนน้ั ถูกตอ ง คอื ครบทุกคอลัมน ทกุ แถวหรอื ไม
5. เรียกดชู ุดขอ มลู โดยใช View data set ทห่ี นา ตา ง R Commander
สว นไฟลประเภทอนื่ ๆ กท็ ำไดเชน เดยี วกนั

13

การใชโปรแกรม R เพ่อื การวจิ ัย ดร.วนิดา พงษศ กั ด์ิชาติ

14

บทที่ 2

การใช R Commander ในการวิเคราะหขอ มูล
เบอ้ื งตน

ในบทน้ีจะศึกษาถึงการใช R Commander ในการวิเคราะหขอ มลู เบอื้ งตน ซง่ึ มีอยูดวยกันหลายวธิ ี เชน
การแจกแจงความถี่ การคำนวณหาคา สถติ ิตา ง ๆ เพื่ออธิบายเกี่ยวกบั ลักษณะของขอมลู เชน คา เฉลี่ย คา เบี่ยง
เบนมาตรฐาน เปนตน นอกจากนัน้ ยงั มีการใชก ราฟรปู แบบตาง ๆ ในการนำเสนอขอมลู ดวย

2.1 ขอ มูลและชนิดของขอ มูล

กอ นท่จี ะเร่มิ ทำการวิเคราะหขอ มูลในทางสถติ ิ เราตองทำความเขา ใจเก่ยี วกับชนิดของขอมลู กอ น เนือ่ งจาก
ขอ มูลแตละชนิดจะมีวิธีการวเิ คราะหที่แตกตางกัน ซง่ึ หากเราใชวิธีเชิงสถิติท่ีไมสอดคลองกับชนดิ ของขอ มูล จะ
ทำใหผลการวิเคราะหที่ไดไมถกู ตอ ง ไมนา เชอื่ ถือ และไมสามารถนำมาใชประโยชนได ในทางสถิติไดแบง ชนดิ
ของขอมูลออกเปนสองกลมุ ใหญ ๆ คือ

1. ขอมลู เชงิ คณุ ภาพหรอื ขอ มลู เชงิ กลมุ (Qualitative variable) คา ของขอมูลชนดิ นี้ไมใชตัวเลข แตเปน
ขอ ความ เชน เพศ (ชาย, หญงิ ) ระดบั การศกึ ษา (ตำ่ กวา ปรญิ ญาตร,ี ปรญิ ญาตร,ี ปรญิ ญาโท, สงู กวา
ปริญญาโท) เปนตน

2. ขอ มลู เชิงปรมิ าณ (Quantitative variable) ขอ มูลชนิดนี้จะมีคาเปน ตวั เลขอยา งแทจริง อาจเปนคา
แบบตอเน่อื ง หรอื ไมต อเนื่องก็ได เชน อายุ รายได คะแนนสอบ จำนวนลูกคา เปน ตน

2.2 การเตรียมขอ มูลเพื่อการวิเคราะห

เครือ่ งมือที่ใชในการเก็บรวบรวมขอ มลู มีอยูหลายชนิด เชน แบบสอบถาม แบบสัมภาษณ และแบบสังเกต
เปนตน ไมวา ผูวจิ ยั จะใชเครอื่ งมือใดในการเกบ็ รวบรวมขอ มลู เม่อื ไดขอ มลู มาแลวจะตอ งมีการจัดเตรยี มกอน
เร่ิมตนวิเคราะหขอ มูล ในท่ีนี้จะสมมตวิ าใชแบบสอบถามเปน เคร่อื งมือ ดังตวั อยา งตอไปน้ี

การสรา งรหัส และการกำหนดชอ่ื ตวั แปร
ตัวอยา งแบบสอบถาม

15

การใชโปรแกรม R เพอื่ การวิจัย ดร.วนดิ า พงษศ ักด์ิชาติ

สว นที่ 1 ขอ มลู สวนบุคคล สำหรบั เจา หนา ท่ี
[ ] [ ] ID
1. เพศ [ ] 1. ชาย [ ] 2. หญงิ
[ ] SEX
2. อายุ ป [ ] AGE
[ ] STATUS
3. สถานภาพ
[ ] 1. โสด [ ] 2. แตงงาน [ ] 3. หมาย/หยา

จากตัวอยาง ตัวแปร ID คอื หมายเลขแบบสอบถาม มี 2 ชอง หมายความวา ตัวเลขท่ีใชจะเปน ตวั เลขสอง
หลัก

ในขอ 1. ตัวแปร SEX ใชเ ลข 1 แทนเพศชาย และเลข 2 แทนเพศหญงิ

ในขอ 2. ตัวแปร AGE ใชตัวเลขอายทุ ี่ผตู อบแบบสอบถามตอบ

ในขอ 3. ตัวแปร STATUS ใชเ ลข 1 แทนโสด 2 แทนแตงงาน 3 แทนหมายหรอื หยา

ตัวอยา งการลงรหัสแบบสอบถาม

สวนท่ี 1 ขอ มลู สวนบุคคล สำหรบั เจาหนา ท่ี
[0] [1] ID
1. เพศ [ ] 1. ชาย [ ] 2. หญงิ
[1] SEX
2. อายุ 20 ป [20] AGE
[1] STATUS
3. สถานภาพ
[ ] 1. โสด [ ] 2. แตง งาน [ ] 3. หมา ย/หยา

16

การใชโปรแกรม R เพ่ือการวิจยั ดร.วนดิ า พงษศ กั ดช์ิ าติ

แบบสอบถามท่ขี อคำถามผูตอบสามารถเลอื กคำตอบหลายคำตอบ [ ] TV1
[ ] TV2
โปรดเลือกรายการโทรทศั นท่ีทานชอบดู (เลอื กไดม ากกวา 1 ขอ ) [ ] TV3
[ ] 1. ขา ว [ ] TV4
[ ] 2. สารคดี
[ ] 3. ละคร
[ ] 4. เกมโชว

จากตัวอยา งนี้จะเหน็ ไดวา ผูตอบสามารถเลอื กตอบไดมากกวา 1 ตวั เลือก ดงั นน้ั การลงรหสั จะใหเลข 1
แทนความหมายที่ผูตอบเลอื กตอบตัวเลอื กน้ัน และ 0 แทนความหมายท่ผี ตู อบไมเลือกตอบตวั เลอื กนัน้ ดงั น้ี

โปรดเลอื กรายการโทรทัศนทท่ี า นชอบดู (เลอื กไดมากกวา 1 ขอ) [1] TV1
[ ] 1. ขา ว [1] TV2
[ ] 2. สารคดี [0] TV3
[ ] 3. ละคร [0] TV4
[ ] 4. เกมโชว

ขอคำถามทีใ่ หผตู อบเรยี งลำดับขอคำตอบ

ใหทานเรยี งลำดับรายการโทรทศั นที่ทานชอบมากทส่ี ุดเปน ลำดบั ที่ 1 และรายการท่ีทานชอบรองลงมา

เปน ลำดบั ที่ 2 3 และ 4 [2] TV1
[2] 1. ขาว

[1] 2. สารคดี [1] TV2

[3] 3. ละคร [3] TV3

[4] 4. เกมโชว [4] TV4

จากตวั อยาง เปนการลงรหัสโดยใชอันดับท่ีเลอื ก เชน ผูตอบเลือกสารคดีเปน อนั ดับท่ี 1 จึงใส 1 ในชอง
TV2 เลอื กขาวเปนอนั ดับท่ี 2 จงึ ใส 2 ในชอ ง TV1 เลอื กละครเปนอนั ดบั ที่ 3 จึงใส 3 ในชอง TV3 และเลอื กเกม
โชวเ ปน อันดบั ท่ี 4 จงึ ใส 4 ในชอ ง TV4

หลงั จากที่กำหนดวธิ ีการลงรหัสแบบสอบถามเรยี บรอยแลว ซ่ึงข้นั ตอนนี้ควรทำกอ นการเกบ็ ขอมูล เมอื่
เกบ็ ขอ มลู เรยี บรอ ยแลว นำแบบสอบถามท่ีรวบรวมไดทง้ั หมดมาลงรหสั โดยสามารถทำไดโดยใชโปรแกรมท่ี
เหมาะกบั การเก็บขอ มูล เชน R Commander EXCEL SPSS หรอื Textfile ก็ได

สมมติไดขอมูลดงั นี้

17

การใชโปรแกรม R เพ่อื การวิจยั ดร.วนดิ า พงษศ ักด์ชิ าติ

ID SEX AGE STATUS
01 1 28 1
02 2 35 2
03 1 29 1
04 1 32 3
05 2 34 2
06 1 28 2
07 2 25 1
08 1 32 1
09 2 33 1
10 2 38 2
11 2 39 3
12 2 34 3
13 2 32 1
14 1 26 1
15 1 27 2
16 2 36 2
17 1 32 2
18 1 33 1
19 1 29 1
20 2 25 3

เม่ือนำขอ มลู ชุดน้ีมาวเิ คราะหตอ งมีการกำหนดชนดิ ของตวั แปรกอ น ซง่ึ ในขอ มลู ชุดนี้ ตัวแปร SEX และ
STATUS เปน ตวั แปรเชงิ กลุม สวนตวั แปร AGE เปน ตวั แปรเชิงปรมิ าณ เมอื่ ใช R Commander จงึ ตองมีการ
กำหนดชนดิ ของตัวแปร SEX และ STATUS ใหเปน Factor ดงั นี้

1. เลอื กเมนู Data -> Manage variables in active data set -> Convert numeric variable to
factors...

จะไดหนาตา ง

18

การใชโ ปรแกรม R เพ่อื การวจิ ยั ดร.วนดิ า พงษศกั ด์ชิ าติ

2. เลือกตัวแปรท่ีตอ งการเปลีย่ นใหเปน factor เชน SEX

3. ผูใชสามารถกำหนดให R เก็บคาของตวั แปรที่เปลยี่ นแปลงแลว ในตวั แปรใหมกไ็ ด หรือเก็บไวในชื่อเดมิ
กไ็ ด ในตัวอยา งนจ้ี ะเกบ็ ไวในชื่อเดิม

4. หากคลกิ เลือกที่ชอ ง Supply level names แลวคลิก OK จะไดหนา ตางสำหรับการกำหนดช่อื ของ
แตล ะระดบั ของตวั แปร ดังน้ี

จากตัวอยา ง กำหนดให 1 เปน Male และ 2 เปน Female
สำหรับตวั แปร STATUS กำหนดดงั น้ี

19

การใชโปรแกรม R เพื่อการวิจัย ดร.วนดิ า พงษศักดชิ์ าติ

ซ่งึ จากตัวอยาง กำหนดให 1 เปน Single ให 2 เปน Married และ 3 เปน Divorce
เราสามารถตรวจสอบชนิดของตัวแปรไดด วยการใชคำสงั่

Statistics -> Summaries -> Active data set

ไดผลดงั น้ี

ID SEX AGE STATUS TV

1 : 1 Male :10 Min. :25.00 Single :9 Min. :1.00

2 : 1 Female :10 1st Qu. :28.00 Married :7 1st Qu. :1.75

3 :1 Median :32.00 Divorce :4 Median :2.00

4 :1 Mean :31.35 Mean :2.40

5 :1 3rd Qu. :34.00 3rd Qu. :3.00

6 :1 Max. :39.00 Max. :4.00

(Other) :14

จากผลท่ีได จะเห็นไดวา ตัวแปร ID เปนตัวอักษร (character) ซ่ึงไมสามารถนำมาวิเคราะหได ตัวแปร
SEX และ STATUS เปนตวั แปรเชิงกลุมหรือ factor แบงเปนระดบั ตามท่ีเรากำหนด และ AGE เปน ตวั แปรเชิง
ปริมาณมคี าตำ่ สุดเทากับ 25 คา สุงสุดเทากับ 39 และคาเฉลี่ยเทากับ 31.35 เปน ตน

ในขน้ั ตอนนี้ หากตรวจสอบแลวพบวา ตวั แปรในชุดขอมูลไมไดมีชนิดของตวั แปรตามท่ีควรจะเปน ก็
สามารถทำการเปล่ยี นได

20

การใชโปรแกรม R เพ่อื การวิจัย ดร.วนดิ า พงษศ ักดิ์ชาติ

2.3 การแจกแจงความถี่

การแจกแจงความถเี่ ปน วธิ ีเชงิ สถติ ิท่ใี ชก บั ตวั แปรเชงิ กลุม หรือตวั แปรเชงิ คุณภาพ

2.3.1 การใช R Commander สำหรบั การแจกแจงความถแี่ บบทางเดยี ว

1. เลอื กเมนู Statistics -> Summaries -> Frequency distributions...
จะปรากฏหนาตา ง Frequency Dsitributions ดงั นี้

ตัวแปรทีป่ รากฏจะเปนตัวแปรเชงิ กลุมเทานนั้
2. เลือกตวั แปรที่ตองการแจกแจงความถ่ี ในที่นี้จะเลือกตวั แปร SEX และ STATUS ไดผลการวิเคราะห

ดังนี้

Male Female
10 10

Male Female
50 50

Single Married Divorce
974

Single Married Divorce
45 35 20

โดย output ในสวนแรกจะแสดงความถี่ของแตล ะกลมุ และ output สวนท่สี องจะแสดงรอยละของแตละกลมุ

2.3.2 การใช R Commander สำหรับการแจกแจงความถแ่ี บบสองทาง

1. เลอื กเมนู Statistics -> Contingency tables -> Two-way tables...
จะปรากฏหนา ตาง Two-Way Table ดังนี้
21

การใชโปรแกรม R เพ่อื การวจิ ัย ดร.วนดิ า พงษศักดชิ์ าติ

2. ท่ีชอ ง Row variable ใหเลอื กตัวแปรท่ีตอ งการไวดา นแถวของตาราง จากตวั อยางเลอื ก SEX ท่ีชอง
Column variable ใหเ ลือกตวั แปรที่ตองการไวด านคอลมั น จากตวั อยางเลอื ก STATUS

3. คลิกทป่ี ุม Statistics ปรากฎหนาตาง

22

การใชโปรแกรม R เพื่อการวจิ ยั ดร.วนิดา พงษศักดช์ิ าติ

เลอื กการแสดงรอยละตามตอ งการ ตองการรอ ยละทางดา นใด ใหค ลกิ ท่ีชองที่ตองการ
รอ ยละดา นแถว เลอื ก Row percentages
รอยละดา นคอลัมน เลอื ก Column percenterages
รอยละรวม เลอื ก Percentages of total
ไมต องการรอยละ เลือก No percentages
ในท่นี ้ีเลือกรอ ยละดานแถว ไดผลดงั นี้

STATUS
SEX Single Married Divorce
Male 6 3 1
Female 3 4 3

> rowPercents(.Table) # Row Percentages
STATUS

SEX Single Married Divorce Total Count
Male 60 30 10 100 10
Female 30 40 30 100 10

ตารางบนแสดงความถห่ี รอื จำนวนนับในแตล ะกลมุ ตารางลางแสดงคา รอ ยละดานแถว

23

การใชโปรแกรม R เพอ่ื การวิจยั ดร.วนิดา พงษศ ักดช์ิ าติ

2.4 การคำนวณคาสถติ เิ บื้องตน

สำหรบั ขอมูลเชงิ ปริมาณ เราสามารถอธิบายถึงลักษณะของขอ มลู เบื้องตนได โดยใชคาสถิติ เชน คา เฉล่ยี
คามธั ยฐาน และคาเบยี่ งเบนมาตรฐาน เปน ตน

การใช R Commander ในการหาคาสถติ เิ หลา นี้ ทำไดดงั น้ี

1. เลอื กเมนู Statistics -> Summaries -> Numerical Summaries...
จะไดห นาตางตอ ไปน้ี

2. เลือกตวั แปรที่ตอ งการคำนวณคาสถติ ิเบื้องตน โดยคลิกท่ีตวั แปรนนั้ จะเห็นวา R แสดงเฉพาะตัวแปร
ทม่ี ีชนิดเปน numeric เทา นน้ั

3. เลือกคาสถิติทีต่ องการหา

24

การใชโ ปรแกรม R เพอื่ การวิจยั ดร.วนิดา พงษศักดิ์ชาติ
4. คลิก OK ไดผ ลลพั ธดังน้ี

mean sd cv 0% 25% 50% 75% 100% n

31.35 4.107439 0.1310188 25 28 32 34 39 20

นอกจากการคำนวณคา สถิติเบ้ืองตน ตามตวั แปรแตล ะตัวแปรแลว เรายังสามารถใช คำนวณคา สถติ ิเหลา น้ี
จำแนกตามกลมุ ยอ ยของตวั แปรเชงิ กลุมที่สนใจไดอีกดว ย เชน เราตอ งการหาอายุเฉลย่ี ของผูตอบแบบสอบถาม
จำแนกตามเพศ สามารถทำไดดังนี้

1. เลอื กเมนู Statistics -> Summaries -> Numerical Summaries...
2. เลอื กตัวแปรทต่ี อ งการ ในทน่ี ค้ี อื AGE
3. คลกิ Summarize by groups... จะปรากฏหนาตา ง

4. เลือกตวั แปรเชิงกลมุ ที่ตอ งการ ในทีน่ ีค้ ือ SEX จากน้นั คลิก OK
5. คลิกท่ีปมุ Statistics เลอื กคา สถติ ทิ ี่ตอ งการ ในที่นเี้ ลือก Mean

25

การใชโปรแกรม R เพ่อื การวจิ ัย ดร.วนดิ า พงษศักด์ิชาติ

6. คลกิ OK ไดผ ลลพั ธด งั นี้

mean n
Male 29.6 10
Female 33.1 10

2.5 การสรางกราฟเพอ่ื การนำเสนอขอ มูล

การนำเสนอขอมูลดว ยกราฟเปนวิธกี ารของสถิติเชิงพรรณณา ซึง่ กราฟที่ใชมีอยดู ว ยกันหลายรูปแบบ ไดแ ก
กราฟแทง กราฟวงกลม และฮสิ โตแกรม เปน ตน

2.5.1 การสรา งกราฟสำหรบั ขอ มลู เชิงกลมุ

สำหรับขอ มลู เชงิ กลุม กราฟท่ีนิยมใชในการนำเสนอขอ มูล ไดแ ก กราฟแทง และกราฟวงกลม การใช R
Commander สรางกราฟเหลา น้ี ทำไดโดย

1. เลือกเมนู Graphs -> Bar graph... จะปรากฏหนา ตาง
26

การใชโปรแกรม R เพ่อื การวิจยั ดร.วนิดา พงษศักดชิ์ าติ

2. เลอื กตวั แปรทต่ี อ งการสรางกราฟ (ในท่นี ี้เลอื กตวั แปร STATUS) จากนั้นคลกิ OK จะไดกราฟดงั รปู

27

การใชโปรแกรม R เพ่ือการวจิ ัย ดร.วนดิ า พงษศ ักด์ิชาติ

Note: การสรางกราฟวงกลมทำไดดว ยวธิ ีเดียวกนั เพยี งแตเปล่ยี นจากคำสัง่ Bar graph เปน Pie
chart เทานน้ั

2.5.2 กราฟสำหรบั ขอมลู เชิงปริมาณ

สำหรับขอมูลเชิงปรมิ าณ กราฟที่นิยมใชในการนำเสนอขอ มูลไดแ ก ฮิสโตแกรม stem and leaf display
และ boxplot การใช R Commander ในการสรางกราฟเหลา นที้ ำได ดังนี้
การสรา งฮสิ โตแกรม

1. เลอื กเมนู Graphs -> Histogram จะปรากฏหนา ตาง Histogram ดังนี้

2. เลอื กตัวแปรทตี่ องการสรา งกราฟ (ตองเปนตัวแปรเชงิ ปริมาณ) ในทนี่ ้ีเลือก AGE
28

การใชโ ปรแกรม R เพื่อการวจิ ัย ดร.วนิดา พงษศักด์ชิ าติ

3. เลอื กลักษณะการแสดงกราฟ วาจะใหแสดงในรูปความถี่ (Frequency counts) รอยละ (Percentage)
หรือความนาจะเปน (Density) ใหคลิกที่ Options ไดหนาตา งดังนี้

ในทน่ี ีเ้ ลอื ก Percentages
นอกจากน้ันยังสามารถใสช อ่ื กราฟไดท่ี Graph title ในรปู นีใ้ สค ำวา "Histigram for Age"

4. คลกิ OK จะไดก ราฟดังรปู ขา งลา ง

การสรา งกราฟ Stem and Leaf
กราฟ Stem and Leaf เปน กราฟท่ีมีลักษณะคลา ยกราฟแทงในแนวนอน แตใชคาจรงิ ของขอ มูลมาแสดง

ในกราฟแทน การใช R Commander สรา งกราฟชนดิ นี้ทำไดด ังน้ี

29

การใชโ ปรแกรม R เพอ่ื การวิจยั ดร.วนดิ า พงษศักดิ์ชาติ

1. เลอื กเมนู Graphs -> Stem and leaf display... จะปรากฏหนา ตา ง Stem and Leaf Display
ดงั นี้

2. คลิกเลือกตวั แปรทต่ี องการสรา งกราฟ (ตอ งเปน ตวั แปรเชิงปรมิ าณเทาน้นั ) ในทน่ี เี้ ลือก AGE
3. คลิกทป่ี ุม Options เพือ่ เลอื กตวั เลือกตา ง ๆ ตามความตอ งการ

30

การใชโ ปรแกรม R เพือ่ การวิจัย ดร.วนดิ า พงษศ ักด์ชิ าติ

Leaf Digit ใชก ำหนดหนว ยของ leaf ท่สี ามารถปรับไดครัง้ ละ 10 หนวย

Parts Per Stem ใชกำหนดจำนวน stem ดังนี้

• ถา กำหนดใหเปน 1 จะมีจำนวน stem เปน 0 1 2 3 4
• ถากำหนดเปน 2 จะมจี ำนวน stem เปน 00 11 22 33 44

Style of Divided Stem ใชกำหนดวธิ ีการแบง stem ในที่น้ใี ช Repeated stem digits

Other Options ใชเ ปลี่ยนวธิ กี ารแสดงคาตาง ๆ ในผลลพั ธ

Trim outliers ใชจัดการเก่ยี วกับคาผดิ ปกติของตวั แปร โดยใหแยกคาผิดปกติแสดงออกมา
ตา งหากไมตองไปรวมไวใ น stem and leaf

Show depth ใหแสดงจำนวนขอ มลู ท่ีแสดงในแถวนนั้ ๆ
Reverse negative leaves กรณีทีม่ ีขอมลู มีคา เปนลบ ใหเ รียงลำดับขอมลู ตามหลักคณิตศาสตร

4. คลกิ OK จะไดผลลัพธดงั น้ี

1 | 2: represents 12
leaf unit: 1

n: 20
2 2 | 55
4 2 | 67
8 2 | 8899

3|
(6) 3 | 222233
6 3 | 445
3 3|6
2 3 | 89

จากกราฟที่ได จะสรุปไดวา อายุของผูตอบแบบสอบถามที่นอ ยที่สุดคอื 25 ป อายุมากท่ีสุดคือ 39 ป และ
มอี ายุ 32 ถงึ 33 ปมากทส่ี ดุ

การสราง Boxplot
1. เลือกเมนู Graphs -> Boxplot... จะปรากฏหนา ตาง ดังน้ี
31

การใชโ ปรแกรม R เพ่ือการวิจยั ดร.วนิดา พงษศ ักดิช์ าติ

2. เลอื กตัวแปรท่ตี อ งการสรางกราฟ ในท่นี ้เี ลอื ก AGE
3. หากตอ งการสราง boxplot แยกตามกลุมของตวั แปรเชงิ กลุม ท่ีสนใจ เชน เพศ ใหคลิกเลอื ก Plot by

groups... จะปรากฏหนา ตาง Groups ดงั น้ี

4. ในหนา ตางจะปรากฏเฉพาะตัวแปรท่ีกำหนดไวเปน Factor เทา น้นั ใหคลิกเลือกตวั แปรท่ีตองการ ในที่
น้ีเลอื ก SEX จากนน้ั คลกิ OK

5. ที่ปมุ Options สามารถเลอื กกำหนดการแสดงคา Outlier ได

32

การใชโ ปรแกรม R เพ่ือการวจิ ยั ดร.วนิดา พงษศ กั ด์ชิ าติ
6. คลิก OK

33

การใชโปรแกรม R เพ่อื การวจิ ัย ดร.วนิดา พงษศ กั ด์ิชาติ

34

บทท่ี 3

การทดสอบสมมตุ ิฐานทางสถิติ

3.1 หลักการของการทดสอบสมมตุ ิฐาน

การทดสอบสมมุตฐิ านทางสถติ ิเปน วิธีการที่ผูวิจัยสามารถนำมาใชในการตรวจสอบขอสมมตุ ิหรือขอ สงสัย
เก่ียวกับการวิจัยได ซ่งึ ขอ สมมุติหรอื ขอ สงสยั นี้เรยี กวา สมมตุ ิฐานทางการวจิ ัย (Research hypothesis) ซ่ึง
การทดสอบสมมตุ ิฐานนี้จะใชความรูจากขอมลู ตวั อยางท่ีเก็บรวบรวมมาได โดยเปลี่ยนสมมตุ ฐิ านทางการวจิ ยั
ใหเปนสมมุติฐานทางสถิติ (Statistical hypothesis) ซึ่งข้นั ตอนของการทดสอบสมมตุ ิฐานสรุปไดดงั น้ี

1. ตง้ั สมมตุ ฐิ านทางสถติ ิ
2. กำหนดระดับนัยสำคัญของการทดสอบ
3. เลือกวธิ กี ารทางสถิติที่เหมาะสม
4. หาขอบเขตของการตดั สินใจ
5. คำนวณคาสถิติจากขอมลู ตวั อยาง
6. ตดั สินใจวาจะปฏิเสธหรือยอมรับสมมตุ ิฐาน
7. สรุปผลการทดสอบท่ไี ด

3.1.1 การตั้งสมมุตฐิ านทางสถติ ิ

เปน ขนั้ ตอนแรกของการทดสอบสมมตุ ฐิ าน โดยสมมุติฐานทางสถิตมิ ีอยดู วยกนั 2 ชนดิ ไดแก

1. สมมุตฐิ านหลัก (Null hypothesis) ใชสญั ลักษณ H0 โดยตอ งกำหนดไวในความหมายวา เทากบั ไม
แตกตาง ไมนอ ยกวา ไมมากกวา ไมม ีความสมั พนั ธกัน เปน ตน ซึ่งอาจกำหนดในรูปสญั ลักษณทางสถิติ
เชน µ (คาเฉลี่ยของประชากร) p สดั สวนของสง่ิ ท่ีสนใจในประชากร หรือกำหนดในรูปขอความกไ็ ด เชน

H0 : รายไดเฉล่ียตอเดือนของคนไทยเทากับ 5000 บาท หรอื H0 : µ = 5000
35

การใชโ ปรแกรม R เพ่อื การวจิ ยั ดร.วนิดา พงษศักดช์ิ าติ

2. สมมุติฐานทางเลอื ก (Alternative hypothesis) ใชส ญั ลักษณ Ha เปน สมมุตฐิ านท่ีตอ งตง้ั คูและมีความ
หมายตรงขา งกบั สมมตุ ิฐานหลกั เสมอ เชน

Ha : รายไดเ ฉล่ียตอเดอื นของคนไทยไมเทา กับ 5000 บาท หรือ H0 : µ ̸= 5000

การตงั้ สมมุติฐานทางสถิติจะตองใชส มมตุ ิฐานทางการวจิ ยั เปน แนวทาง ดังตัวอยางตอไปน้ี

สมมุติฐานทางการวิจัย สมมุติฐานทางสถติ ิ
1. คนไทยมีอายขุ ยั เฉลีย่ 73 ป
H0 : µ = 73
Ha : µ ≠ 73

2. คนไทยอายุ 15 ปข ้ึนไป มากกวา รอ ยละ 30 มภี าวะอว น H0 : p ≤ 0.30
Ha : p > 0.30

3. คนไทยเพศหญงิ มอี ายุยนื กวา เพศชาย H0 : µหญงิ ≤ µชาย
Ha : µหญิง > µชาย

4. ผหู ญงิ ปว ยเปนโรคมะเร็งปอดนอ ยกวาผชู าย H0 : pหญงิ ≥ pชาย
Ha : pหญงิ < pชาย

ประเภทของสมมตุ ฐิ าน
การทดสอบสมมุตฐิ านในทางสถิติจะมีอยูดว ยกันสองประเภท ไดแ ก

1. การทดสอบแบบสองทาง (Two-tail test) เปนการทดสอบท่ีใหผลสรปุ แบบกวาง ๆ ในความหมาย
ของ การเทากับ หรือ ไมเทา กบั มคี วามสมั พันธ หรอื ไมม ีความสัมพนั ธ เชน ตวั อยา งท่ี 1 ในตารางดาน
บน

2. การทดสอบแบบทางเดียว (One-tail test) เปนการทดสอบที่สามารถสรปุ ผลไดดานใดดา นหน่งึ เชน
มากกวา นอ ยกวา เชน ตัวอยางที่ 2 - 4 ในตารางดา นบน

3.1.2 การกำหนดระดบั นัยสำคัญ

ระดบั นยั สำคญั ที่ใชในการทดสอบสมมุตฐิ าน ถอื เปน เกณฑในการตัดสนิ ใจวาผูวิจัยจะยอมรบั (Accept)
หรือปฏิเสธ (Reject) สมมุติฐานหลักในทางสถติ ิ โดยระดบั นัยสำคญั (Level of significant) ใชสัญลักษณ α
หมายถงึ ความนาจะเปนหรอื โอกาสที่ผูวจิ ยั จะปฏเิ สธ H0 เมื่อ H0 เปน จริงหรอื ถกู ตอง ซงึ่ ถือวา เปน โอกาสท่ีผู
วิจยั จะตัดสนิ ใจผิด การตดั สินใจผิดแบบนี้ เรียกวา ความคลาดเคลือ่ นประเภทที่ 1 (Type I error)

ในวจิ ัยโดยทั่วไป ผูวิจยั จะเปน ผูกำหนดระดับนยั สำคัญไวลวงหนา กอนการทดสอบสมมุตฐิ านเสมอ โดย
ระดับนยั สำคญั ที่นิยมใช คอื 0.01 0.05 และ 0.10 การเลือกระดบั นยั สำคัญเทา ใดนนั้ ขึน้ อยูกบั ความเหมาะสม
และความเสยี ที่จะเกดิ ขึ้นหากมคี วามคลาดเคลื่อนของการตดั สินใจเกดิ ข้นึ หากผลเสียท่ีเกดิ ขึน้ ไมร นุ แรงมากนกั
เชน ไมไดทำใหเกิดการบาดเจบ็ ลมตาย ก็อาจระดบั นยั สำคญั 0.05 หรือ 0.01 แตหากผลเสยี ท่ีเกดิ ขึน้ อาจกอ

36

การใชโปรแกรม R เพ่ือการวจิ ยั ดร.วนิดา พงษศ กั ดิ์ชาติ

ใหเกดิ ความเสยี หายอยา งมาก กอ็ าจตอ งใชระดบั นัยสำคัญตำ่ ๆ เชน ในงานวจิ ัยทางการแพทยอ าจตองใชระดับ
นัยสำคญั 0.01 หรือ 0.001

3.1.3 การเลอื กวธิ ีการทางสถติ ิหรอื ตวั สถติ ิทดสอบ

การเลือกวธิ ีการทางสถิติหรอื ตวั สถติ ิทดสอบเปน ขนั้ ตอนที่ตอ งอาศยั ความรูในทางสถิติของผูวิจัยพอ
สมควร เพอ่ื ใหวิธีการทางสถติ ิที่เลอื กเปนวธิ ีท่ีถกู ตองเหมาะสม ซ่ึงจะสงผลใหผลการทดสอบและขอสรุปท่ี
ไดถกู ตองและเช่อื ถือได ในการทดสอบเรื่องหน่ึง มกั มีวิธีการทางสถิติใหเลอื กใชไดหลายชนดิ แตวธิ ีใดจะเปน
วิธีท่ีเหมาะสม ผูวิจยั ตองพิจารณาถงึ ขอ สมมุติเบื้องตน (Assumption) หรอื ขอ กำหนดของวิธีการนั้น ๆ วา
สอดคลอ งกับชนิดของขอ มูลและลกั ษณะของขอมูลที่มีอยูหรอื ไม รวมทั้งตอ งคำนึงดวยวาตัวสถติ ิทดสอบนนั้
สามารถใชในการตอบวัตถปุ ระสงคของการวจิ ัยไดหรอื ไม และผูวิจัยควรคำนงึ ไวเสมอวา ผูวจิ ยั ควรตวั สถติ ิ
ทดสอบที่งา ยทสี่ ุดที่สามารถตอบวัตถุประสงคของการวิจัยได คำวา "งาย" ในที่นี้หมายความวา งา ยตอการใช
งายตอการวเิ คราะหการคำนวณ และงายตอ การแปลความหมายของคาสถิติท่ีได เพราะหากผูวจิ ยั เลือกวิธีการ
ทางสถิติท่ีซับซอ นมากเกนิ ไป โดยที่ไมม ีความรูทางสถติ ิในเรอ่ื งนัน้ ๆ อยา งเพยี งพออาจทำใหเกิดผลเสยี ได น่นั
คือ อาจมีการคำนวณและขอมลู ผดิ พลาด และการแปลความหมายของคา สถติ ิตาง ๆ จะมีความซับซอนและ
ยากมากข้ึน ซงึ่ อาจทำใหไดขอ สรุปที่ผิดไปจากความเปน จรงิ ได อยางไรกต็ าม หากในงานวจิ ยั นั้นจำเปนตองใช
วิธีการทางสถิติข้นั สงู ซง่ึ มีความซบั ซอ น ผูวิจยั ควรจะศึกษาถึงหลักการและเงอ่ื นไขของวิธีเหลา นัน้ ใหเขาใจเสยี
กอนที่จะนำไปใช หรืออาจนำงานวจิ ยั นั้นไปปรกึ ษานกั สถิติเพอื่ ขอคำแนะนำในการใชวิธีการทางสถิติท่ีเหมาะ
สมได

3.1.4 ขอบเขตของการตัดสนิ ใจ

ขอบเขตของการตัดสนิ ใจคือคา ทางสถิติที่ใชสำหรบั การตัดสนิ ใจวาจะยอมรับหรือปฏเิ สธสมมตุ ฐิ านหลัก
ซึง่ โดยทว่ั ไปมอี ยูดวยกนั 2 วิธี ไดแ ก

• ใชต ารางสถิติ

• ไมใชตารางสถิติ

ในทน่ี ้เี ราจะพิจารณาถึงเฉพาะวธิ ที ี่ 2 เทาน้ัน เนอ่ื งจากวธิ ีแรกนน้ั นักวิจยั ตองมีตารางสถิติสำหรับวธิ ีการทดสอบ
ทางสถติ ิท่ีใชอยูดวยทกุ ครงั้ ซ่งึ ไมคอยสะดวกในการทำงานมากนัก อกี ประการหนง่ึ ตารางสถติ ิสำหรบั วิธีการ
ทางสถติ ิวิธีหนึง่ อาจมีอยูหลายตาราง และมีวิธีการอานคา ที่แตกตา งกัน ทำใหผูใชท่ีไมมีความรูทางสถิติดีพอ
อาจเกิดความสับสน และอานคา ผดิ ได สว นวธิ ีท่ีสองนนั้ ไมจำเปน ตอ งใชตารางสถิติแตจะใชคา สถิติคาหนึ่งแทน
คา สถติ ินี้เรยี กวาคา p-value หมายถึงความนาจะเปน หรอื โอกาสคา สถิติทดสอบจะมีคามากกวาคาท่ีคำนวณ
ไดจากขอมลู ตวั อยา ง หรือคอื ความนาจะเปน ท่ีจะปฏเิ สธสมมุติฐานหลกั ท่ีคำนวณไดจากขอมูลตวั อยาง เม่ือ
สมมตุ ิฐานหลักเปนจรงิ เนอื่ งจาก p-value เปนความนา จะเปนจึงมีคา 0 - 1 เทา น้ัน จะสงั เกตเห็นไดวา คา p-
value และระดบั นยั สำคญั α มีความหมายเหมอื นกนั นั่นคอื ทงั้ สองคา ตา งก็เปนความนา จะเปน ในการปฏิเสธ
สมมตุ ิฐานหลกั เม่ือสมมุติฐานหลักเปน จริงทัง้ คู แตทม่ี าของคาสองคา น้ีแตกตา งกัน โดยท่ีระดบั นัยสำคัญ α นัน้
ผูว จิ ยั เปนผกู ำหนดเอง เรยี กวา nominal value แตคา p-value นน้ั ไดม าจากการคำนวณโดยใชข อ มูลตวั อยา ง
ทีเ่ กบ็ รวบรวมมา ดังนนั้ ในการทดสอบสมมตุ ิฐาน เราจงึ สามารถใชค า p-value เปรียบเทียบกบั ระดบั นยั สำคัญ
α ในการตดั สนิ ใจได ซึง่ วิธีการใชคา p-value ในการตดั สินใจท่จี ะปฏเิ สธหรอื ยอมรับสมมุตฐิ านหลกั ทำไดด ังน้ี

• ยอมรับสมมุติฐานหลกั H0 เม่ือ p-value มากกวา หรือเทา กบั ระดับนยั สำคัญ α

37

การใชโ ปรแกรม R เพ่อื การวจิ ยั ดร.วนิดา พงษศ ักด์ชิ าติ

• ปฏเิ สธสมมุติฐานหลกั H0 เมือ่ p-value นอ ยกวา ระดบั นัยสำคญั α

3.1.5 การหาคาสถติ ิทดสอบจากขอมูลตัวอยาง

คาสถิติทดสอบน้ีคำนวณหาไดจากขอ มูลตัวอยา งท่ีเก็บรวบรวมมาได โดยมีสตู รหรือวธิ ีการคำนวณท่ีแตก
ตางกันไปตามตวั สถติ ิทดสอบท่ีเลอื กใช เมือ่ ไดคา สถิติทดสอบแลวจึงจะนำคา ท่ีไดไปเปรียบเทยี บกบั ขอบเขต
ของการตดั สินใจดังท่กี ลาวมาแลว

3.1.6 การตัดสนิ ใจทจ่ี ะปฏเิ สธหรอื ยอมรบั สมมตุ ิฐาน

ในการตดั สินใจที่จะปฏเิ สธหรอื ยอมรับสมมตุ ฐิ านหลักน้ัน ผูวจิ ัยตอ งนำคา สถติ ิทดสอบที่ไดไปเปรยี บเทียบ
กบั เกณฑหรือขอบเขตของการตดั สนิ ใจที่หาไวกอนหนานี้ แลว จงึ ทำการตัดสนิ ใจวา จะปฏิเสธหรือยอมรับ
สมมุติฐานหลกั (การตดั สนิ ในจะกระทำกับสมมุตฐิ านหลกั เทา นัน้ เน่ืองจากสมมุตฐิ านหลักและสมมุตฐิ านทาง
เลือกมีความหมายตรงขา มกนั ดังนนั้ เม่อื ปฏิเสธ H0 กเ็ ทา กบั ยอมรบั Ha นั่นเอง)

3.1.7 การสรปุ ผลการทดสอบ

การสรปุ ผลการทดสอบเปนขั้นตอนสุดทา ยของการทดสอบสมมุติฐาน ผูวิจัยตองสรปุ ผลการทดสอบท่ีได
เพ่อื นำไปสูขอ สรปุ ของการวิจัย ซงึ่ ในการสรุปผลผูวิจยั ควรระบุเกณฑท่ีใชในการทดสอบ หรือระดบั นยั สำคญั
α ดว ย ในการสรุปผลไมจำเปน ตอ งใชสัญลกั ษณทางสถิติ แตควรใชภาษาหรอื คำอธิบายท่ีเขาใจงา ย คนท่วั ไป
สามารถเขาใจได โดยยดึ สมมตุ ฐิ านทางการวิจยั เปนหลกั ในการสรปุ ผล เชน สมมตุ ฐิ านทางการวจิ ัยกำหนดไววา
"คนไทยมีรายไดเฉลยี่ ตอ เดอื นนอยกวา 6000 บาท" ซ่งึ มสี มมุติฐานทางสถิตคิ ือ

H0 : µ ≥ 6000
Ha : µ < 6000

จากขอมลู ตัวอยางท่ีเกบ็ รวบรวมมาได เมือ่ ทำการทดสอบสมมุติฐานพบวา เกดิ การปฏิเสธสมมุติฐานหลัก จงึ
สรุปไดว า "คนไทยมีรายไดเฉลย่ี นอยกวา 6000 บาทตอเดอื น ทรี่ ะดบั นัยสำคญั 0.05 (หรือท่เี กณฑ 5%)"

3.2 การทดสอบคา เฉล่ยี ของประชากรหนึง่ กลุม (µ)

ในการทดสอบสมมุติฐานเกยี่ วกับคา เฉลีย่ ของประชากรหน่ึงกลุม มีวิธกี ารทดสอบอยู 2 วธิ ี คอื t test และ
z test โดยมเี งือ่ นไขในการใชต า งกัน ดังน้ี

• t test ใชเม่อื ตวั อยา งมีขนาดเล็ก (n < 30) และไมทราบคา เบย่ี งเบนมาตรฐานของประชากร σ โดย
ประชากรของขอมูลตองมีการแจกแจงปรกติหรือใกลเคียง ดงั นั้น กอ นท่ีจะใช t test ในการทดสอบ
สมมตุ ฐิ าน จะตอ งมีการตรวจสอบกอนเสมอวา ขอมลู ตวั อยา งนนั้ มาจากประชากรท่ีมีการแจกแจง
ปรกติหรอื ไม ซึ่งวิธีการตรวจสอบมีอยูดว ยกันหลายวธิ ี วธิ ีที่นยิ มใชมากไดแ ก การพิจารณาจากกราฟ
เชน ฮิสโตแกรม stem and leaf display หรือ boxplot

• z test ใชเ มือ่ ตวั อยางมขี นาดใหญ (n ≥ 30) หรือทราบคาเบีย่ งเบนมาตรฐานของประชากร (σ)

38

การใชโปรแกรม R เพอ่ื การวิจัย ดร.วนดิ า พงษศ ักดช์ิ าติ

Note: สำหรับ z test กรณีท่ีเราจะทราบคา เบยี่ งเบนมาตรฐานของประชากรเปน ไปไดยาก เน่ืองจาก σ
เปนคาพารามเิ ตอรที่ไมทราบคา สวนในกรณีท่ีตวั อยางมีขนาดใหญ หากตวั อยางมีขนาดใหญมาก ๆ เราอาจใช
t test แทน z test ได เนื่องจากคุณสมบัติของการแจกแจงแบบ t น่นั คือ เมอ่ื n มีขนาดใหญขึน้ การแจกแจง
แบบ t จะมคี ณุ สมบัตใิ กลเ คียงการแจกแจงปรกติมาตรฐาน ทำใหใ นโปรแกรมสำเร็จรูปบางโปรแกรม เชน SPSS
จะไมมี z test มีแต t test เทา นนั้

การใช R ในการทดสอบคา เฉลีย่ ของประชากร 1 กลุม

จากขอมลู เกี่ยวกบั การสำรวจการดูรายการโทรทัศนในบทท่ีแลว หากเราตองการทดสอบวาอายุเฉลีย่
ประชากรมากกวา 30 ป หรือไม ตง้ั สมมตุ ิฐานทางสถติ ิ คอื

H0 : µ ≤ 30
Ha : µ > 30

ในการทดสอบสมมตุ ิฐานสำหรับขอมูลชดุ นี้ เน่อื งจากขอ มูลมีจำนวนนอ ยกวา 30 เมอ่ื จะใช t test ในการ
ทดสอบตองทำการตรวจสอบลกั ษณะการแจกแจงของขอมลู กอน เนอื่ งจากขอมูลมีจำนวนนอย กราฟท่ีเหมาะ
สมคอื stem and leaf display สำหรบั ขอ มูลชุดไดก ราฟมลี ักษณะดังนี้

1 | 2: represents 12
leaf unit: 1

n: 20
2 2 | 55
4 2 | 67
8 2 | 8899

3|
(6) 3 | 222233
6 3 | 445
3 3|6
2 3 | 89

จากกราฟจะเหน็ ไดวา ขอมลู มีการแจกแจงคลา ยรปู ระฆงั ควำ่ ซึ่งเปนลักษณะของการแจกแจงปรกติ จงึ สรปุ ได
วาขอ มูลชดุ น้ีมาจากประชากรท่ีมีการแจกแจงปรกติ ซึง่ ตรงกับขอ สมมุติเบ้อื งตน หรอื ขอ กำหนดของ t test ดงั
นน้ั เราจะใช t test ทดสอบสมมุติฐาน ดังน้ี

1. เลือกเมนู Statistics -> Means -> Single-sample t-test... จะไดหนาตา ง

39

การใชโ ปรแกรม R เพื่อการวจิ ัย ดร.วนิดา พงษศักดิ์ชาติ

2. เลอื กตัวแปรท่ตี อ งการทดสอบ ในทีน่ ้ีเลือก AGE

3. กำหนดคาพารามเิ ตอรท่ีตอ งการทดสอบ จากตวั อยา งเราตอ งการทดสอบวาอายุเฉล่ียมากกวา 30 หรือ
ไม จึงกำหนด Null hypothesis: mu= 30

4. เลือกรูปแบบของสมมตุ ิฐานทางเลือกทต่ี องการทดสอบ โดยคลกิ เลือกท่ี Alternative Hypothesis

Population mean != mu0 เปน การทดสอบสมมตุ ฐิ านแบบสองทาง (Two tailed Test)
Population mean < mu0 เปน การทดสอบสมมุติฐานแบบทางเดียวทางซาย (Left tailed test)
Population mean > mu0 เปน การทดสอบสมมุติฐานแบบทางเดยี วทางขวา (Right tailed test)

ในที่นี้เราเลือกทดสอบสมมุตฐิ านแบบทางเดยี วทางดา นมากกวาตามสมมุตฐิ านท่ีต้ังไว ดังน้ัน คลกิ เลือก
ที่ Population mean > mu0

5. คลิก OK ไดผ ลลัพธดงั น้ี

One Sample t-test

data: tv$AGE
t = 1.4699, df = 19, p-value = 0.07898
alternative hypothesis: true mean is greater than 30
95 percent confidence interval:
29.76188 Inf
sample estimates:
mean of x

31.35

ผลการวิเคราะหท ไี่ ดม คี วามหมายดงั นี้

40

การใชโ ปรแกรม R เพือ่ การวจิ ยั ดร.วนดิ า พงษศ กั ดชิ์ าติ

1. คา t=1.4699 คือคา สถติ ิทดสอบ t ท่ีคำนวณไดจากขอมลู ตัวอยาง มีจำนวนองศาเสรีเทา กบั 19 และมี
คา p-value=0.07898 หากเรากำหนดระดบั นยั สำคญั α = 0.05 จะเหน็ ไดวา คา p-value นนั้ มีคา
มากกวาระดับนยั สำคัญที่กำหนด จึงยอมรบั สมมุตฐิ านหลกั H0 หมายความวา ที่ระดบั นยั สำคญั 0.05
อายเุ ฉล่ียของประชากรเปา หมายน้ันไมไดมากกวา 30 ป

2. สำหรบั คา 95 percent confidence interval (29.76188 Inf) คือชวงความเชือ่ มั่นทางดา นขวาของ
คา เฉล่ียของประชากร หมายความวาประชากรเปาหมายมีอายเุ ฉลี่ยตง้ั แต 29.7 ป

3. สว นของ mean of x หมายถึงคาเฉล่ยี ของขอมูลตัวอยา ง ในที่น้ีเทากบั 31.35 ป หมายความคนที่ถูก
สมุ มาเปนตวั อยา งมีอายุเฉลีย่ เทา กับ 31.35 ป

3.3 การทดสอบคา เฉลีย่ ของประชากร 2 กลมุ

การทดสอบความแตกตา งระหวา งคา เฉลี่ยของประชากร 2 กลมุ เปนการทดสอบเพือ่ เปรยี บเทียบวา
ประชากรสองกลุมนน้ั มีลกั ษณะแตกตา งกันอยา งไร เชน คนไทยผูชายและผูหญงิ มีอายุขยั โดยเฉลี่ยแตกตา ง
กนั หรือไม หรอื ผูช ายไทยมีรายไดเฉล่ียตอปมากกวา ผูหญงิ หรือไม โดยขอมูลท่ีสามารถนำมาทดสอบคา เฉลยี่ ได
ตอ งอยใู นมาตราแบบชวงขึ้นไป คือตองเปน ขอ มลู เชงิ ปริมาณ วิธกี ารทางสถติ ิทีใ่ ช ไดแ ก t test และ z test โดย
แตละวธิ ีจะขอ กำหนดท่ีแตกตางกัน อยางไรกต็ าม ในการทดสอบคาเฉลย่ี ของประชากร 2 กลุมนี้ ตอ งคำนงึ ถงึ
ลกั ษณะของขอ มูลดว ย โดยจะจำแนกลกั ษณะของขอมลู เปน 2 ประเภท คือ

1. ตัวอยางสองกลุมทส่ี มุ มาเปน อสิ ระกัน (Independent samples)

2. ตัวอยางสองชุดทีส่ ุมมาไมเ ปนอสิ ระกนั (Dependent samples)

การจำแนกลกั ษณะของกลุมตัวอยาง 2 ประเภทน้ี มีความสำคญั มาก เพราะวิธีการวิเคราะหท่ีใชจะมีความ
แตกตางกนั ดงั นั้น ผูวจิ ยั ตองจำแนกใหไดวากลมุ ตัวอยา งในงานวิจยั ของตนเปนประเภทไหน เชน ตองการ
เปรยี บอายขุ ัยเฉลย่ี ของผชู ายและผูหญงิ ลักษณะเชนน้ีถอื เปนกรณีท่ีตัวอยางสองกลมุ เปน อสิ ระกัน แตถา ผูวจิ ัย
ตองการเปรียบเทียบรายไดเฉลย่ี ของน้ำหนกั เฉลี่ยกอ นและหลงั เขาโปรแกรมลดนำ้ หนัก ลกั ษณะเชน นี้ตองใช
กรณีทก่ี ลมุ ตัวอยา งสองกลุมเปนอสิ ระกนั

3.3.1 การทดสอบความแตกตางของคา เฉลย่ี 2 กลุม เมอ่ื กลมุ ตัวอยางเปนอิสระกนั

การทดสอบความแตกตางของคา เฉล่ียของประชากร 2 กลมุ เม่ือกลุมตัวอยา งเปนอสิ ระกัน ดวย t test
หรอื z test ขอมลู ตวั อยา งทั้งสองกลุม ตองเปนขอ มูลเชงิ ปรมิ าณและมีวิธกี ารเลอื กวิธีทดสอบ ดงั น้ี

z test ใชเม่ือตัวอยา งทั้งสองกลุมมีขนาดใหญ (n1 และ n2 มากกวา 30) หรือทราบคา เบี่ยงเบนมาตรฐานของ
ประชากรท่ีหนึ่งและสอง (ทราบคา σ1 และ σ2)

t test ใชเมอื่ ตัวอยา งมีขนาดเล็ก (n1 หรอื n2 นอยกวาหรือเทา กับ 30) และไมทราบคา σ1 และ σ2 เมื่อ
ประชากรทง้ั สองกลุมมีการแจกแจงปรกตหิ รือใกลเคียง

เชน เดียวกบั การทดสอบสมมุติฐานเกี่ยวกบั คาเฉลยี่ ของประชากรหนง่ึ กลมุ ในกรณีของ z test การท่ีเราจะ
ทราบคาของ σ1 และ σ2 เปนไปไดยาก และเม่ือ n1 และ n2 มีขนาดใหญ การแจกแจงแบบ t จะใกลเคียง

41

การใชโ ปรแกรม R เพ่ือการวิจยั ดร.วนิดา พงษศ ักดิ์ชาติ

การแจกแจงปรกติมาตรฐาน ทำใหเราสามารถใช t test แทน z test ได ดังนน้ั ในท่ีนี้จะกลาวถึงเฉพาะ t test
เทาน้ัน

อยางไรก็ตาม การทดสอบโดยใช t test ยงั แบงเปน 2 กรณี ดังนี้

1. σ1 = σ2 ในกรณนี ้ี คา สถิติทดสอบคือ

t0 = (¯x1√− ¯x2) − (µ1 − µ2)

{ 1 1}
n1 + n2
s2p

ซึ่งมีการแจกแจงแบบ t ดว ยองศาเสรเี ทากับ n1 + n2 − 2

2. σ1 ≠ σ2 ในกรณนี ้ี คาสถิติทดสอบคือ

t0 = (¯x1 −√¯x2)ns12−1 +(µns1222− µ2)

ซึ่งมกี ารแจกแจงแบบ t ดว ยองศาเสรีเทากบั + (s22/n2)]2

df = [(s12/n1) [s22/n2]2
[s12/n1]2 n2 − 1
n1 − 1 +

ดังน้ันในการตัดสนิ ใจวา จะใช t test กรณีใดจึงเหมาะสม เราตองทำการทดสอบกอนวา คา เบ่ียงเบนมาตรฐาน
ของประชากร 2 กลมุ แตกตา งกันหรอื ไม ซงึ่ การทดสอบทำไดโ ดยการใช F test

จากตัวอยา งการสำรวจขอ มลู การดูโทรทัศน หากเราตองการทดสอบวา อายุเฉลย่ี ของผชู ายและผูหญิงที่
เปน กลุมเปาหมายน้ันแตกตา งกัน มีสมมตุ ิฐานทางสถติ ิคือ

H0 : µชาย = µหญงิ (3.1)
Ha : µชาย ̸= µหญิง (3.2)

วิธีใช R Commander ทดสอบสมมุตฐิ านนี้ ทำไดโดยการทดสอบกอนวาคา เบย่ี งเบนมาตรฐานของ
ประชากร 2 กลมุ เทากันหรอื ไม ดังนี้

1. เลอื กเมนู Statistics -> Variances -> Two-variance F-test...

42

การใชโ ปรแกรม R เพ่อื การวจิ ยั ดร.วนิดา พงษศ ักดช์ิ าติ

2. ท่ี Groups (pick one) เลือกตัวแปรแบงกลุม ในที่น้ีคอื SEX และท่ี Response variable (pick
one) เลือกตวั แปรที่ตอ งการทดสอบ ในทน่ี ีค้ ือ AGE

3. คลิกปมุ Options ไดห นา ตา ง

Alternative hypothesis คลกิ เลอื ก Two-sided

4. คลิก OK ไดผลลพั ธดังน้ี

F test to compare two variances

data: AGE by SEX
F = 0.2655, num df = 9, denom df = 9, p-value = 0.0612
alternative hypothesis: true ratio of variances is not equal to 1
95 percent confidence interval:
0.06594529 1.06888278
sample estimates:
ratio of variances

0.2654954

การใชผลลพั ธที่ไดทดสอบความแตกตางของคา เบ่ยี งเบนมาตรฐานของประชากร 2 กลุม ใหดูที่คา F =
0.2655 และคา p-value = 0.0612 หากกำหนดระดบั นัยสำคญั ของการทดสอบเทากบั 0.05 จะเหน็ ไดวา คา
p-value มากกวา 0.05 จึงสรปุ ไดวาคาเบยี่ งเบนมาตรฐานของประชากร 2 กลมุ น้ี ไมแตกตางกัน ท่ีระดับนัย
สำคัญ 0.05

ดงั น้ัน ในการทดสอบความแตกตา งของคา เฉล่ยี ของประชากร 2 กลุม จึงใช t test ในกรณีท่ี σ1 ̸= σ2
ดงั น้ี

1. เลือกเมนู Statistics -> Means -> Independent-sample t-test...

43

การใชโ ปรแกรม R เพอ่ื การวิจยั ดร.วนดิ า พงษศ ักดชิ์ าติ

2. ท่ี Groups (pick one) เลอื กตวั แปรแบง กลุม คือ SEX และที่ Response Variable (pick one)
เลือกตัวแปรทตี่ องการทดสอบ คอื AGE

3. คลิกที่ปมุ Options ไดหนา ตา งดงั น้ี

4. ท่ี Alternative Hypothesis เลอื กสมมุตฐิ านทางเลอื กท่ีตอ งการทดสอบ ในที่น้ีเลอื ก Two-sided
เนือ่ งจากสมมตุ ิฐานท่ีกำหนดไวเปน สมมตุ ฐิ านสองทาง

5. ที่ Assume equal variances? เลอื ก Yes เนือ่ งจากในการทดสอบความแตกตา งของคาเบย่ี งเบน
มาตรฐาน พบวา ความเบีย่ งเบนมาตรฐานของประชากร 2 กลมุ ไมแตกตา งกนั (แตถา หากใช F test
ทดสอบแลวพบวา σ1 ≠ σ2 ใหเ ลือก No)

6. คลิก OK ไดผลลพั ธดังนี้

44

การใชโ ปรแกรม R เพือ่ การวิจัย ดร.วนดิ า พงษศ กั ดิ์ชาติ

Two Sample t-test

data: AGE by SEX
t = -2.062, df = 18, p-value = 0.05395
alternative hypothesis: true difference in means is not equal to 0
95 percent confidence interval:
-7.06607063 0.06607063
sample estimates:
mean in group Male mean in group Female

29.6 33.1

ในการใชผลลพั ธที่ไดทดสอบสมมตุ ฐิ านท่ีกำหนดไว ใหพจิ ารณาที่คาสถติ ิทดสอบ t = -2.062 และ p-
value = 0.05395 หากเรากำหนดระดับนัยสำคญั ของการทดสอบเทา กับ 0.05 จะเห็นไดว า p-value มากกวา
ระดับนัยสำคญั 0.05 จงึ ยอมรับสมมุติฐานหลกั หมายความวาอายุเฉลย่ี ของผชู ายและผูหญิงในประชากรเปา
หมายนั้นไมแ ตกตางกัน ทรี่ ะดบั นัยสำคญั 0.05

3.3.2 การทดสอบความแตกตา งระหวา งคาเฉลย่ี ประชากร 2 กลมุ เม่ือกลุมตัวอยางไม
เปนอสิ ระกัน

การทดสอบความแตกตา งระหวา งคา เฉล่ยี ของประชากร 2 กลุม เมอ่ื กลุม ตวั อยางไมเปน อสิ ระกนั ซ่งึ ขอ มลู
ที่ไดจากกลมุ ตัวอยางอาจไดจากการวัดคาจากกลมุ ตวั อยา งเดียวกัน 2 คร้งั เชน การเปรียบเทียบน้ำหนักกอน
และหลงั การเขาโปรแกรมลดน้ำหนักของคนกลุมเดยี วกนั หรอื การเปรยี บเทยี บคะแนนกอ นเรยี นกบั หลังเรยี น
ของนิสิตกลมุ เดียวกัน เปนตน หรืออกี กรณีหนง่ึ ขอมลู ไดมาโดยการวดั คาจากการจับกลุมตัวอยา งเปน คู ๆ โดย
ใชค ุณลกั ษณะบางอยาง เชน การเปรยี บเทยี บระดับ IQ ของฝาแฝด หรือการเปรียบเทียบรายไดเรม่ิ ตน ของผูจบ
การศกึ ษาสาขาบรหิ ารชายและหญงิ ที่มี GPA เทา กนั

สำหรบั การทดสอบสมมตุ ิฐานเพอ่ื เปรียบเทียบคาเฉล่ียของประชากร 2 กลุม เม่อื กลมุ ตวั อยา งไมเปน อสิ ระ
กนั ใชว ิธีการทดสอบ t ท่ีเรียกวา Dependent t test หรือ Match paired t test

ตัวอยางตอไปน้ีเปน ขอมลู คะแนนสอบกลางภาคและปลายภาคของนสิ ติ 44 คน และเราตอ งการทดสอบ
วา นิสิตมีพัฒนาการในการทำขอ สอบหรอื ไม นัน่ คือ ตอ งการทดสอบวา คะแนนสอบปลายภาคมากกวา คะแนน
สอบปลายภาคหรอื ไม

i Midterm Final

1 0.81 4.72
2 2.84 8.19
3 12.16 10.24

··· ··· ···

42 3.65 2.83
43 17.57 19.06
44 17.16 15.75

45

การใชโ ปรแกรม R เพือ่ การวิจัย ดร.วนดิ า พงษศ กั ด์ชิ าติ

จากตารางขอ มูล จะเห็นไดวามีตัวแปร 2 ตัวแปร คือ Midterm คือคะแนนสอบกลางภาค และ Final คอื
คะแนนสอบปลายภาค โดยไมม ีตัวแปรแบงกลมุ จะเห็นวา ลกั ษณะการเกบ็ ขอ มลู จะไมเหมอื นกบั การทดสอบ
ความแตกตางระหวา งคาเฉล่ียของประชาการ 2 กลุม ท่ีเปน อสิ ระกัน

สำหรับตัวอยางนี้ สมมุตฐิ านทางสถติ ทิ ีท่ ดสอบ คือ

H0 : µD ≤ 0 (คะแนนสอบปลายภาคไมม ากกวา คะแนนสอบกลางภาค)
Ha : µD > 0 (คะแนนสอบปลายภาคมากกวาคะแนนสอบกลางภาค)

ใช R Commander ทำการทดสอบโดยใช Dependent t test ดงั นี้

1. เลอื กเมนู Statistics -> Means -> Paired t-test... จะไดหนาตา ง

2. ที่ First variable เลอื กตัวแปรตัวที่ 1 ในที่นี้เลอื ก Final และท่ี Second variable เลอื กตวั แปร ใน
ท่ีน้ีเลือก Midterm

3. คลกิ ปมุ Options ไดห นา ตา งดงั น้ี

4. ที่ Alternative Hypothesis เลอื กชนิดของสมมุตฐิ านทางเลอื กที่ตองการทดสอบ ในที่นี้เลอื ก Dif-
ference > 0 ตามสมมตุ ิฐานทางสถติ ิท่ตี ัง้ ไว)

5. คลิก OK ไดผลลพั ธ ดังนี้
46

การใชโปรแกรม R เพื่อการวิจยั ดร.วนดิ า พงษศกั ด์ชิ าติ

Paired t-test

data: score$Final and score$Midterm
t = 0.3707, df = 43, p-value = 0.3564
alternative hypothesis: true difference in means is greater than 0
95 percent confidence interval:
-0.7966742 Inf
sample estimates:
mean of the differences

0.2253381

จากผลลัพธที่ได ไดคา t = 0.3707 จำนวนองศาเสรี df = 43 และ p-value = 0.3564 หากเรากำหนด
ระดับนยั สำคญั ของการทดสอบเทากับ 0.05 จะเหน็ ไดวา คา p-value มากกวา ระดับนยั สำคัญ จงึ ยอมรับ
สมมุตฐิ านหลัก สรุปไดวา ที่ระดับนยั สำคัญ 0.05 คะแนนสอบปลายภาคเฉล่ียของนิสิตไมไดมากกวา คะแนน
สอบกลางภาคเฉลี่ย หรืออกี นยั หนงึ่ นิสติ ไมม ีพัฒนาการในการทำขอสอบ เน่อื งจากคะแนนสอบปลายภาคไม
ไดดกี วา คะแนนสอบกลางภาค

47

Click to View FlipBook Version