การวิเคราะห์และนำเสนอข้อมูล
เชิงปริมาณ
การวิเคราะห์และนำเสนอข้อมูล
เชิงปริมาณด้วยตารางความถี่
ข้อมูลเชิงปริมาณซึ่งเป็นข้อมูลที่ได้จากการวัดหรือการนับค่า โดยแสดงเป็นตัวเลขหรือปริมาณที่
สามารถนำไปบวก ลบ คูณ หรือหาร และเปรียบเทียบกันได้อย่างมีความหมาย ข้อมูลเชิงปริมาณ
สามารถใช้การแจกแจงความถี่เพื่ อจัดระเบียบและนำเสนอข้อมูลได้เช่นเดียวกับข้อมูลเชิงคุณภาพ
โดยการเขียนตารางความถี่สำหรับข้อมูลเชิงปริมาณมี 2 แบบ ได้แก่
1. ตารางความถี่แบบไม่ได้แบ่งข้อมูลเป็นช่วง ซึ่งเหมาะสำหรับใช้ในกรณีที่ค่าที่เป็นไปได้ของข้อมูล
มีจำนวนน้อย
2. ตารางความถี่แบบแบ่งข้อมูลเป็นช่วง ซึ่งเหมาะสำหรับใช้ในกรณีที่ค่าที่เป็นไปได้ของข้อมูลมี
จำนวนมาก
ตัวอย่างของตารางความถี่แบบไม่ได้แบ่งข้อมูลเป็นช่วง เช่น
ในการสอบย่อยวิชาคณิตศาสตร์ซึ่งมีคะแนน โดยครูให้คะแนนเป็นจำนวนเต็ม มีนักเรียนเข้าสอบ
6 คน ได้คะแนนสอบ 0, 2, 5, 5, จะสามารถเขียนตารางความถี่สำหรับทุกค่าของคะแนนที่เป็นไป
ได้ซึ่งมีจำนวน 11 เต็ม 10 คะแนน 7 และ 10 คะแนน
ในกรณีที่ค่าของคะแนนที่เป็นไปได้มีจำนวนมาก เช่น ในการสอบวิชาคณิตศาสตร์ซึ่งมีคะแนนเต็ม
คะแนน โดยครูให้คะแนนเป็นจำนวนเต็ม ถ้าเขียนตารางความถี่โดยใช้ทุกค่าของคะแนนที่เป็นไปได้
มีมากถึง 101 ค่า ซึ่งยากต่อการนำเสนอ ด้วยเหตุนี้จึงแบ่งข้อมูลที่เป็นไปได้ทั้งหมดออกเป็น
ช่วงๆ
และเรียกแต่ละช่วงว่า อันตรภาคชั้น (class interval)
ในหัวข้อนี้จะกล่าวถึงเฉพาะตารางความถี่ของข้อมูลเชิงปริมาณสำหรับข้อมูลที่มีการแบ่งเป็น
อันตรภาคชั้น ขั้นตอนการเขียนตารางความถี่ของข้อมูลเชิงปริมาณที่มีข้อมูลทั้งหมดเป็นจำนวนเต็ม
กำหนดจำนวนอันตรภาคชั้นเป็น 4 ชั้น Birtrenuverenifern 18
กำหนดค่าเริ่มต้นและค่าสุดท้ายที่ครอบคลุมทุกค่าของข้อมูล โดยที่ค่าเริ่มต้นคือค่าต่ำสุดหรือค่า
1.
2.
ที่น้อยกว่าค่าต่ำสุดของข้อมูล และค่าสุดท้ายคือค่าสูงสุดหรือค่าที่มากกว่าค่าสูงสุดของข้อมูล
3. คำนวณความกว้างของอันตรภาคชั้น โดยหาได้จาก
ค่าสุดท้าย - ค่าเริ่มต้น
จำนวนอัตรภาคชั้น
ถ้าค่าที่คำนวณได้ไม่เป็นจำนวนเต็มให้ปัดเศษขึ้นเป็นจำนวนเต็มเสมอ
4. กำหนดอันตรภาคชั้นโดยที่
ชั้นแรกมีค่าเริ่มต้นที่กำหนดในข้อ 2 ถึงจำนวนที่ได้จากการนำค่าเริ่มต้นที่กำหนดในข้อ 2 บวกกับ
ความกว้างของอันตรภาคลบด้วย1
ชั้นที่สองมีค่าเริ่มต้นเป็นค่าสุดท้ายของชั้นแรกบวกด้วย 1 ถึงค่าเริ่มต้นของชั้นที่สองบวกกับ
ความกว้างของอันตรภาคชั้นลบด้วย 1
ทำเช่นนี้ไปเรื่อย ๆ จนถึงชั้นที่ 4 (ในกรณีที่ค่าสุดท้าย – ค่าเริ่มต้น)
จำนวนอันตรภาคชั้นของชั้นที่ 4 จะไม่เท่ากับค่าสุดท้ายที่กำหนดในข้อ 2 แต่ต้องมากกว่าหรือเท่ากับ
ข้อมูลทุกค่า
5. หาจำนวนข้อมูลทั้งหมดที่อยู่ในแต่ละอันตรภาคชั้น โดยทำรอยขีดแทนจำนวนไว้ในแต่ละ
อันตรภาคชั้น โดยปกติมักใช้รอยขีด แทนหนึ่งค่า และเพื่อความสะดวกในการนับจำนวนข้อมูล
ที่อยู่ในแต่ละอันตรภาคชั้น เมื่อถึงทุก ๆ ข้อมูลที่ห้า มักนิยมทำรอยขีดแนวเฉียงหรือแนวนอน
ทับรอยขีดทั้งสี่ก่อนหน้านั้น ดังนี้ หรือ ให้
6. นับจำนวนข้อมูลจากรอยขีดที่ทำในข้อ 5 แล้วบันทึกจำนวนข้อมูลลงในช่อง
ความถี่ของแต่ละเป็นจำนวนเต็ม ค่าสุดท้าย
นอกจากนี้ สามารถหาความถี่สัมพัทธ์และความถี่สะสมสัมพัทธ์ในแต่ละอันตรภาคชั้น ซึ่งความถี่
สะสม
สัมพั ทธ์ในแต่ละอันตรภาคชั้นคือผลรวมของความถี่สัมพั ทธ์ของอันตรภาคชั้นนั้นกับความถี่สัมพั ทธ์
ของอันตรภาคชั้นก่อนหน้าทั้งหมด ได้ดังนี้
การวิเคราะห์และนำเสนอข้อมูล
เชิงปริมาณด้วยแผนภาพ
ในการวิเคราะห์และนำเสนอข้อมูลเชิงปริมาณ นอกจากจะใช้ตารางความถี่แล้ว ยังสามารถใช้
แผนภาพได้อีกด้วย โดยการใช้แผนภาพแสดงการแจกแจงความถี่ของข้อมูล จะทำให้เห็นการ
แจกแจงของข้อมูลได้ชัดเจนมากกว่าการพิ จารณาจากตารางความถี่
ฮิสโทแกรม
ฮิสโทแกรม (histogram) เป็นการนำเสนอข้อมูลเชิงปริมาณที่สร้างจากตารางความถี่ โดยใช้
แท่ง สี่เหลี่ยมมุมฉากที่เรียงติดกันบนแกนนอน เมื่อแกนนอนแทนค่าของข้อมูล ความสูงของ
แท่งสี่เหลี่ยมมุมฉากจะแสดงความถี่ของข้อมูล ซึ่งการแสดงความถี่ของข้อมูลอาจนำเสนอ
ความถี่ของข้อมูลเพียงค่าเดียวหรือข้อมูลในแต่ละอันตรภาคชั้น โดยความกว้างของแท่ง
สี่เหลี่ยมมุมฉากแต่ละแห่งจะสอดคล้องกับความกว้างของแต่ละอันตรภาคชั้นของตาราง
ความถี่ พิจารณาสถานการณ์ต่อไปนี้
คณะกรรมการหมู่บ้านจัดสรรแห่งหนึ่งสำรวจข้อมูลจำนวนสมาชิกในแต่ละครอบครัว
จำนวน 20 ครอบครัว โดยเรียงข้อมูลจากน้อยไปมากได้ดังนี้
ตัวอย่าง
จากฮิสโทแกรม จะเห็นว่าครอบครัวที่มีสมาชิก 4 คน มีจำนวนมากที่สุด ไม่มีครอบครัวใดเลย
ที่มีสมาชิกมากกว่า 6 คน และไม่มีครอบครัวใดเลยที่มีสมาชิกเพียง 1 คน
ข้อสังเกต
1.ความสูงของแต่ละแท่งสี่เหลี่ยมมุมฉากแทนความถี่ของข้อมูลแต่ละค่า โดยในที่นี้คือ
จำนวนครอบครัว ซึ่งได้แก่ 3, 5, 6, 2 และ 4 ครอบครัว
2. ฮิสโทแกรมมีลักษณะคล้ายแผนภูมิแท่ง แต่แผนภูมิแท่งใช้นําเสนอข้อมูลเชิงคุณภาพ
จุดกึ่งกลางของฐานของแต่ละแท่งสี่เหลี่ยมมุมฉากแทนข้อมูลแต่ละค่า
จำนวนสมาชิกในครอบครัว ซึ่งได้แก่ 2, 3, 4, 5 และ 6 คน
นอกจากนี้สามารถเขียนฮิสโทแกรมจากตารางความถี่ที่มีการแบ่งข้อมูลเป็นอันตรภาคชั้นได้
การเขียนฮีสโทแกรมเพื่อให้แท่งสีเหลี่ยมมุมฉากแต่ละรูปเรียงติดกัน จะต้องหาขอบล่างของ
ชั้นและขอบบนของชั้นของแต่ละอันตรภาคชั้นก่อน โดยที่
ขอบล่างของชั้น (lower class boundary) คือ ค่ากึ่งกลางระหว่างค่าของข้อมูลที่มาก
ที่สุด
ในชั้นก่อนหน้ากับค่าของข้อมูลที่น้อยที่สุดในขั้นนั้น
ขอบบนของชั้น (upper class boundary) คือ ค่ากึ่งกลางระหว่างค่าของข้อมูลที่มากที่สุด
ในชั้นนั้นกับค่าของข้อมูลที่น้อยที่สุดในชั้นถัดไป
จากนั้น สามารถเขียนฮิสโทแกรมได้โดยให้ความกว้างของแท่งสี่เหลี่ยมมุมฉากแต่ละแท่ง
เท่ากับผลต่างของขอบบนของชั้นและขอบล่างของชั้นของแต่ละอันตรภาคชั้น
หมายเหตุ การหาขอบล่างของชั้นของอันตรภาคชั้นแรก ให้พิจารณาเสมือนว่ามีอันตรภาคชั้น
ที่ต่ำกว่าอันตรภาคชั้นนี้อีกหนึ่งชั้น ในทำนองเดียวกัน การหาขอบบนของชั้นในอันตรภาคชั้น
สุดท้าย ให้พิจารณาเสมือนว่ามีอันตรภาคชั้นที่สูงกว่าอันตรภาคชั้นนี้อีกหนึ่งชั้น
แผนภาพจุด
แผนภาพจุด
แผนภาพจุด (dot plot) เป็นการนำเสนอข้อมูลเชิงปริมาณโดยใช้จุดหรือวงกลมเล็ก ๆ แทน
ข้อมูลแต่ละตัว เขียนเรียงไว้เหนือเส้นในแนวนอนที่มีสเกล จุดหรือวงกลมเล็ก ๆ ดังกล่าวจะ
เรียงกันในแนวตั้งตรงกับตำแหน่งซึ่งแสดงค่าของข้อมูลแต่ละตัว
พิ จารณาสถานการณ์ต่อไปนี้
จากการแข่งขันกีฬาโอลิมปิกฤดูหนาว 2018 ซึ่งจัดขึ้นที่สาธารณรัฐเกาหลี ใน พ.ศ. 2561
สามารถแสดงข้อมูลจํานวนเหรียญทองของประเทศที่ได้เหรียญทองจำนวน 22 ประเทศ โดย
เรียงข้อมูลจากมากไปน้อยได้ดังนี้
นำมาจัดตารางได้ดังนี้ นำมาเขียนเป็นแผนภาพจุดได้ดังนี้
จากแผนภาพจุด จะเห็นว่าประเทศที่ได้เหรียญทอง 1 เหรียญ มีจำนวนมากที่สุด
และมีเพียง 3 ประเทศที่ได้เหรียญทองมากกว่า 10 เหรียญ
แผนภาพลำต้นและใบ
แผนภาพลำต้นและใบ (stem and leaf plot) เป็นการนำเสนอข้อมูลเชิงปริมาณโดยใช้แผนภาพที่
มีการแสดงข้อมูลโดยเรียงลำดับจากน้อยไปมากและแบ่งการแสดงข้อมูลออกเป็นสองส่วนที่เรียก
ว่า ส่วนลำต้น และส่วนใบ ในที่นี้กำหนดส่วนใบเป็นเลขโดดในหลักหน่วย และตัวเลขที่เหลือเป็นส่วน
ลำต้น เช่น 298 จะมี 29 เป็นส่วนลำต้น และ 8 เป็นส่วนใบ
หมายเหตุ ในที่นี้จะใช้แผนภาพลำต้นและใบนำเสนอข้อมูลเชิงปริมาณที่เป็นจำนวนเต็มบวกเท่านั้น
ร้านอาหารแห่งหนึ่งสำรวจอายุ(ปี)ของผู้ที่มาใช้บริการที่ร้านในหนึ่งวันได้ข้อมูลดังนี้
เรียงอายุจากน้อยไปมาก
นำมาเขียนแผนภาพลำตันและใบได้ดังนี้
จากแผนภาพลำต้นและใบ จะเห็นว่าในวันที่สำรวจข้อมูล
ผู้ที่มาใช้บริการที่ร้านอาหารแห่งนี้มีอายุมากที่สุด 63 ปี
และมีอายุน้อยที่สุด 1 ปี โดยผู้ที่มาใช้บริการที่ร้านอาหาร
แห่งนี้อยู่ในช่วงอายุ 20 – 29 ปีมากที่สุด
แผนภาพกล่อง
แผนภาพกล่อง (box plot) เป็นการนำเสนอข้อมูลเชิงปริมาณที่แสดงตำแหน่งสำคัญของ
ข้อมูล ซึ่งประกอบด้วยค่าต่ำสุด ค่าสูงสุด และควอร์ไทล์ (quartile) นอกจากนี้ แผนภาพ
กล่องสามารถใช้ในการตรวจสอบว่ามีข้อมูลที่แตกต่างไปจากข้อมูลส่วนใหญ่หรือไม่ โดยจะ
เรียกข้อมูลดังกล่าวว่า ค่านอกเกณฑ์ (outlier) จอมเกิดจากขั้นตอนการเขียนแผนภาพ
กล่อง
1. เรียงข้อมูลจากน้อยไปมาก จากนั้นหาค่าต่ำสุดและค่าสูงสุดของข้อมูล
2. หาควอร์ไทล์ที่ 1 ควอร์ไทล์ที่ 2 และควอร์ไทล์ที่ 3โดยที่
ควอร์ไทล์ที่ 1 คือค่าที่มีจำนวนข้อมูลที่มีค่าน้อยกว่าค่านี้อยู่ประมาณหนึ่งในสี่ของจำนวน
ข้อมูลทั้งหมด
ควอร์ไทล์ที่ 2 คือค่าที่มีจำนวนข้อมูลที่มีค่าน้อยกว่าค่านี้อยู่ประมาณครึ่งหนึ่งของจำนวน
ข้อมูลทั้งหมด หรือค่าที่อยู่ในตำแหน่งกึ่งกลางของจำนวน
แผนภาพกล่องกับการกระจายของข้อมูล ใช้ในการอธิบายลักษณะการกระจาย
ของข้อมูล ทำให้เห็นว่าโดยภาพรวมแล้ว ข้อมูลมีการเกาะกลุ่มกันหรือไม่
แผนภาพกระจาย
การวิเคราะห์และนำเสนอข้อมูลเชิงปริมาณข้างต้นพิ จารณาเฉพาะข้อมูลเชิงปริมาณของ
ตัวแปรเพียงหนึ่งตัว แต่ในหัวข้อนี้จะพิจารณาข้อมูลเชิงปริมาณของตัวแปรสองตัวว่า
ตัวแปรทั้งสองมีความสัมพันธ์เชิงเส้นกันหรือไม่ เนื่องจากเมื่อมีตัวแปรสองตัว ไม่จำเป็นที่
ตัวหนึ่งต้องเป็นตัวแปรต้นและอีกตัวต้องเป็นตัวแปรตามแผนภาพการกระจาย
การตรวจสอบความสัมพั นธ์เชิงเส้นของตัวแปรทั้งสองจะพิ จารณาโดยใช้
แผนภาพการกระจาย (scatter plot) คือแผนภาพที่เกิดจากการลงจุดที่แสดงค่าของ
ตัวแปรคู่หนึ่ง รูปแบบการกระจายของจุดต่าง ๆ ที่ปรากฏในแผนภาพจะแสดงถึงรูปแบบ
ความสัมพั นธ์ระหว่างสองตัวแปรนั้น
ตัวอย่าง
บริษัทแห่งหนึ่งสำรวจยอดขายของผลิตภัณฑ์ที่มีค่าใช้จ่ายในการโฆษณาผลิตภัณฑ์นั้นแตกต่างกัน
ในพื้นที่ต่าง ๆ ทั่วประเทศไทย จำนวน 10 แห่ง ได้ผลสำรวจดังนี้
จงพิ จารณาว่าค่าใช้จ่ายในการโฆษณาและยอดขายของผลิตภัณฑ์มีความ
สัมพันธ์กันหรือไม่ อย่างไร
วิธีทำ จากแผนภาพการกระจาย จะเห็นว่าเมื่อค่าใช้จ่ายในการโฆษณามากขึ้น
ยอดขายของผลิตภัณฑ์จะมีแนวโน้มมากขึ้นด้วย ดังนั้น จึงกล่าวได้ว่าค่าใช้จ่าย
ในการโฆษณาและยอดขายของผลิตภัณฑ์มีความสัมพั นธ์ในทิศทางเดียวกัน
สมาชิก
หาข้อมูล
นายธีรชัย บางเอี่ยม เลขที่ 4
นายศตายุ ทองเกลี้ยง เลขที่ 5
นางสาวนาเดียร์ ตือมิงหม๊ะ เลขที่ 22
ทำE-BOOK
นางสาวรติกานต์ ไชยมาตย์ เลขที่ 37