การวิเคราะห์ข้อมูล บทที่ 3
เนื้อหาบทที่ 3 ชั้นมัธยมศึกษาปีที่ 5 เล่มนี้ เป็นสื่อการเรียนก่ีสอนที่สร้างขึ้น เพื่อใช้ในการศึกษาเรื่องการวิเคราะห์ ข้อมูล สำ หรับนักเรียนชั้นมัธยมศึกษาปีที่ 5 เป็นสื่อที่ช่วยพัฒยนาการเรียน โดย เนื้อหาภายในเล่ม ได้แก่ การวิเคราะห์ เชิงพรรณนา การวิเคาราะห์เชิงทำ นาย ผู้จัดทำ หวังเป็นอย่างบิ่งว่า บทเรียน เล่มนี้ จะเป็นประโยชน์ต่อครูผู้สอน นักเรียน ผู้ที่สนใจ และผู้ที่ต้องการศึกษา เกี่ยวกับการวิเคราะห์ข้อมูลได้เป็นอย่างดี คำ นำ
สารบัญ 3.1 การวิเคราะห์เชิงพรรณนา 3.2 การหาสัดส่วนหรือร้อยละ 3.3 การวัดค่ากลางของข้อมูล 3.4 การหาความสัมพันธ์ของชุด ข้อมูล 3.5 การวิเคราะห์เชิงทำ นาย 3.6 การทำ นายเชิงตัวเลข 3.7 การทำ นายเชิงหมวดหมู่ 3.8 การประเมินความถูกต้อง ในการจำ แนกข้อมูล สรุปท้ายบท อ้างอิงหนังสือ 1 2 3 4 5 6 7 8 เรื่อง หน้า
จุดประสงค์ อธิบายหลักการวิเคราะห์ข้อมูลเชิง พรรณนา และเชิงทำ นาย เลือกใช้วิธีการวิเคราะห์ข้อมูลได้ ตรงตามวัตถุประสงค์ วิเคราะห์ข้อมูลโดยใช้โปรแกรม สำ เร็จรูป หรือโปรแกรมภาษา อธิบายผลของการวิเคราะห์ข้อมูล เพื่อนำ ไปสู่การตัดสินใจ
การวิเคราะห์เชิงพรรณนา (DESCRIPTIVE ANALYTICS) 1
การวิเคราะห์เชิงพรรณนา (DESCRIPTIVE ANALYTICS) เป็นการวิเคราะห์ขั้นพื้นฐาน ที่ทำ ให้เห็น ภาพรวมของข้อมูล และความสัมพันธ์ระหว่าง ข้อมูล ช่วยอธิบายว่าเกิดอะไรขึ้นบ้างในช่วงที่ ผ่านมา และอาจนำ มาช่วยในการตัดสินใจ โดยอาจใช้สถิติ เช่น การหาสัดส่วนหรือร้อย ละ การวัดค่ากลางของข้อมูล (CENTRAL TENDENCY) การหาความสัมพันธ์ของชุดข้อมูล (CORRELATION) 2
การหาสัดส่วนหรือร้อยละ เป็นการจัดการข้อมูลที่ซ้ำ กันให้เป็นระเบียบและเป็นหมวดหมู่ ซึ่งจะทำ ให้ง่ายต่อ การนำ ข้อมูลไปใช้ และง่ายต่อการสังเกตการ เปลี่ยนแปลงต่างๆ ที่เกิดขึ้น โดยอาจแสดงในรูปของ เศษส่วน ทศนิยม หรือร้อยละ และสามารถนำ เสนอให้ อยู่ในรูปของแผนภูมิ หรือแผนภาพ เพื่ออธิบายความ หมายของข้อมูลชุดนั้นเช่น การสำ รวจสัดส่วนคะแนนวิชา สามัญและวิชาเฉพาะเป็ส 100% จากทั้งหมด 5 วิชา คิด เป็นร้อยละ 60 3.1.1 การหาสัดส่วน หรือร้อยละ 3
3.1.2 การวัดค่ากลางของข้อมูล การวัดค่ากลางของข้อมูล ใช้เพื่อหาค่าที่เป็นตัวแทน ของข้อมูลทั้งหมด ทำ ให้สะดวกในการจดจำ หรือสรุป เรื่องราวเกี่ยวกับข้อมูลชุดนั้น ๆ ได้มากขึ้น ค่ากลางของ ข้อมูลที่นิยมใช้ ได้แก่ ค่าเฉลี่ย (MEAN) มัธยฐาน (MEDIAN) และฐานนิยม (MODE) สำ หรับชุดข้อมูล ปริมาณที่มีค่าใกล้เคียงกัน (ค่าการกระจ่ายของข้อมูลต่ำ ) ค่าเฉลี่ยอาจเป็นค่ากลางที่ดี แต่ค่าเฉลี่ยอาจไม่เหมาะที่ จะใช้เป็นค่ากลางของชุดข้อมูลที่มีค่าแตกต่างกันมาก คือ มีข้อมูลบางตัวที่ค่าสูงมากๆ หรือต่ำ มากๆ ดังนั้นการ พิจารณาค่าเฉลี่ยจึงควรจะพิจารณาการกระจายของข้อมูล ด้วย ซึ่งสามารถดูได้จากค่าส่วนเบื่ยงเบนมาตรฐาน (STANDARD DEVIATION) 4
หมายความว่า สิ่งที่สนใจทั้งสองสิ่งมีการเพิ่มขึ้นหรือ ลดลงในทิศทางตรงกันข้าม เช่น ค่าของ X เพิ่มขึ้น ค่า ของ Y กลับลดลง 3.1.3 การหาความสัมพันธ์ของชุดข้อมูล การวิเคราะห์ความสัมพันธ์เชิงเส้นระหว่างข้อมูล 2 ชุด (PAIRWISE) จะบ่งบอกถึงทิศทาง (DIRECTION) ของความ สัมพันธ์ และระดับ (DEGREE) ของความสัมพันธ์ ทิศทาง ของความสัมพันธ์สามารถพิจารณาได้ 2 กรณี คือ + ความสัมพันธ์เชิงบวก - ความสัมพันธ์เชิงลบ หมายความว่า สิ่งที่สนใจทั้งสองสิ่งมีการเพิ่มขึ้นหรือลดลง ไปในทิศทางเดียวกัน เช่น ค่าของ X เพิ่มขึ้น ค่าของ Y จะ เพิ่มขึ้น หมายความว่า สิ่งที่สนใจทั้งสองสิ่งมีการเพิ่มขึ้นหรือลดลง ไปในทิศทางเดียวกัน เช่น ค่าของ X เพิ่มขึ้น ค่าของ Y จะ เพิ่มขึ้น - ความสัมพันธ์เชิงลบ 5
การวิเคราะห์เชิงทำ นาย (PREDICTIVE ANALYSIS) 6
การคาดการณ์ หรือการรู้อนาคต เป็นสิ่งที่ คนส่วนใหญ่ให้ความสำ คัญ เพื่อนำ มา ประกอบการตัดสินใจ ให้สามารถเลือกสิ่ง ที่ดีที่สุดสำ หรับตัวเองหรือองค์กรได้ ใน เชิงธุรกิจ ผู้ประกอบการอาจมีความต้องการ ที่จะรู้ว่าการลงทุนกับสินค้าชนิดใดแล้วจะ ได้กำ ไรเท่าไร เพื่อให้เลือกลงทุนได้อย่าง เหมาะสม สำ หรับบุคคลทั่วไป อาจมีความ ต้องการที่จะคาดการณ์สิ่งที่จะเกิดขึ้นใน ชีวิตประจำ วัน เช่น ก่อนออกจากบ้านอาจ ต้องการที่จะคาดการณ์ว่าฝนจะตกหรือไม่ จะได้นำ ร่มติดตัวไปด้วย 7 การวิเคราะห์เชิงทำ นาย (PREDICTIVE ANALYSIS)
การทำ นายข้อมูลเชิงตัวเลข (NUMERIC PREDICTION) เป็นการใช้ข้อมูลในอดีต มาวิเคราะห์หาความสัมพันธ์ระหว่างชุด ข้อมูลและสร้างแบบจำ ลองในการทำ นาย ที่ให้ผลลัพธ์เป็นตัวเลข โดยทั่วไปมีวิธี การทำ นาย 2 วิธีคือ การทำ นายโดยใช้ กราฟและการทำ นายโดยใช้สมการเชิง เส้น 3.2.1 การทำ นายเชิงตัวเลข (NUMERIC PREDICTION) 8
3.2.2 การทำ นายเชิงหมวดหมู่ การทำ นายเชิงหมวดหมู่ (CLASSIFICATION) คือ การทำ นายข้อมูลที่สนใจที่ไม่ใช่ข้อมูล ตัวเลข จากข้อมูลอีกชุดหนึ่งที่มีความสัมพันธ์ กัน เช่น การทำ นานว่า ฝนจะตกหรือไม่ (ตก หรือไม่ตก) อาหารโปรด (ต้มยำ กุ้ง ผัดไทย กะเพราไก่) แนวเพลงที่ชอบ (JAZZ, POP, ROCK, R&B) ประเภทเครื่องดื่ม (น้ำ อัดลม น้ำ ผลไม้) เป็นต้น แนวคิดหลักในการทำ นาย คือ ใช้ข้อมูลในอดีตที่มีการระบุหมวดหมู่มา แล้ว เพื่อทำ นายข้อมูลชุดใหม่ที่ยังไม่ ทราบหมวดหมู่ เทคนิคที่ใช้ในการจัดหมวด หมู่นั้นมีหลากหลาย ในที่นี้จะกล่าวถึงการจัด หมวดหมู่ด้วยวิธีการค้นหาเพื่อนบ้านใกล้เคียง ที่สุด K ตัว (K – NEAREST NEIGHBORS: KNN) 9
การประเมินความถูกต้องในการจำ แนกข้อมูล การประเมินความถูกต้องในการจำ แนกกลุ่มข้อมูลเพื่อ ทำ นายผลในอนาคตเป็นสิ่งสำ คัญมาก เพราะ หากผลการ ทำ นายผิดพลาดอาจเกิดความเสียหายเมื่อนำ ไปใช้จริง เช่น จากตัวอย่างข้างต้นทำ นายว่า จะไม่ เกิดไฟไหม้ใน วันที่มีอุณหภูมิเท่ากับ 21.2°C และความชื้นสัมพัทธ์ เท่ากับ 32% แต่หากวันดังกล่าวเกิด ไฟไหม้ (ผลการทำ นายผิดพลาด) อาจจะทำ ให้ฝูงสิงโต ย้ายไปที่อื่นไม่ทัน ซึ่งการประเมินความถูกต้องควรนำ ไปทดสอบกับชุดข้อมูล ที่ทราบคำ ตอบอยู่แล้ว ซึ่งมักเป็นข้อมูลชุด เดียวกันกับ ข้อมูลตั้งต้น แต่ถูกแยกไว้เฉพาะเพื่อการประเมินยก ตัวอย่างเช่น จากชุดข้อมูลไฟป่า อาจมีข้อมูล ตั้งต้นจำ นวน 20 ตัวอย่าง จากข้อมูลกลุ่มนี้นักเรียนอาจกัน ข้อมูลไว้ 7 ตัวอย่าง เพื่อการประเมิน ส่วนอีก 13 ตัวอย่างที่เหลือสามารถนำ ไปใช้เป็นเครื่องมือในการ ทำ นาย ดังรูป 3.12 10
สรุปท้ายบท การวิเคราะห์ข้อมูล เป็นการดำ เนินการ กับข้อมูล เพื่อให้เกิดความเข้าใจ ข้อมูลเชิงลึกในสิ่งที่สนใจศึกษา โดย ผลลัพธ์ของการวิเคราะห์ข้อมูลสามารถ นำ ไปประกอบการตัดสินใจ การวิเคราะห์เชิงพรรณนา เป็นการ วิเคราะห์ที่ทำ ให้ภาพรวมของข้อมูล รูป แบบของข้อมูลและะความสัมพันธ์ระหว่าง ข้อมูล การวิเคราะห์เชิงทำ นาย ดำ เนินการ ต่อจากการวิเคราะห์เชิงพรรณนา หลัง จากที่พบว่าข้อมูลมีความสัมพันธ์กัน โดยนำ ข้อมูลที่สัมพันธ์กันนั้นมาสร้าง เป็นรูปแบบบเพื่อการทำ นาย
อ้างอิง เนื้อหา HTTPS://CHAT.GOOGLE.COM/DM/JGLM90AAAAE/ FIPJVBTU7NY/FIPJVBTU7NY HTTPS://CHAT.GOOGLE.COM/DM/JGLM90AAAAE/ YARBUZW-ZMU/YARBUZW-ZMU รูปภาพ HTTPS://CHAT.GOOGLE.COM/DM/JGLM90AAAAE/ YARBUZW-ZMU/YARBUZW-ZMU HTTPS://WWW.GOOGLE.COMHTTPS://WWW.GOO GLE.COM HTTPS://IMAGES.APP.GOO.GL/KZHP6KP9T1NIU NVA8