The words you are searching are inside this book. To get more targeted content, please make full-text search by clicking here.

วิทยาการข้อมูล

Discover the best professional documents and content resources in AnyFlip Document Base.
Search
Published by Panya Chanthachat, 2023-02-12 21:27:35

วิทยาการข้อมูล

วิทยาการข้อมูล

วิทยาการ ข้อมูล E-book เล่มนี้เป็น ป็ ส่วนหนึ่งของ รายวิชา วิทยาการคำ นวณ จัดทำ โดย นายปัญ ปั ญา จันทฆาต เลขที่4 นายศุภกิจ ทองสัมฤทธิ์ เลขที่9 ชั้นมัธยมศึกษาปีที่ ปี ที่ 5/2


คำ นำ หนังสือวิทยาการคำ วณ เรื่อง วิทยาการข้อมูลได้จัดทำ เพื่อใช้ ประกอบการเรียนการสอนสำ หรับนักเรียนตลอดจนบุคคลที่สนใจ โดยผู้พัฒนาได้แบ่งเนื้อหาของหนังสือวิทยาการคำ วณไว้ได้แก่ วิทยาการข้อมูล การวิเคราะห์ข้อมูล และอื่นๆ หวังอย่างยิ่งว่า เนื้อหา สาระของหนังสือเล่มนี้จะเป็นป็ ประโยชน์และให้ความรู้แก้ผู้เรียนและผู้ สนใจทั่วไป


สารบัญ บั เนื้อ นื้ หา หน้า น้ วิทยาการข้อมูล 1 องค์ความรู้ กระบวนการข้อมูล 2 3 ข้อูลขนาดใหญ่ 4 คุณลักษณะ Big Data 5 แหล่งข้อมูล Big Data บทบาท Big Data รูปแบบของการจัดเก็บข้อมูล การวิเคราะห์ข้อมูล รูปแบบการวิเคราะห์ข้อมูลข้อมูล 6 7 8 9 10


วิท วิ ยาการข้อ ข้ มูล วิทยาการข้อมูล (Data Science) คือ ศาสตร์ในการจัดการ จัดเก็บ รวบรวม ตรวจสอบ ประมวลผล วิเคราะห์ และนำ เสนอ ผลของการวิเคราะห์ข้อมูล เพื่อนำ ไปสู่การค้นหาความรู้ที่ซ่อนอยู่ใน ข้อมูลซึ่งสามารถนำ ไปใช้ประโยชน์ได้ โดยการวิทยาการข้อมูลจะ ดำ เนินการวิเคราะห์ข้อมูลตามกระบวนการวิทยาการข้อมูลโดย นักวิทยาศาสตร์ข้อมูล (Data Science) จะใช้ Big Data เป็นป็แหล่งข้อมูลหลัก เนื่องจาก Big data เป็นป็ข้อมูลขนาดใหญ่ และมีคุณลักษณะสำ คัญ 4 ประการคือปริมาณข้อมูล ความเร็วใน การเพิ่มขึ้นของข้อมูล ความหลากหลายของข้อมูล และคุณภาพ ของข้อมูล หากสามารถค้นหาความรู้ที่ซ่อนอยู่ใน Big data ได้ จะทำ ให้เกิดประโยชน์ในด้านต่างๆได้มากมาย


องค์ความรู้ สำ หรับ รั วิทวิยาการข้อ ข้ มูล องค์ความรู้สำ หรับวิทยาการข้อมูล วิทยาการข้อมูลเกิดจาก การบูรณาการร่วมกันระหว่าง ความรู้ 3 ด้าน ดังนี้ 1)ความรู้ด้านคณิตศาสตร์และสถิติ (Mathematics) คือ การนำ หลักการคณิตศาสตร์และสถิติมาใช้ในการวิเคราะห์ข้อมูล 2) ความรู้ด้านวิทยาการคอมพิวเตอร์ (Computer Science) คือ การนำ ความรู้ทางด้าน คอมพิวเตอร์ 3) ความรู้เฉพาะทาง (Domain Expertise) คือ การนำ องค์ ความรู้เฉพาะทาง ต่าง ๆ เช่น ความรู้ด้านเศรษฐศาสตร์ ความรู้ ด้านการตลาด เป็นป็ต้น


กระบวนการวิทวิยาการข้อ ข้ มูล 1) กำ หนดปัญปัหา คือ ขั้นตอนแรกในการใช้วิทยาการข้อมูล ซึ่งเป็นป็ขั้นตอนสำ คัญ ขั้นตอนหนึ่ง คือ การกำ หนดปัญปัหาและสิ่งที่ ต้องการจากข้อมูลที่มีอยู่ด้วยการตั้งคำ ถาม ที่เหมาะสมเพื่อนำ ไปสู่ ปัญปัหาและการแก้ปัญปัหา 2) เก็บข้อมูลดิบที่จำ เป็น คือ การหาข้อมูลเพื่อนำ มาตอบ คำ ถามต่าง ๆ ที่ได้จากขั้นตอนที่ 1 ซึ่งการเก็บข้อมูลดิบนี้จะเก็บ ข้อมูลจากฐานข้อมูล ขนาดใหญ่ 3) ประมวลผลข้อมูล คือ การนำ ข้อมูลดิบ เหล่านั้นมาประมวล ผล และทำ ความสะอาดข้อมูล เพื่อเตรียมข้อมูลให้พร้อมสำ หรับการ วิเคราะห์ 4) การวิเคราะห์เพื่อวินิจฉัยข้อมูล คือ กระบวนการวิเคราะห์ ข้อมูลเพื่อค้นหารูปแบบ ที่เชื่อมโยงกันของข้อมูล ค้นหาจุดผิดปกติ เพื่อทดสอบสมมติฐาน 5) การสร้างแบบจำ ลองข้อมูล คือ ขั้นตอนการใช้เทคนิคทาง สถิติเชิงลึก และอัลกอริทึมขั้นสูง เพื่อหาแบบจำ ลองสำ หรับการ พยากรณ์ข้อมูลต่าง ๆ เช่น การทำ ให้เครื่องคอมพิวเตอร์ เรียนรู้ ด้วยตนเอง 6) การนำ เสนอรายงานผลการวิเคราะห์ข้อมูล คือ ขั้นตอน การนำ ผลการวิเคราะห์ และการสรุปแบบจำ ลองที่ได้จาก ขั้นตอน ก่อนหน้านี้มานำ เสนอในลักษณะที่ง่ายในการทำ ความเข้าใจ และนำ ไป สู่การ ตัดสินใจต่าง ๆ จากข้อมูลที่ได้ทำ การวิเคราะห์


จากปริมาณการใช้งานข้อมูลต่างๆ มีอัตราเติบโตที่สูงขึ้นแบบ ก้าวกระโดด โดยข้อมูลเหล่านี้เป็นป็ข้อมูลที่มี หลากหลายรูปแบบ เช่น ข้อความ ภาพ เสียง อีกทั้งเป็นป็ข้อมูล ที่มีโครงสร้าง และไม่มี โครงสร้าง จึงจำ เป็นป็ต้องมีการบริหารจัดการข้อมูลเหล่านี้ เพื่อให้ สามารถ นำ ข้อมูลมาใช้ประโยชน์ต่าง ๆ ได้อย่างมากมายมหาศาล และมีประสิทธิภาพสูงสุด ซึ่งการบริหาร จัดการข้อมูลขนาด มหาศาลนี้เรียกว่า Big Data Big Data คือ การนำ ข้อมูลที่มี ปริมาณมหาศาล (ซึ่งโดย ทั่วไปนั้นปริมาณ ข้อมูลจะสูงกว่าคลังข้อมูล) มาจัดเก็บ ประมวล ผล การใช้กระบวนการวิเคราะห์ ข้อ ข้ มูลขนาดใหญ่


คุณลักษณะของ Big Data คุณลักษณะของ Big Data มี 4 ประการ ดังนี้ 1) ปริมาณข้อมูล (Volume) คือ คุณลักษณะของข้อมูลที่มีปริมาณ มหาศาล ซึ่งในอดีตเทคโนโลยีการเก็บ ข้อมูลที่มีขนาดใหญ่นั้น ไม่สามารถทำ ได้ แต่ในปัจปัจุบันเทคโนโลยี Big Data ทำ ให้ การบริหารจัดการ การประมวลผล ข้อมูล ที่มีขนาดใหญ่นี้เป็นป็เรื่องที่สะดวกขึ้น 2) ความเร็วในการเพิ่มขึ้นของข้อมูล (Velocity) คือ คุณลักษณะของ ข้อมูลที่มี การเปลี่ยนแปลงอย่างรวดเร็วตลอดเวลา ซึ่งมักเป็นป็แบบทันทีทันใด (Real-time) เช่น ข้อมูลการใช้งานเครือข่ายสังคม ออนไลน์ ข้อมูลการทำ ธุรกรรมทาง การเงินต่าง ๆ 3) ความหลากหลายของข้อมูล (Variety) คือ คุณลักษณะของข้อมูลที่มี หลากหลาย รูปแบบ ทั้งที่เป็นป็รูปแบบที่มีโครงสร้าง เช่น ฐานข้อมูลต่าง ๆ รูป แบบข้อมูล ที่ไม่มีโครงสร้าง เช่น ข้อความ รูปภาพ เสียง วีดิทัศน์ 4) คุณภาพของข้อมูล (Veracity) คือ คุณลักษณะของข้อมูลที่ต้องมี คุณภาพ มีความถูกต้อง เชื่อถือได้ หากข้อมูล มีคุณภาพต่ำ จะส่งผลกระทบต่อ การ ประมวลผลและการวิเคราะห์ข้อมูลได้ เช่นกัน


แหล่งข้อมูลของ Big Data แหล่งข้อมูล Big Data มีหลายแหล่ง เช่น • ข้อมูลเว็บไซต์ Social Network เป็นป็เว็บไซต์ที่ผู้ใช้แลกเปลี่ยน ข้อมูลเพื่อติดต่อสื่อสาร เช่น ข้อความ รูปภาพ วิดีโอ ทั้งหมด ของประชากรไทย • ข้อมูลเว็บไซต์ E-Commerce เป็นป็เว็บไซต์ซื้อสินค้าออนไลน์ ซึ่งจะมีการจัดเก็บข้อมูล พฤติกรรมการซื้อสินค้าของลูกค้า ทั้งหมดในประเทศไทย • เว็บไซต์ที่ให้บริการ Search Engine เป็นป็เว็บไซต์สำ หรับค้นหา ข้อมูล ซึ่งมีการเก็บข้อมูล ดัชนีคำ ค้นหาหรือรูปภาพที่ใช้สำ หรับ ค้นหา


ด้านสุขภาพและสาธารณสุข ด้านระบบขนส่งและอุตสาหกรรมโลจิสติกส์ ด้านสภาพภูมิอากาศ ด้านการดำ เนินธุรกิจ ด้านการสื่อสาร บทบาทของ Big Data


รูปแบบทั่วไปของการจัดเก็บข้อมูล และการวิเคราะห์ข้อมูล Big Data สามารถแบ่งได้เป็นป็ 4 ขั้นตอน ดังนี้ Register การลงทะเบียนข้อมูลที่สนใจ Follow-up Data Collection การติดตามข้อมูล Analyze การวิเคราะห์ข้อมูล Respond การตอบสนองต่อข้อมูลหรือผลจากการวิเคระห์ รูปแบบของการจัดเก็บข้อมูล


การวิเคราะห์ข้อมูล การวิเคราะห์ข้อมูล (Data Analytics) เป็น ป็ ศาสตร์ของการ วิเคราะห์ข้อมูลต่าง ๆ จากข้อมูลในรูป แบบที่มีความหลากหลาย จากแหล่งข้อมูลที่มีความแตก ต่าง โดยการนำ ข้อมูลเหล่านั้นมา ทำ การประมวลผลโดย ใช้เทคโนโลยีหรือชุดคำ สั่ง และแบบจำ ลองที่สร้างขึ้น เพื่อนำ ข้อมูลที่ได้ผ่าน การวิเคราะห์มาใช้งาน หรือแปล ความหมายโดยบุคคลที่มีความรู้ในเทคโนโลยี


1) การวิเคราะห์ข้อมูลแบบพื้นฐาน (Descriptive Analytics) เป็น ป็ การวิเคราะห์เพื่อแสดง รายการ เหตุการณ์ หรือกิจกรรมต่าง ๆ ที่เกิดขึ้น ในลักษณะที่ ง่ายต่อการทำ ความเข้าใจ 2) การวิเคราะห์แบบพยากรณ์ (Predictive Analytics) เป็น ป็ การวิเคราะห์เพื่อการพยากรณ์ หรือ ทำ นายสิ่งที่เกิดขึ้น โดยใช้ข้อมูลในอดีตร่วมกับโมเดลทาง คณิตศาสตร์ หรือสถิติต่าง ๆ 3) การวิเคราะห์แบบให้คำ แนะนำ (Prescriptive Analytics) เป็น ป็ รูปแบบการวิเคราะห์ข้อมูล ที่มีความซับ ซ้อนและยากที่สุด เพราะไม่เพียงพยากรณ์หรือทำ นายว่า อะไรจะเกิดขึ้น แต่ยังให้ คำ แนะนำ ในทางเลือกต่าง ๆ รูปแบบของการวิเคราะห์ ข้อมูล


Click to View FlipBook Version