การประมวลผลข้อมูล 1 ความหมายของข้อมูล ข้อมูล(data) หมายถึง ข้อเท็จจริง (fact) ที่อยใู่นรูปแบบตวัอกัษร ตวัเลข สัญลกัษณ ์ พิเศษ รูปภาพ ภาพเคลื่อนไหว และเสียง ซ่ึงสามารถบนัทึกไวอ ้ ยา่งต่อเนื่องและมีความหมายอยใู่น ตวัเช่น ชื่อนกัเรียน อายุเพศจา นวนประชากร ปริมาณน้า ฝน เป็ นตน ้ ขอ ้ มลูจะมีอยจู่า นวนมาก และจะถูกนา ไปประมวลผลเพอื่ใชป้ ระโยชน ์ในเรื่องต่าง ๆ ไดม ้ ากมาย ประเภทของข้อมูล สามารถแบ่งประเภทขอ ้ มูลไดห ้ ลายรูปแบบข้ึนอยกู่บัความตอ ้ งการลกัษณะของขอ ้ มูลที่ น าไปใช้และเกณฑ์ที่น ามาพิจารณา 1. การแบ่งข้อมูลตามลกัษณะของข้อมูลเป็ นการแบ่งขอ ้ มูลข้นัพ้ืนฐานโดยพิจารณาจากการรับขอ ้ มูล ของประสาทสัมผัส (Sense) ของร่างกายไดแ ้ ก่ข้อมูลภาพที่ได้รับจากการมองเห็นด้วยดวงตา ขอ ้ มูลเสียงที่ไดร ้ับจากการฟังดว ้ ยหูขอ ้ มูลกลิ่นที่ไดร ้ับจากการสูดดมดว ้ ยจมูกขอ ้ มูลรสชาติที่ ไดร ้ับจากการรับรสชาติดว ้ ยลิ้น และขอ ้ มูลสัมผสัที่ไดร ้ับจากความรู้สึกดว ้ ยผวิหนงั 2. การแบ่งข้อมูลตามแหล่งข้อมูลที่ได้รับโดยพิจารณาจากลักษณะของที่มาหรือการได้รับข้อมูล - ข้อมูลปฐมภูมิ(Primary Data) คือขอ ้ มูลที่ไดจ ้ ากจุดกา เนิดของขอ ้ มูลน้นัๆ เป็ นการเกบ ็ รวบรวมหรือบนัทึกจากแหล่งขอ ้ มูลโดยตรงดว ้ ยวิธีการต่างๆ เช่น การสอบถาม การ สัมภาษณ ์ การสา รวจการจดบนัทึก ตลอดจนการใชเ ้ ทคโนโลยตีางๆ ซึ่งข้อมูลปฐมภูมิจัดเป็ น ่ ขอ ้ มูลที่มีความน่าเชื่อถือมากที่สุด ตวัอยา่งขอ ้ มูลปฐมภูมิไดแ ้ ก่ขอ ้ มูลการมาโรงเรียนสายของ นกัเรียนช้นัมธัยมศึกษาปีที่1 ซึ่งได้จากการจดบันทึกในรอบ 1 เดือนที่ผา่นมา - ข้อมูลทุติยภูมิ(Secondary Data) คือ การน าข้อมูลที่ผอู้ื่นไดเ ้ ก ็ บรวบรวม หรือบนัทึกไวแ ้ ลว ้ มาใชง ้ าน ผใู้ ชไ้ ม่จา เป็ นตอ ้ งเก ็ บรวบรวมหรือบนัทึกดว ้ ยตนเองจดัเป็ นขอ ้ มูลที่ เกิดข้ึนในอดีต มกัผา่นการประมวลผลแลว ้ บางคร้ังจึงไม่ตรงกบัความตอ ้ งการของผใู้ ช ้ และขอ ้ มูล
ที่ไดม ้ีความคลาดเคลื่อน ไม่ทนัสมยัตวัอยา่งขอ ้ มูลทตุิยภูมิไดแ ้ ก่สถิติการมาโรงเรียนสายของ นกัเรียนช้นัมธัยมศึกษาปีที่1 ในปี พ.ศ. 2551 3. การแบ่งข้อมูลตามการจัดเกบ็ ในสื่ออเิลก็ทรอนิกส ์ มีลกัษณะคลา ้ ยการแบ่งขอ ้ มลูตามลกัษณะของ ขอ ้ มูลแต่มีการแยกลกัษณะขอ ้ มูลตามชนิดและนามสกุลของขอ ้ มูลน้นัๆ ซ่ึงจะต้งัตามประเภทของ ข้อมูลและโปรแกรมที่ใชส้ ร ้ างขอ ้ มูลไดแ ้ ก่ - ข้อมูลตัวอกัษร(Text Data) เช่น ตวัหนงัสือ ตวัเลขและสัญลกัษณ ์ ขอ ้ มูล ประเภทน้ีมกัมีนามสกุลตอ่ทา ้ ยไฟลเ ์ป็ น .txt และ .doc - ข้อมูลภาพ (Image Data) เช่น ภาพกราฟิกตา่งๆ และภาพถ่ายจากกลอ ้ งดิจิตอล ข้อมูลประเภทน้ีมกัมีนามสกุลตอ่ทา ้ ยไฟลเ ์ป็ น .bmp .gif และ .jpg - ข้อมูลเสียง (Sound Data) เช่น เสียงพดูเสียงดนตรีและเสียงเพลงขอ ้ มูล ประเภทน้ีมกัมีนามสกุลตอ่ทา ้ ยชื่อไฟลเ ์ป็ น .wav .mp3 - ข้อมูลภาพเคลอื่นไหว(Video Data) เช่นภาพเคลื่อนไหว ภาพมิวสิควีดิโอ ภาพยนตร ์ คลิปวีดีโอขอ ้ มูลประเภทน้ีมกัมีนามสกุลต่อทา ้ ยชื่อไฟลเ ์ป็ น .avi .mov 4. การแบ่งข้อมูลตามระบบคอมพวิเตอร ์ มีลกัษณะคลา ้ ยและใกลเ ้ คียงกบัการแบ่งขอ ้ มูลตามการ จดัเก ็ บในสื่ออิเลก ็ ทรอนิกส ์ มากแต่มุ่งเนน ้ พิจารณาการแบ่งประเภทตามการน าข้อมูลไปใช้งานใน ระบบคอมพวิเตอร ์ไดแ ้ ก่ - ข้อมูลเชิงจ านวน (Numeric Data) มีลักษณะเป็ นตัวเลขที่สามารถน ามา คา นวณดว ้ ยคอมพวิเตอร ์ได ้ เช่น จา นวนเงินในกระเป๋าจา นวนค่าโดยสารรถประจา ทางและ จ านวนนักเรียนในห้องเรียน - ข้อมูลอกัขระ(Character Data) มีลักษณะเป็ นตัวอักษร ตัวหนังสือ และ สัญลกัษณ ์ ต่างๆ ซ่ึงสามารถนา เสนอขอ ้ มูลและเรียงลา ดบัไดแ ้ ต่ไม่สามารถนา มาคา นวณได ้ เช่น หมายเลขโทรศัพท์ เลขที่บ้าน และชื่อของนักเรียน
- ข้อมูลกราฟิก(Graphical Data) เป็ นขอ ้ มูลที่เกิดจากจุดพกิดัทางคอมพวเตอร์ ิ ทา ใหเ ้ กิดรูปภาพหรือแผนที่เช่น เครื่องหมายการคา ้ แบบก่อสร ้ างอาคารและกราฟ - ข้อมูลภาพลกัษณ ์(Image Data) เป็ นข้อมูลแสดงความเข้มและสีของรูปภาพที่ เกิดจากการสแกนของสแกนเนอร ์ เป็ นหลกัซ่ึงสามารถนา เสนอขอ ้ มูลยอ่หรือขยายและตดัตอ่ ได ้ แต่ไม่สามารถนา มาคา นวณหรือดา เนินการอยา่งอื่นได ้
กษณะของข้อมูลที่ดี ขอ้มูลที่ดีจะตอ้งประกอบดว้ยคุณสมบตัิที่สา คญัๆ ดงัน้ีคือ 1. ความถูกต้องแม่นย า (accuracy) ข้อมูลที่ดีควรจะมีความถูกต้องแม่นย าสูง หรือถ้ามีความคลาดเคลื่อน (errors) ปน อยู่บ้าง ก็ควรที่จะสามารถควบคุมขนาดของความคลาดเคลื่อนที่ปนมาให้มีความคลาดเคลื่อน น้อยที่สุด 2. ความทันเวลา (timeliness) เป็ นข้อมูลที่ทันสมัย (up to date) และทันต่อความต้องการของ ผู้ใช้ ถ้าผลิตข้อมูล ออกมาช้า ก็ไม่มีคุณค่าถึงแม้จะเป็ นข้อมูลที่ถูกต้องแม่นย าก็ตาม 3. ความสมบูรณ์ครบถ้วน (completeness) ข้อมูลที่เก็บรวบรวมมาต้องเป็ นข้อมูลที่ให้ข้อเท็จจริง (facts) หรือ ข่าวสาร (information) ที่ครบถ้วนทุกด้านทุกประการ มิใช่ขาดส่วนหนึ่งส่วนใดไปท าให้น าไปใช้การไม่ได้ 4. ความกะทัดรัด (conciseness) ข้อมูลที่ได้รับส่วนใหญ่จะกระจัดกระจาย ควรจัดข้อมูลให้อยู่ใน รูปแบบที่กะทัดรัด สะดวกต่อการใช้และค้นหา ผู้ใช้มีความเข้าใจได้ทันที 5. ความตรงกับความต้องการของผู้ใช้ (relevance) ขอ้มูลที่จดัทา ข้ึนมาควรเป็นขอ้มูลที่ผใู้ชข้อ้มูลตอ้งการใช้และ จา เป็นตอ้งรู้/ ทราบ หรือเป็นประโยชน์ต่อการจดัทา แผนกา หนดนโยบายหรือตดัสินปัญหาในเรื่องน้นัๆ ไม่ใช่เป็นขอ้มูลที่จดัทา ข้ึนมาอยา่ง มากมาย แต่ไม่มีใครต้องการใช้หรือไม่ตรงกับความต้องการของผู้ใช้ข้อมูล 6. ความต่อเนื่อง (continuity) การเก็บรวบรวมขอ้มูลควรอย่างยิ่งที่จะตอ้งดา เนินการอยา่งสม่า เสมอและต่อเนื่องใน ลักษณะของอนุกรมเวลา (time-series) เพื่อจะได้น าไปใช้ประโยชน์ในด้านการวิเคราะห์วิจัยหรือหาแนวโน้มในอนาคต