ความหมายของ Big Data 6 12 สารบัญ องค์ประกอบที่สำ คัญของข้อมูล คุณลักษณะของ Big Data ประโยชน์ของ Big Data ประเภทของ Big Data การจัดการโครงสร้าง Big Data บุคล ากรแล ะทักษะ กา รทำ Big Da t a 1 2-3 4-5 6-7 8-10 10-14 15-16
Big Data หมายถึง ปริมาณข้อมูลที่มหาศาล ทั้งแบบข้อมูลที่มีโครงสร้างและไม่มีโครงสร้าง ซึ่งปะปนอยู่มากมายในการทำ ธุรกิจ ในแต่ละวัน หากแต่ไม่ใช่ปริมาณของข้อมูล ที่เป็นสิ่งสำ คัญ สิ่งสำ คัญก็คือการที่องค์กร จัดการกับข้อมูลต่างหากการวิเครา ะห์ Big Data นำ ไปสู่ข้อมูลเชิงลึกเพื่อการตัดสินใจที่ดีกว่า และการเคลื่อนไหวในกลยุทธ์ธุรกิจ BIG DATA 1
2. Gateuay ช่องทางการเชื่อมโยงข้อมูล การเชื่อมโยงข้อบูล เป็นส่วนที่สำ คัญมาก และเป็นปัญหาใหญ่ในการทำ Big Data Project ต้องอาศัยทักษะของ Data Engineer ทั้งการเขียน โปรแกรมเอง และใช้เครื่องมือที่มีอยู่มากมาย 1. Data Source แหล่งที่มาของข้อมูล ซึ่งถือได้ว่า เป็นต้นน้ำ เป็นแหล่งกำ เนิดของข้อมูล อาจจะเป็นระบบ โปรแกรม หรือจะเป็นมนุษย์เรา ที่สร้างให้เกิดข้อมูลขึ้นมา ทั้งนี้เมื่อได้ชื่อว่าเป็น Big Data และข้อมูลต่างๆ องค์ประกอบที่สำ คัญของข้อมูล 3. Storage แหล่งเก็บข้อมูล แหล่งเก็บน้ำ ไม่ใช่แค่การเก็บขังมูลจากแหล่งข้อมูล แต่เป็นการเก็บข้อมูลจากแหล่งขัอมูลหลายๆ 2
3 4. Analyt ics การวิ เครา ะห์ข้อมูล ส่วนนี้เป็นหน้าที่หลักของ Data Scient i s t ซึ่งแบ่ง ง านออกเป็น 2ลักษณะ คือ การวิ เครา ะห์เบื้องต้น โดยการใช้วิธีการสถิติ 5 . R e s u l t / A c t i o n ก า ร ใ ช้ ผ ล ก า ร วิ เ ค ร า ะห์ข้ อ มู ล ผ ล ลั พ ธ์ ที่ ไ ด้ จ า ก ก า ร วิ เ ค ร า ะห์ ส า ม า ร ถนำ ไปใ ช้ ง านไ ด้ 2 รูปแบบ คื อ อ อ ก เป็นจ า ย ง าน เ พื่ อ ให้ D a t a A n a t y s t นำ ผ ล ลั พ ธ์ ที่ ไ ด้ ไปใ ช้ กับง านท า ง ธุ ร กิ จ ต่ อ ไป องค์ประกอบที่สำ คัญของข้อมูล
4 คุณลักษณะของ Big Data 1 . ปริมาณ (Volune) หมายถึง ปริมาณของข้อมูล คว รมีจำ นวนมากพอ ทำ ให้เมื่อนำ มา วิ เคร า ะห์ แล้ว จ ะได้ Ins ight s ที่ตร งกับคว ามเป็นจ ริ ง เช่น กา รที่เ ร ามีข้อมูลอายุ เพศ เป็นต้น 2. ความหลากหลาย (Variety) หมายถึง รูปแบบของข้อมูล ควรหลากหลายแตกต่างกันออกไป ทั้งแบบโครงสร้าง, กึ่งโครงสร้าง,ไม่มีโครงสร้าง ทำ ให้เราสามารถนำ มา วิเคราะห์ประกอบกันจนได้ Insights ครบถ้วน 3. ความเร็ว (Vetocity) หมายถึง คุณลักษณะข้อมูล ที่ถูกสร้างขึ้นอย่างรวดเร็วต่อเนื่องและทันเหตุการณ์
5 4. ความถูกต้อง (Jeracicy) หมายถึง มีความน่าเชื่อถือ ของแหล่งที่มาข้อมูลและความถูกต้องของชุดข้อมูล มีกระบวนการในการตรวจสอบ และยืนยันความถูกต้องของข้อมูล 5. คุณค่า (Vatue) หมายถึง ข้อมูลมีปจะโยชน์ และมีคว ามสัมพันธ์ในเชิงธุรกิจ ซึ่งต้อง เข้าใจก่อนว่ าไมใช่ทุกข้อมูล จะมีประโยชน์ในการเก็บและ วิ เครา ะห์ 6. ความแปรผันได้ (Variability) หมายถึง ข้อมูลสามารถในการเปลี่ยนแปลงรูปแบบ ไปตามการใช้งานหรือสามารถคิด วิเคราะห์ได้จากหลายแง่มุม คุณลักษณะของ Big Data
6 ประโยชน์ของ Big Data 1 . ก า ร ส ะ ส ม ข้ อ มู ล จ า กหล ายแหล่ ง ร ว ม ถึ ง อินเทอ ร์ เน็ต แ พ ลต ฟ อ ร์ ม โซเ ชียล มี เ ดีย เ ว็บไซต์ ช็ อปปิ้ง อ อนไ ลน์ ฐ านข้ อ มู ล ช อ งบริ ษั ท แหล่ ง ข้ อ มู ลภายนอ กบุค ค ลที่ส า ม เป็นต้น 2 . ก า ร ค า ด ก า ร ณ์ ต า ม เ ว ล า จ ริ ง แ ล ะ ก า ร ต ร ว จ ส อ บ ธุ ร กิ จ ต ล อ ด จ น ต ล า ด 3 . ร ะบุจุ ด สำ คั ญ ที่ซ่ อนอ ยู่ ภ า ย ในชุ ด ข้ อ มู ล ขนา ด ให ญ่ เ พื่ อ โน้มน้า ว ก า รตัด สินใ จทา ง ธุ ร กิ จ 4 . ล ด ค ว า ม เ สี่ ย ง ในทันที่ด้ ว ย ก า ร เ พิ่ มปร ะ สิทธิ ภ า พ ก า รตัด สินใ จที่ชับซ้ อนสำ หรับเหตุก า ร ณ์ ที่ไ ม่ ค า ด ฝันแล ะ ภั ย คุ ก ค า มที่อ า จ เ กิ ด ขึ้น 5 . ร ะบุปั ญ หา ในร ะบบแล ะ ก ร ะบวนก า รทา ง ธุ ร กิ จ แบบเ รียล ไทม์ ปล ด ล็ อ ก ศั กยภา พ ที่แท้จ ริ ง ข อ ง ก า รตล า ดที่ขับเ ค ลื่ อนด้ วยข้ อ มู ล
7 6 . ค้นหา ข้ อ มู ล ลู ก ค้ า เ พื่ อ ส ร้ า ง ผ ลิ ต ภั ณ ฑ์ บริ ก า ร ข้ อ เ สนอ ส่ วนล ด แล ะ อื่น ๆ 7 . อำ นวยค ว ามสะ ด วกในกา ร จั ดส่งผลิตภัณฑ์ หรื อบริกา รที่ตร งแล ะเกินค ว ามค า ดหวั ง ข อ ง ลูกค้ า อย่า ง ร ว ด เ ร็ ว 8. กระ จ ายกระแสรายได้ เพื่อเพิ่มผลกำ ไรและ ROI ของบริษัท 9 . ตอบสนองต่อคำ ขอของลูกค้า คว ามคับข้องใจ และข้อสงสัยแบบเ รียลไทม์ 10. ส่งเสริมนวัตกรรมของกลยุทธ์ทางธุรกิจ ผลิตภัณฑ์ และบริการใหม่ ประโยชน์ของ Big Data
โครงสร้าง ไม่มีโครงสร้าง กึ่งโครงสร้าง 8 ประเภทของ Big Data ตัวอย่างของข้อมูลที่มีโครงสร้าง ข้อมูลใดๆ ที่สามารถจัดเก็บ เข้าถึง และประมวล ผลในรูปแบบคงที่จะเรียกว่าข้อมูลที่มีโครงสร้าง ข้อมูลที่มีนิยามโครงสร้างข้อมูลไว้อย่างชัดเจน ทำ ให้ง่ายในการสืบค้น พร้อมใช้งานต่อยอดได้ ทันที ตัวอย่างเช่น ฐานข้อมูล ที่เป็นตาราง หรือ ไฟล์รูปแบบ Spreadsheet อย่างเช่นไฟล์ Excel 1.ข้อมูลแบบมีโครงสร้าง
9 ข้อมูลใดๆ ที่มีรูปแบบหรือโครงสร้างที่ไม่รู้จักจัด เป็นประเภทข้อมูลที่ไม่มีโครงสร้าง นอกเหนือจาก ขนาดใหญ่มาก ยังก่อให้เกิดความท้าทายหลาย ประการในแง่ของการประมวลผลเพื่อให้ได้คุณค่าจาก ข้อมูลนั้น อย่างเช่น เอกสารกระดาษ รูปภาพ วีดีโอ เสียง ข้อความยาว ๆ บนโลกโซเชียลเน็ตเวิร์ก 2.ข้อมูลแบบไม่มีโครงสร้าง ตัวอย่างของข้อมูลที่ไม่มีโครงสร้าง
10 ข้อมูลกึ่งโครงสร้างสามารถมีได้ทั้งสองรูปแบบของ ข้อมูล เราสามารถเห็นข้อมูลกึ่งโครงสร้างเป็น โครงสร้างในรูปแบบ แต่จริงๆ แล้วไม่ได้กำ หนดไว้ เช่น นิยามตารางใน DBMS เชิงสัมพันธ์ 3.ข้อมูลแบบกึ่งโครงสร้าง ตัวอย่างของข้อมูลแบบกึ่งโครงสร้าง
11 การจัดการโครงสร้าง Big Data การนำ Big Data มาใช้งานควรพิจารณาว่าข้อมูลไหล ไปยังสถานที่ แหล่งที่มา ระบบ เจ้าของ และผู้ใช้จำ นวนมาก มีทั้งหมด 5 ขั้นตอน กำ หนดกลยุทธ์ 1. เกี่ยวกับข้อมูลขนาดใหญ่ ในระดับสูง กลยุทธ์ข้อมูลขนาดใหญ่เป็นแผนที่ออกแบบ มาเพื่อช่วยคุณในการกำ กับดูแลและปรับปรุงวิธีที่ได้รับ จัดเก็บ จัดการ แบ่งปัน และใช้ข้อมูลภายในและภายนอก องค์กร กลยุทธ์ข้อมูลขนาดใหญ่ช่วยปูทางไปสู่ความสำ เร็จ ทางธุรกิจท่ามกลางข้อมูลจำ นวนมาก เมื่อพัฒนากลยุทธ์สิ่งสำ คัญคือต้องพิจารณาเป้าหมาย ทางธุรกิจและเทคโนโลยี เพราะมีความจำ เป็นอย่างมาก ทั้งในอดีตและปัจจุบัน เช่น ทรัพย์สินทางธุรกิจ ที่มีค่าอื่นๆ แทนที่จะเป็นเพียงผลพลอยได้ ของแอปพลิเคชัน
12 2.รู้แหล่งที่มา 2. ของข้อมูลขนาดใหญ่ 2 . 1 กระแสข้อมูล มา จ าก Internet of Things (IOT) และอุปกรณ์ที่เชื่อมต่ออื่นๆที่ไหลเข้าสู่ระบบ ไอที่จ ากอุปกรณ์สวมใส่ รถยนต์อัจฉริยะ อุปกรณ์ทา งการแพทย์ อุปกรณ์อุตสาหกรรมและอื่นๆ ซึ่งสามารถวิ เครา ะห์ข้อมูลขนาดใหญ่นี้ได้เมื่อมาถึง รวมถึงตัดสินใจ เลือกข้อมูลที่จ ะเก็บหรือไม่เก็บ และข้อมูลใดที่ต้องมีการวิ เครา ะห์เพิ่มเติม 2.2 โซเชียลมีเดีย ข้อมูลเกิดจากการโต้ตอบบน Facebook, YouTube,Instagram ฯลฯ ซึ่งรวมถึงข้อมูลขนาดใหญ่จำ นวนมหาศาลในรูปแบบ ของภาพ วิดีโอ คำ พูดข้อความ และเสียง-มีประโยชน์ สำ หรับฟังก์ชันการตลาด การขาย และการสนับสนุน ข้อมูลนี้มักจะอยู่ในรูปแบบที่ไม่มีโครงสร้างหรือ กึ่งโครงสร้างดังนั้นจึงเป็นความท้าทายในแบบเฉพาะ สำ หรับการบริโภค และการวิเคราะห์
13 2.3 ข้อมูลที่เปิดเผยต่อสาธารณชน มาจากแหล่งข้อมูลแบบเปิดขนาดใหญ่ เช่น data.gov ของรัฐบาลสหรัฐ, CIA World Factbook หรือพอร์ทัลข้อมูลแบบเปิด ของสหภาพยุโรป 2.4 ข้อมูลขนาดใหญ่อื่น ๆ อาจมาจากพื้นที่เก็บ ข้อมูลส่วนกลา ง แหล่งข้อมูลบนระบบ คลา วด์ซัพพลายเออร์ และลูกค้า
14 ระบบคอมพิวเตอร์สมัยใหม่มีความเร็ว พลัง และความยืดหยุ่น ที่จำ เป็นในการเข้าถึงข้อมูล จำ นวนมหาศาลและประเภทของข้อมูลขนาดใหญ่ ได้อย่างรวดเร็ว นอกเหนือจากการเข้าถึงที่เชื่อถือได้ แล้วบริษัทต่างๆ ยังต้องมีวิธีในการรวมข้อมูล รับประกันคุณภาพของข้อมูล การจัดระเบียบข้อมูล และการจัดเก็บ และการเตรียมข้อมูล การเข้าถึง จัดการ และจัดเก็บ 3. ข้อมูลขนาดใหญ่ การเข้าถึง จัดการ และจัดเก็บ 4. ข้อมูลขนาดใหญ่ ด้วยเทคโนโลยีที่มีประสิทธิภาพสูง เช่น Gid Computing (การประมวลผลแบบกริด) หรือ การวิเคราะห์ในหน่วยความจำ องค์กรต่างๆ จึงสามารถเลือกที่จะใช้ข้อมูลขนาดใหญ่ทั้งหมด ของพวกเขามาทำ การวิเคราะห์ได้ แต่ไม่ว่าจะใช้วิธีใด การวิเคราะห์ข้อมูลขนาดใหญ่เป็นวิธีที่บริษัทต่างๆ ได้รับ มูลค่าและข้อมูลเชิงลึกจากข้อมูล ปัจจุบันข้อมูลขนาดใหญ่ ป้อนเข้าสู่ระบบการวิเคราะห์ที่มีความก้าวหน้าที่สูงขึ้น เช่น ปัญญาประดิษฐ์
บุคลากรในง านข้อมูลขนาดใหญ่ (Big Da t a personnel) พื้นฐานสำ คัญในกา รพัฒนาบุคลากรในง านด้านนี้ จ ะมีกา รแบ่งกลุ่มคนในง านออกตามหน้าที่ โดยแบ่งกลุ่มหลัก ๆ เพื่อให้บุคลากรทร าบถึง คว ามสำ คัญและตร ะหนักรู้ เกี่ยวกับเทคโนโลยีและเครื่องมือ ที่จ ะต้องใช้ในง านด้านนี้ ซึ่งคว รมีกา ร จัดหลักสูตร ในกา รฝึกอบรมบุคลากรในองค์กร ทั้งกา รบร รยายและฝึกอบรม เชิงปฏิบัติกา ร เพื่อให้บุคลในองค์กรทุกร ะดับมีคว ามรู้คว ามเข้าใจ ในง านเบื้องต้น และทำ กา รพัฒนาบุคลากร ในร ะดับเ จ้ าหน้าที่ปฏิบัติง านให้มีคว ามรู้ และทักษะคว ามชำ นาญเพียงพอ ที่จ ะไปทำ ง านในด้านนี้ในร ะดับพื้นฐานด้วยตนเองได้ ในส่วนของตำ แหน่งบุคลากรด้านนี้ แบ่ง เป็น 15 บุคล ากรแล ะทักษะ กา รทำ Big Da t a
2. วิศวกรข้อมูล (Data Engineer) มีหน้าที่เป็นผู้บริหารจัดการข้อมูลของระบบ ซึ่งจะเริ่มตั้งแต่การรวบรวมข้อมูล การวางแผนการนำ เข้าข้อมูล จากภายนอกระบบเข้ามาจัดเก็บไว้ในระบบ การทำ ความสะอาดข้อมูลให้มีคุณภาพดี เหมาะสม และตรวจสอบคุณภาพวางโครงสร้างของที่จัดเก็บข้อมูล Data Take และ Data Warehouse 16 1. ผู้ดูแลระบบ (System Administrator) มีหน้าที่เป็นผู้ดูแลระบบในงานข้อมูลขนาดใหญ่ทั้งหมด ไม่ว่าจะเป็นการบริหารจัดการระบบ เครือข่าย เครื่องแม่ข่าย การติดตั้งแพลตฟอร์มที่เกี่ยวข้องในงาน การจัดหาจัดเตรียม เครื่องมือในการทำ งานด้านนี้ และจะต้องเป็นผู้ที่จะมา ทำ การบริหารจัดการบัญชีผู้ใช้งานระบบ 3. นักวิเคราะห์ข้อมูล (Data Analyst) มีหน้าที่วิเคราห์ข้อมูลที่อยู่ในระบบว่าข้อมูลที่มีอยู่ สามารถบ่งบอกสถานะอะไรขององค์กรได้บ้างในขณะนั้น และหาคำ ตอบจากโจทย์ปัญหา ที่ทางองค์กรต้องการโดยจากการอ้างอิงข้อมูลในระบบ