สำนักงานคณะกรรมการดิจทิ ลั เพอื่ เศรษฐกจิ และสังคมแหง่ ชาติ
การเลอื ก k มคี า่ สูงๆ กท็ ำเพ่อื นบ้านทอี่ ยูใ่ นกลุ่มอน่ื ๆ เข้ามาด้วยทำให้เกดิ ความแม่นยำนอ้ ยลง
ในการเลือกนั้นจากตัวอย่างที่แสดงค่า k=3 จะเห็นตัวเลือกมีอาหารจีน 1 รายการ และอาหารไทย 2
รายการ ดงั น้นั ตอ้ งเลอื กอาหารไทย ซงึ่ เปน็ การทำนายว่า อาหาร X เป็นอาหารไทย
หลักการทั่วไป คือ เลือกตัวเลือกที่มีมากที่สุดในกลุ่มนั้นเป็นคำตอบหรือเลือกตัวเลือกที่อยู่ใกล้ที่สุดเป็น
คำตอบ สรุปว่า KNN เป็นเทคนิคที่นิยมใช้และใช้เพื่อการแยกแยะจำแนกและใช้เพื่อการทำนายคาดคะเนแบบใช้
ตวั แปรท่มี ีค่าตอ่ เนอื่ ง
6.4 การวเิ คราะหก์ ารถดถอย (Regression Analysis)
การวิเคราะห์การถดถอยเป็นโมเดลสำหรับการหาความสัมพันธ์ระหว่างตัวแปรการทำนาย (Predictor
Variable) ซึ่งเป็นค่าในเงื่อนไข (Attribute) ต่างๆ ใช้ในการอธิบายคุณลักษณะของข้อมูลแถวหนึ่งๆ กับตัวแปร
ตอบสนอง (Response variable) ซงึ่ เป็นคา่ เชิงตัวเลขท่ีต้องการจะทราบหรือทำนาย
การวิเคราะห์การถดถอยจะสามารถทำงานได้ดีหรือเป็นทางเลือกที่ดีในการทำนายข้อมูล ที่ซึ่งค่าใน
เง่ือนไขในเชงิ ตัวเลข การทำงานของการวิเคราะห์การถดถอยจะสามารถแบง่ ไดเ้ ป็นหลายกรณีตามชนดิ ของข้อมูลท่ี
ทำการพจิ ารณาและตามผลลัพธท์ ต่ี ้องการ
วิธีการนี้จะมีตัวแปรอิสระและตัวแปรตาม ซึ่งตัวแปรตามจะมีค่าเปลี่ยนไปตามค่าของตัวแปรอิสระ ดัง
ตารางตวั แปร ค่าโฆษณาและยอดขายของปี 2016 ถึงปี 2021
ปี (ค.ศ.) คา่ โฆษณา ยอดขาย สมมติว่าจะจ่ายค่าโฆษณาในปี
2016 10,000 บาท 50,000 บาท 2021 เป็นเงิน 20,000 บาท
2017 15,000 บาท 80,000 บาท ถ า ม ว ่ า ย อ ด ข า ย ค ว ร จ ะ เ ป็ น
2018 12,000 บาท 60,000 บาท เทา่ ไหร่ ทำนายได้หรอื ไม่
2019 14,000 บาท 70,000 บาท
2020 17,000 บาท 90,000 บาท
2021 20,000 บาท
?
การวิเคราะห์การถดถอยนี้เป็นเทคนิคใช้ในการเรียนรู้แบบมีครู จึงต้องใช้ข้อมูลที่มีลาเบล (รู้ว่าข้อมูลคือ
อะไร) ดังนน้ั ในการทำการวิเคราะห์การถดถอย จะได้แนวโน้มของค่าตัวแปรเปน็ เส้นต่อเนื่องทำให้สามารถทำนาย
ค่าตวั แปรตามได้
โครงการพัฒนาชดุ ทดลองปัญญาประดษิ ฐ์เพ่อื พัฒนาทกั ษะดา้ นดจิ ิทัลของนักเรยี นและนกั ศึกษาในสายวชิ าชพี อาชวี ศึกษาและสามัญศึกษา
(Open AI Kit for Thai Students) | 50
สำนกั งานคณะกรรมการดิจิทลั เพ่อื เศรษฐกิจและสังคมแหง่ ชาติ
การวิเคราะห์การถดถอยเชิงเส้นตรง
การวิเคราะห์การถดถอยเชิงเส้นตรง (Linear Regression Analysis) จะเป็นการทำนายข้อมูลที่มีค่าเชิง
ตวั เลขทเี่ กี่ยวขอ้ งกับ Response Variable “ ” โดยการพิจารณาค่า Predictor Variable “ ” เพียงแค่ค่าเดียว
ด้วยการประยกุ ตใ์ ชฟ้ งั กช์ นั เชงิ เสน้ ตรง (Linear Function) สามารถคำนวณได้จาก
= +
เม่อื คอื คา่ สมั ประสทิ ธิ์ความถดถอย เปน็ ตัวกำหนดจุดตัดแกน y (y-intercept)
และ คือ ค่าสมั ประสิทธ์ิความถดถอย เป็นตวั กำหนดความลาดเอียงของเสน้ ตรง
Polynomial Regression Analysis
ในบางกรณตี ้องจัดการกับข้อมูลท่ีไม่สามารถทำนายได้ดว้ ยเสน้ ตรงหรือความสัมพันธเ์ ชิงเส้น แต่จัดการได้
โดยการเปลยี่ นฟังกช์ นั เป็นฟงั ก์ชนั โพลีโนเมยี ล ซึ่งจะทำให้สามารถจัดการกับข้อมลู ไดง้ ่ายขึน้
Logistic Regression Analysis
ถูกนำมาใช้เพื่อทำนายว่าจะเกิดเหตุการณ์หนึง่ ขึ้นหรือไม่ หรือมีโอกาสเกิดขึ้นมากน้อยเพียงใด โดยมีการ
กำหนดค่าตัวแปรตัวหนึ่งหรือหลายตัวที่คาดว่าจะส่งผลต่อการเกิดเหตุการณ์นั้นๆ และในที่สุดก็จะทำให้เข้าใจ
สาเหตกุ ารเกิดเหตุการณ์น้นั ๆ ไดใ้ นทีส่ ดุ จากรปู Logistic Regression อยู่ทางดา้ นขวามือ ค่าของ Y ทที่ ำนาย จะ
มีคา่ 0 กับ 1 เทา่ นนั้
ยงั มี Regression แบบอื่นๆ ไดแ้ ก่
• Support Vector Regression
• Decision Tree Regression
• Random Front Regression
• Ridge Regression
• Lasso Regression
โครงการพัฒนาชุดทดลองปญั ญาประดษิ ฐเ์ พ่อื พฒั นาทกั ษะดา้ นดจิ ทิ ลั ของนกั เรียนและนกั ศกึ ษาในสายวชิ าชีพอาชวี ศกึ ษาและสามญั ศกึ ษา
(Open AI Kit for Thai Students) | 51
สำนักงานคณะกรรมการดิจิทัลเพอื่ เศรษฐกิจและสงั คมแหง่ ชาติ
ภาพท่ี 6.2
6.5 การประยุกต์การใช้งานของการเรยี นรู้แบบมีผ้สู อน (Supervised Learning)
การเรียนรขู้ อง Machine Learning จะตอ้ งมีผสู้ อนหรือผู้กำกับดูแลการเรียนรู้ ชุด Input ทปี่ ระกอบด้วย
ข้อมูลและคำตอบ เมื่อฝึกด้วยข้อมูลชุดฝึกจนกระทั่ง Machine Learning สามารถทำงานโดยมี Score น้อยที่สดุ
ก็หยุดการฝึกได้
เพศ อายุ สูง น้ำหนัก
หญงิ 25 168 75
หญงิ 38 160 52
หญงิ 30 164 80
ชาย 20 170 60
ชาย 72 177 80
หญงิ 35 180 ?
ชดุ ฝกึ ประกอบดว้ ย
1. Input: F, 25, 168
Output: 75
2. Input: F, 38, 160
Output: 52
3. Input: F, 30, 164
Output: 80
4. Input: M, 20, 170
Output: 60
5. Input: F, 72, 177
Output: 80
โครงสร้างของการฝึกอัลกอรทิ ึมของ Machine Learning ให้เป็นโมเดลการทำงาน และเมื่อได้โมเดลแล้ว
ก็นำมาใชง้ านโดยใส่ค่า Input จากนน้ั Machine Learning ก็สามารถใหค้ ่า Output หรือทำนายค่า Output จาก
ตารางทีม่ ลี าเบล เพศ อายุ สว่ นสงู น้ำหนกั สมมติวา่ ตอนฝึกจะใส่ค่าชุด Input และ Output เข้าไป 5 ชุด แล้วได้
โมเดลทำนายน้ำหนักจากข้อมูล เพศ อายุ ส่วนสูง เช่น ป้อนข้อมูล F, 35, 180, เข้าไป โมเดลก็ต้องใช้วิธีของ
อลั กอรทิ ึมภายใน เชน่ ในกรณีนี้ คอื Regression สร้างเป็นตวั โมเดลทำการพยากรณว์ า่ ค่าน้ำหนักควรเปน็ เท่าไหร่
การประยกุ ต์ Machine Learning ท่มี ีครูฝึกจะมีหลากหลายส่ิงทพี่ วกเราต้องจำ
1. ต้องเลอื กอลั กอรทิ มึ ทีเ่ หมาะกับงานและงบประมาณ
2. ขอ้ มลู ท่ใี ช้จะต้องเป็นขอ้ มลู แบบลาเบลคอื มีการระบุวา่ แตล่ ะค่าคืออะไร
ตัวอยา่ งการใช้งาน
โครงการพฒั นาชุดทดลองปัญญาประดิษฐเ์ พอื่ พฒั นาทักษะดา้ นดจิ ทิ ลั ของนกั เรยี นและนักศึกษาในสายวชิ าชีพอาชวี ศกึ ษาและสามัญศกึ ษา
(Open AI Kit for Thai Students) | 52
สำนกั งานคณะกรรมการดิจทิ ัลเพือ่ เศรษฐกจิ และสังคมแห่งชาติ
• การอนุมัติคำขอสินเชือ่ หรือบตั รเครดติ (Credit Approval)
• การวิเคราะหท์ างการเงิน (Financial Analysis)
• การทำตลาดกล่มุ เปา้ หมาย (Target Marketing)
• การตรวจวินิจฉัยโรค (Medical Diagnosis)
• การวิเคราะหป์ ระสิทธิผลในการรักษา (Treatment Effectiveness Analysis)
• การผลิตและการใช้ยา (Medicine)
• การผลติ สินคา้ ตา่ งๆ (Manufacturing and Production)
• ดาราศาสตร์ (Astronomy)
• อณูชีววิทยา (Molecular Biology)
โครงการพัฒนาชุดทดลองปญั ญาประดิษฐ์เพือ่ พัฒนาทักษะดา้ นดิจทิ ลั ของนกั เรียนและนกั ศกึ ษาในสายวชิ าชีพอาชวี ศึกษาและสามัญศึกษา
(Open AI Kit for Thai Students) | 53
สำนกั งานคณะกรรมการดิจทิ ลั เพ่ือเศรษฐกจิ และสงั คมแหง่ ชาติ
บทที่ 7
การเสรมิ ประสิทธิภาพของโมเดล
วัตถุประสงค์ เรียนรู้การเสริมประสิทธิภาพของโมเดล ด้วยวิธีต่าง ๆ ทั้งด้านข้อมูลและ การปรับเปลี่ยน
อลั กอรทิ ึม (Algorithms) ของโมเดล โดยประกอบด้วยหวั ขอ้ ดงั นี้
7.1 การประเมินประสทิ ธภิ าพโมเดล
7.2 การเสรมิ ประสทิ ธิภาพด้วยขอ้ มูล (Improve Performance with Data)
7.3 การเสริมประสทิ ธิภาพด้วยอลั กอรทิ ึม (Improve Performance with Algorithms)
7.4 การเสริมประสิทธิภาพด้วยการปรับแต่งอัลกอริทึม (Improve Performance with Algorithm
Tuning)
7.5 การเสริมประสิทธภิ าพด้วยเอ็นเซ็มเบิล (Improve Performance with Ensembles)
7.1 การเสริมประสทิ ธิภาพของโมเดลดว้ ยขอ้ มูล
ความสำเร็จในการเพิ่มประสิทธิภาพด้วยข้อมูลได้ด้วยการเปลี่ยนแปลงข้อมูลการฝึกสอนและการกำหนด
ปญั หา เป็นการสรา้ งมุมมองใหมแ่ ละความแตกตา่ งกนั ในข้อมลู ท่ีทำใหอ้ ัลกอริทึมทำงานมปี ระสทิ ธภิ าพดีที่สุด
การเสรมิ ประสทิ ธิภาพโมเดลดว้ ยข้อมลู จงึ สามารถใช้กลยุทธต์ ่อไปนี้
1. การเสริมประสิทธิภาพของโมเดลด้วยข้อมูลจากการหาข้อมูลมาเพิ่ม แต่ไม่ใช่เป็นการหาข้อมูลท่ี
เหมือนกับข้อมูลที่มีอยู่ เพราะการหาข้อมูลแบบนี้ ไม่ได้ทำให้ Machine Learning เพิ่มประสิทธิภาพขึ้นแต่อย่าง
ใด ดังนัน้ ขอ้ มูลทน่ี ำมาเพ่มิ ต้องมคี ุณภาพดว้ ย เทคนิค Machine Learning แบบไมเ่ ชงิ เส้น (Nonlinear) สามารถ
ปรับปรงุ ประสิทธภิ าพด้วยข้อมลู ท่ีมากข้ึนได้อยา่ งมนี ัยสำคัญ
2. เมื่อไม่สามารถหาข้อมูลมาเพิ่มได้อีก การสร้างข้อมูลขึ้นมาใหม่ด้วยการเพิ่มจากข้อมูลที่มีอยู่แล้วด้วย
โมเดลความน่าจะเปน็ ทางสถิติ (Probabilistic Model)
3. การทำความสะอาดข้อมูลเปน็ การเสรมิ ประสิทธภิ าพ ด้วยการหาค่าทีผ่ ิดปกติในข้อมลู อาจมีส่วนท่ีขาด
หายไปหรือเสยี หายที่สามารถแก้ไขหรือลบออกได้ หรือคา่ ทอ่ี ยนู่ อกชว่ งท่ีเหมาะสม เชน่ เพศ มีเฉพาะ ช กบั ญ แต่
มี ข เพม่ิ เขา้ มา หรอื อายุมนุษย์ ที่ไม่ควรเกนิ 105 ปี แต่มีการใส่คา่ อายุ 1000 ปี เปน็ ตน้
โครงการพัฒนาชดุ ทดลองปัญญาประดษิ ฐ์เพอื่ พัฒนาทกั ษะดา้ นดจิ ิทลั ของนกั เรยี นและนักศกึ ษาในสายวิชาชพี อาชวี ศกึ ษาและสามญั ศกึ ษา
(Open AI Kit for Thai Students) | 54
สำนกั งานคณะกรรมการดจิ ิทลั เพอื่ เศรษฐกิจและสงั คมแหง่ ชาติ
4. การสุ่มหากลุ่มข้อมูลในชุดมาใช้ (Resample) ต้องพิจารณากอ่ นว่า สามารถปรับแต่งขอ้ มูลเพื่อเปลี่ยน
ขนาดหรือการกระจายได้หรือไม่? บางทีสามารถใช้ตัวอย่างข้อมูลที่เล็กกว่ามาทดสอบเพื่อเพิ่มความเร็วในการ
สังเกตส่ิงตา่ งๆ
5. การเปลี่ยนกรอบปัญหา ต้องพิจารณาว่าสามารถเปลี่ยนประเภทของปัญหาการทำนายที่กำลังแก้ได้
หรือไม่ อาจเปลี่ยนกรอบของข้อมูลโดยดูถึงประเภทของปัญหา ด้วยการใช้รูปแบบ เช่น การวิเคราะห์การถดถอย
การจดั ประเภทแบบไบนารี (Binary) หรือมลั ตคิ ลาส (Multiclass) อนกุ รมเวลา การตรวจจับความผิดปกติ การให้
คะแนน ระบบผู้แนะนำ เป็นตน้
นอกจากนี้การทำให้ข้อมูล Input เป็นแบบนอร์มอลไลซ์เซชั่น (Normalization) และการทำให้เป็น
มาตรฐานนน้ั จะสง่ ผลใหป้ ระสิทธภิ าพของอัลกอรทิ มึ สงู ขึ้นได้
กลยทุ ธ์โดยสังเขปที่กลา่ วสรปุ เป็นแนวทางดงั นี้
• แปลงข้อมูล (Transform Your Data)
• พงุ่ เป้าไปทขี่ อ้ มลู (Project Your Data)
• การเลือกคณุ ลกั ษณะ (Feature Selection)
• การใช้วิศวกรรมคณุ ลักษณะ (Feature Engineering)
7.2 การเสรมิ ประสิทธิภาพด้วยอลั กอริทึม (Improve Performance with Algorithms)
การเสริมประสิทธิภาพของโมเดลด้วยอัลกอริทึมแบบวิธีการสุ่มซ้ำ (Resampling Method) วิธี K-fold
Cross Validation การใช้วิธีการและการกำหนดค่าท่ีใชป้ ระโยชนจ์ ากข้อมูลที่มใี ห้ไดด้ ที ่สี ดุ
การเสริมประสิทธิภาพของโมเดลด้วยอัลกอริทมึ ด้วยการประเมินผล การวัดดว้ ยตัวชว้ี ัดอย่างหนึ่งอย่างใด
อาจจะไมใ่ ชว่ ธิ ที ่สี ุด เชน่
• Classification Accuracy
• Logarithmic Loss
• Confusion Matrix
• Area under Curve
• F1 Score
• Mean Absolute Error (MAE)
• Mean Squared Error (MSE)
การเสริมประสิทธภิ าพของโมเดลดว้ ยอัลกอริทมึ ดว้ ยการใช้ประสทิ ธภิ าพพ้นื ฐาน
การเสริมประสิทธิภาพของโมเดลด้วยอลั กอริทึม ด้วยการตรวจสอบเฉพาะจุดอัลกอริทมึ เชิงเสน้ แตม่ กั เกิด
ความลำเอียง แตเ่ ขา้ ใจได้ง่ายและฝกึ สอนไดเ้ รว็ การประเมนิ ชดุ วิธกี ารแบบเชงิ เสน้ มมี ากมายหลายวิธี
การประเมินอัลกอริทึมแบบเชิงเส้นและไม่เชิงเส้น ต้องการข้อมูลจำนวนมาก มีความซับซ้อนมาก แต่ให้
ประสิทธภิ าพทด่ี ขี ึน้ การประเมนิ ชดุ วิธีการแบบไม่เชิงเสน้ มหี ลากหลายวธิ เี ชน่ เดยี วกนั
การทบทวนงานวิจัยเพื่อค้นหางานวจิ ัยท่ีมรี ายงานอลั กอริทึมท่ีทำงานได้ดีกบั ปัญหาใดปัญหาหน่ึง ก็มีส่วน
ช่วยให้เกิดแนวคดิ เกีย่ วกบั อัลกอริทึมหรอื สว่ นขยายของวธิ ีพืน้ ฐานเพ่อื มาแกป้ ัญหาได้
โครงการพฒั นาชุดทดลองปญั ญาประดษิ ฐเ์ พ่ือพฒั นาทักษะดา้ นดิจทิ ลั ของนักเรียนและนกั ศึกษาในสายวชิ าชีพอาชวี ศึกษาและสามญั ศึกษา
(Open AI Kit for Thai Students) | 55
สำนกั งานคณะกรรมการดจิ ิทัลเพือ่ เศรษฐกจิ และสงั คมแหง่ ชาติ
7.3 การเสริมประสิทธิภาพของโมเดลด้วยการปรับแต่งอัลกอริทึม (Improve Performance with
Algorithm Tuning)
การปรับแต่งอัลกอริทึมอาจใช้เวลามากที่สุด แต่อาจค้นพบอัลกอริทึมที่มีประสิทธิภาพอย่างรวดเร็วจาก
การตรวจสอบเฉพาะจดุ การจะได้รับประโยชน์สงู สดุ จากอลั กอริทึม จะตอ้ งมีการทดลองใช้ โดยมกี ารปรับแต่งแล้ว
นำไปฝกึ สอนและหาคา่ การทำนายออกมา
กลยุทธ์การปรบั แตง่
การเสรมิ ประสิทธิภาพของโมเดลด้วยการปรบั แตง่ อลั กอริทึมด้วยการวนิ จิ ฉัย (Diagnostics) มกี ารวินิจฉัย
อะไรบา้ งเกี่ยวกับอลั กอรทิ ึมที่กำลังใช้งาน การทบทวนความร้เู พือ่ ทำความเข้าใจวา่ วิธีนน้ั อาจเปน็ ปัญหามากเกินไป
(Overfitting) หรือต่ำเกินไป (Underfitting) แล้วแก้ไขให้ถูกต้อง อัลกอริทึมที่ต่างกันอาจให้มุมมองการสร้างภาพ
ขอ้ มลู และการวินจิ ฉยั ทแ่ี ตกตา่ งกันออกไป ใหท้ บทวนว่าอลั กอรทิ มึ มีอะไรบา้ งท่ที ำนายถูกและผิด
การเสริมประสทิ ธิภาพของโมเดลดว้ ยการปรบั แต่งอัลกอริทึมด้วยการใชส้ ญั ชาตญาณ
หากมีการใช้พารามิเตอร์ในการปรับแต่งอัลกอริทึมมามากพอ และเห็นผลโดยใช้เวลาไม่มากนัก อาจใช้
สัญชาตญาณในการปรับแต่งอัลกอริทึมที่มีปัญหา เป็นการทดลองใช้และดูผลลัพธ์ แต่การใช้สัญชาตญาณจะต้อง
ตกผลกึ ทางดา้ น Machine Learning มาเปน็ อย่างดแี ลว้
การเสริมประสิทธิภาพของโมเดลดว้ ยการปรับแต่งอลั กอริทึมดว้ ยการค้นควา้ จากงานวิจยั ที่ตีพมิ พ์
การทบทวนงานวิจัยว่ามีพารามิเตอรห์ รือค่าในช่วงของพารามิเตอร์ใดบ้างที่ใช้ การประเมินประสิทธิภาพ
ของพารามิเตอร์มาตรฐานเปน็ จดุ เรมิ่ ตน้ ท่ีดีในการเร่ิมการปรับแต่งอัลกอริทึม
การเสริมประสิทธิภาพของโมเดลด้วยการปรับแต่งอัลกอริทึมด้วยการเสริมประสิทธิภาพของโมเดล
ดว้ ยการคน้ หาแบบสมุ่
มีพารามิเตอร์ใดบ้างที่สามารถใช้การค้นหาแบบสุ่มได้ บางทีความสามารถในการค้นหาแบบสุ่มของ
อลั กอรทิ ึมไฮเปอร์พารามเิ ตอรเ์ พื่อแสดงการกำหนดคา่ ที่ไม่เคยใชไ้ ด้
การเสรมิ ประสิทธิภาพของโมเดลดว้ ยการปรับแต่งอัลกอริทึมดว้ ยการคน้ หาแบบกรดิ
การปรับพารามิเตอร์อย่างไรให้เหมาะสม เช่น โครงสร้างหรืออัตราการเรียนรู้ สามารถปรับได้โดยใช้
ข้ันตอนการค้นหาโดยตรง การค้นหารปู แบบ หรอื การเพิม่ ประสทิ ธิภาพสมุ่ เชน่ อัลกอริทึมทางพนั ธุกรรม
การเพม่ิ ทางเลือกการนำไปใช้งาน บางทีการใชว้ ิธีอน่ื อาจทำให้ได้ผลลัพธ์ทด่ี ีขึ้นในข้อมูลเดียวกัน และอาจ
สามารถเพ่มิ ประสิทธิภาพไดโ้ ดยเพม่ิ สว่ นขยายมาตรฐานน้ัน เร่ืองนตี้ ้องเพม่ิ เร่ืองการนำไปใช้งานด้วย
7.4 การเสรมิ ประสทิ ธิภาพของโมเดลด้วยเอน็ เซ็มเบลิ (Ensembles)
เอ็นเซ็มเบิล คือ การรวบรวมการทำนายจากหลายๆ โมเดลเข้าด้วยกันหลังจากการปรับอัลกอริทึมแล้ว
การเอ็นเซ็มเบิลถือเป็นเรื่องสำคัญถัดมาสำหรับการปรับปรุงเพิ่มประสิทธิภาพ การเสริมประสิทธิภาพของโมเดล
ด้วยเอน็ เซม็ เบลิ เป็นการผสมผสานการทำนายโมเดล (Blend Model Predictions) ใช้อัลกอริทึมท่เี หมือนกันหรือ
ต่างกันในการสร้างหลายๆ โมเดล ใช้ค่าเฉลี่ย (Mean) หรือฐานนิยม (Mode) จากการทำนายของตัวแบบที่มี
ประสทิ ธิภาพหลายๆ โมเดล
โครงการพัฒนาชดุ ทดลองปญั ญาประดษิ ฐเ์ พ่อื พัฒนาทกั ษะดา้ นดจิ ิทัลของนกั เรยี นและนักศึกษาในสายวิชาชีพอาชวี ศกึ ษาและสามัญศกึ ษา
(Open AI Kit for Thai Students) | 56
สำนักงานคณะกรรมการดิจทิ ัลเพอ่ื เศรษฐกจิ และสังคมแหง่ ชาติ
การเสริมประสิทธิภาพของโมเดลด้วยเอ็นเซ็มเบิลด้วยการผสมผสานการใช้ข้อมูลที่แตกต่างกัน
(Blend Data Representations)
การรวบรวมการทำนายจากโมเดลท่ีได้รบั การฝึกสอนบนข้อมูลท่ีแตกตา่ งกัน อาจมกี ารคาดการณ์ปัญหาที่
แตกต่างกันมากมายที่เกิดจากการฝึกสอนให้กับอัลกอริทึมจนมีประสิทธิภาพดี ซึ่งการทำนายนั้นสามารถนำมา
รวมกนั ได้
การเสริมประสิทธิภาพของโมเดลด้วยเอ็นเซ็มเบิลด้วยการผสมผสานตัวอย่างข้อมูล (Blend Data
Samples)
การสร้างชดุ ยอ่ ยของข้อมูลหลายๆ ชุดที่ใชใ้ นการฝึกสอนและนำไปฝกึ สอนกับอัลกอริทึมที่มีประสิทธิภาพ
ดี จากนั้นรวมการทำนาย สิ่งเหล่านี้เรียกว่า การรวมบูตสเต็บ (Bootstrap Aggregation) หรือการเบ็คก้ิง
(Bagging) และจะทำงานได้ดีที่สุดเมื่อการทำนายจากโมเดลแต่ละโมเดลมีความชำนาญแต่ในทิศทางทีแ่ ตกต่างกนั
(ไม่มคี วามสมั พนั ธ์กัน)
การเสริมประสทิ ธิภาพของโมเดลดว้ ยเอน็ เซม็ เบิลดว้ ยการทำนายทถ่ี ูกตอ้ ง (Correct Predictions)
การทำนายได้อย่างชัดเจนหรือใช้วิธีการบูตติ้ง เป็นการส่งเสริมเพื่อเรียนรู้วิธีแก้ไขข้อผิดพลาดจากการ
ทำนายนั้น
การเสริมประสิทธิภาพของโมเดลด้วยเอ็นเซ็มเบิลด้วยการเรียนรู้ในการนำมาผสมผสานกัน (Learn
to Combine)
โมเดลใหม่เพื่อเรียนรู้วิธีผสมผสานการทำนายจากแบบจำลองที่มีประสิทธิภาพหลายๆ แบบ วิธีนี้เรียกว่า
การวางซอ้ น หรือ Stack และจะทำงานได้ดเี ม่ือโมเดลย่อย (Sub Models) ทำงานได้ดี แตใ่ นทิศทางที่แตกต่างกัน
และโมเดลการรวมตัวกันนั้นเป็นการถ่วงน้ำหนักเชิงเส้นอย่างง่ายของการทำนาย กระบวนการนี้สามารถทำบน
หลายๆ เลเยอรท์ ่ีมคี วามลึกๆ ไดซ้ ้ำๆ กนั
7.5 การประเมนิ ประสิทธภิ าพโมเดล
ภาพท่ี 7.1 การแสดงความสมั พนั ธร์ ะหวา่ งข้อมูลกับประสทิ ธภิ าพของโมเดลประเภทต่างๆ
ส่วนที่มีค่าที่สุดของการเรียนรู้ของ Machine Learning คือ การสร้างแบบจำลองการทำนายหรือโมเดล
ดังน้ัน การพฒั นาแบบจำลองทผ่ี ่านการฝึกสอนโดยใช้ข้อมูลในอดีตจนกระท่งั สามารถทำนายผลลัพธจ์ ากข้อมูลใหม่
โครงการพฒั นาชุดทดลองปญั ญาประดษิ ฐเ์ พอื่ พฒั นาทักษะดา้ นดจิ ิทัลของนกั เรียนและนกั ศึกษาในสายวชิ าชพี อาชวี ศึกษาและสามญั ศึกษา
(Open AI Kit for Thai Students) | 57
สำนักงานคณะกรรมการดจิ ทิ ลั เพ่ือเศรษฐกจิ และสังคมแหง่ ชาติ
ที่ป้อนเข้าไป และคำถามอันดับหนึ่งเมื่อพูดถึงการสร้างแบบจำลองการทำนายคือจะทำอย่างไรให้ผลการทำนาย
ถกู ต้อง แมน่ ยำมากท่สี ดุ หรือมีการทำนายถูกต้องถงึ 100%
ในโลกแห่งความเปน็ จรงิ ความถูกต้อง 100% เป็นไปได้ยาก 100% ในการทดสอบจากขอ้ มูลทีม่ ีอยู่แล้วไม่
มีการทำนายผิดพลาด แต่ในข้อมูลที่แท้จริงอาจจะยังไมพ่ บปัญหาการทำนายผดิ หรอื ยงั ไม่พบขอ้ มูลทีม่ คี ุณลักษณะ
ใหมๆ่ ทีโ่ มเดลไม่สามารถหาคำตอบที่ถูกต้องได้
จากรปู แกนแนวนอนเปน็ ค่าของข้อมลู และแกนแนวต้งั เปน็ ค่าของประสิทธภิ าพ และเส้นสีแดงเป็นการใช้
Machine Learning แบบดั้งเดิม สีเหลืองเป็นการใช้นวิ รัลเน็ตเวิร์คแบบขนาดเล็ก (Shallow Neural Networks)
สนี ้ำเงนิ เป็นการใช้นวิ รลั เน็ตเวิร์คขนาดกลาง (Medium Neural Networks) และสเี ขยี วเปน็ การใช้นิวรัลเน็ตเวิร์ค
แบบเชงิ ลึก (Deep Neural Networks)
เมื่อใช้ข้อมูลจำนวนน้อย สMachine Learningจะให้ประสิทธิภาพดีกว่า แต่เมื่อใช้ข้อมูลจำนวนมากข้ึน
ประสทิ ธภิ าพของนวิ รัลเน็ตเวริ ค์ แบบเชงิ ลึกจะใหป้ ระสิทธภิ าพทดี่ กี ว่า
ภาพที่ 7.2 เปน็ การแสดงความสมั พันธร์ ะหว่างขอ้ มลู กับประสทิ ธภิ าพของโมเดลประเภทต่างๆ
ไม่จำเป็นว่าทุกงานต้องใช้นิวรัลเน็ตเวิร์คแบบเชิงลึกทั้งหมด เพราะบางครั้งการใช้ Machine Learning
แบบดั้งเดิม ประสิทธิภาพอาจเพียงพอกับงานนัน้ ๆ แล้ว และไม่ต้องใช้อุปกรณ์ฮารด์ แวร์ท่ีราคาสูงหรือเฉพาะดา้ น
เช่น การด์ จพี ยี ู (GPU) เป็นตน้
นิวรัลเน็ตเวิร์คแบบเชิงลึก ยังแบ่งแยกย่อยได้อีก เช่น นิวรัลเน็ตเวิร์คแบบเชงิ ลึกแบบจิ๋ว แบบกลาง แบบ
ใหญ่ เป็นตน้ แตก่ ็ตอ้ งแลกกบั การใช้ฮาร์ดแวรท์ ี่ใหญ่และเร็วมากพออกี ดว้ ย
โครงการพัฒนาชุดทดลองปญั ญาประดษิ ฐ์เพอ่ื พฒั นาทกั ษะดา้ นดจิ ทิ ลั ของนักเรยี นและนักศกึ ษาในสายวชิ าชีพอาชวี ศึกษาและสามัญศึกษา
(Open AI Kit for Thai Students) | 58
สำนกั งานคณะกรรมการดิจทิ ลั เพ่อื เศรษฐกจิ และสังคมแหง่ ชาติ
บทที่ 8
การเรียนรู้แบบไม่มีผสู้ อน
วัตถุประสงค์ ทำความรู้จักกับการเรียนรู้แบบไม่มีผู้สอน (Unsupervised Learning) ที่เป็นรูปแบบหนึ่ง
ของการเรียนรู้ของเครื่อง (Machine learning) รวมทั้งรูปแบบการทำงาน และ การประยุกต์การใช้งานแบบไม่มี
ผ้สู อน (Unsupervised Learning) โดยประกอบดว้ ยหัวขอ้ ดงั น้ี
8.1 บทนำเบอ้ื งต้นการเรียนรแู้ บบทีไ่ ม่มีผสู้ อน (Introduction Unsupervised Learning)
8.2 ประเภทของการเรยี นร้แู บบไมม่ ผี สู้ อน (Types of Unsupervised Learning)
8.3 ประเภทของคลสั เตอร์ (Clustering Types)
8.4 การประยุกต์ใช้งานการเรียนรู้แบบไม่มีผู้สอน ( Applications of Unsupervised Machine
Learning)
8.1 การเรียนรู้แบบไมม่ ีผู้สอน
การเรียนรู้แบบไม่มีผู้สอน บางครั้งเรียกว่าการวิเคราะห์เชิงพรรณนา ไม่มีข้อมูลกำกับไว้ล่วงหน้า
อัลกอริทึมเหล่านี้ค้นพบความเหมือนหรือความใกล้เคียงกันในข้อมูล Input หรือข้อมูลนำเข้า ตัวอย่างของการ
เรยี นร้ทู ่ไี มม่ ีผสู้ อน คือ การจดั กล่มุ ลกู คา้ ทีค่ ล้ายกันโดยยึดตามข้อมูลการซอื้ จากรูปด้านลา่ ง
ภาพที่ 8.1 แผนภาพแสดงขอ้ มลู การซื้อของลกู ค้า
โครงการพัฒนาชดุ ทดลองปัญญาประดษิ ฐ์เพอ่ื พัฒนาทกั ษะดา้ นดิจิทลั ของนักเรยี นและนักศกึ ษาในสายวชิ าชพี อาชวี ศึกษาและสามัญศึกษา
(Open AI Kit for Thai Students) | 59
สำนักงานคณะกรรมการดิจิทัลเพื่อเศรษฐกจิ และสังคมแห่งชาติ
ข้อมูลการซื้อสินค้าของลูกค้า นำมาสร้างโมเดล Machine Learning ที่สามารถจำแนกลูกค้าเป็นกลุ่ม
ลูกค้าแต่ละกลุ่มจะมีพฤติกรรมการซื้อคล้ายกัน แล้วเมื่อมีลูกค้าใหม่เข้ามา และนำข้อมูลการซื้อลูกค้าผ่านการใช้
โมเดลนี้ กจ็ ะไดก้ ารทำนายกลุ่มของลูกคา้ ที่ใกลเ้ คยี งกันออกมา จากน้นั พนักงานขายสามารถปิดการขายของลูกค้า
นี้อย่างง่ายดาย ทั้งนี้พฤติกรรมของลูกค้าในกลุ่มจะบอกให้พนักงานว่าต้องทำอะไร ตัวอย่างเช่น กลุ่มที่ซื้อน้ำหอม
แล้วมักจะซ้ือลิปสติก ดังนั้น เมื่อโน้มน้าวลูกค้าให้ซื้อน้ำหอมได้แล้ว สามารถเชิญชวนให้ซ้ือลิปสติกด้วยเปอร์เซ็นต์
ปิดการขายทีส่ งู
การสร้างโมเดล Machine Learning แบบมีผู้สอนนั้น มีประโยชน์มาก เพราะมีความแม่นยำในการหา
ผลลัพธ์ ส่วนโมเดลที่สร้างจาก Machine Learningท่ี ไม่มีผู้สอนนั้นก็มีประโยชน์ เพราะข้อมูลจำนวนมากยังเป็น
ขอ้ มูลดิบ เป็นขอ้ มลู ท่ียงั ไมล่ าเบล
เหตุผลการเรยี นรู้แบบไมม่ ีผ้สู อนกำกับดูแล คอื
1. Machine Learning แบบไมม่ ผี สู้ อน สามารถหา Pattern ตา่ งๆ ในชดุ ขอ้ มูลได้
2. วธิ ีการคือหาคณุ ลกั ษณะทีม่ ีประโยชนใ์ นการจำแนกแยกแยะเป็นกลุ่ม
3. สามารถประมวลผลแบบเรียลไทมใ์ นการแยกแยะขอ้ มลู
4. ข้อมูลแบบไมม่ ีลาเบลมีมากกว่าข้อมลู ท่ีมีลาเบล
8.2 การแบ่งกล่มุ
ปัญหาที่ Machine Learning แบบไม่มีครูทำได้ดีคือการจัดกลุ่ม ซึ่งต้องอาศัยการแยกแยะชุดข้อมูลเป็น
กลมุ่ หรอื สามารถระบวุ ่าขอ้ มูลอยใู่ นกลุ่มใด
การวเิ คราะหก์ ลุม่ (Clustering analysis)
การวิเคราะห์กลุ่มคือเทคนิคในการเรียนรู้แบบไม่มีผู้สอนซึ่งมีเป้าหมายเพื่อการจำแนกกลุ่มข้อมูลที่มี
คุณลกั ษณะคล้ายกันอยู่ในกลุ่มเดียวกัน โดยข้อมูลแต่ละกลุ่มจะถูกเรยี กว่า คลัสเตอร์ (Cluster) การวิเคราะห์หรือ
จำแนกกลุ่มข้อมูลนัน้ สามารถแบ่งออกได้หลายประเภท แต่ที่จะกล่าวถึง ได้แก่ K-means Clustering และวิธีการ
แบบลำดบั ช้ัน (Hierarchical Clustering) สว่ นการจัดกลุ่มอื่นๆ แบบอืน่ ๆ อาทเิ ช่น
• KNN
• Principal Component Analysis
• Singular Value Decomposition
• Independent Component Analysis
การบบี อัดข้อมลู Data Compression
แม้จะมคี วามกา้ วหน้าทีส่ ำคัญในชว่ งทศวรรษทีผ่ ่านมาเก่ียวกับการประหยัดค่าใชจ้ า่ ยและพลังงานของการ
จัดเก็บข้อมูล แต่ก็ยังคงเหมาะสมที่จะรักษาชุดข้อมูลให้มีขนาดเล็กและมีประสิทธิภาพมากที่สุด หมายถึงการนำ
อัลกอริทึมมาใช้กับข้อมูลที่จำเป็นเท่านั้นและไม่ให้ฝึกสอนข้อมูลมากเกินไป การเรียนรู้ที่ไม่มีผู้สอนสามารถทำได้
ผ่านกระบวนการท่เี รียกว่า การลดขนาด
โครงการพฒั นาชดุ ทดลองปัญญาประดิษฐเ์ พ่ือพัฒนาทกั ษะดา้ นดิจทิ ัลของนักเรยี นและนักศกึ ษาในสายวิชาชีพอาชวี ศกึ ษาและสามญั ศึกษา
(Open AI Kit for Thai Students) | 60
สำนักงานคณะกรรมการดจิ ิทลั เพ่อื เศรษฐกิจและสังคมแห่งชาติ
การลดขนาด (ขนาด = จำนวนคอลัมน์ที่อยู่ในชุดข้อมูล) ตัวอย่างเช่น มีข้อมูลจำนวนมากซ้ำซ้อน และ
สามารถแสดงข้อมูลส่วนใหญ่ในชุดข้อมูลที่เป็นส่วนน้อยของเนื้อหาจริง ในทางปฏิบัติหมายถึงการรวมส่วนต่างๆ
ของขอ้ มูลในรูปแบบที่ไม่ซำ้ กันเพื่อส่ือความหมาย โดยมอี ลั กอรทิ มึ ยอดนิยมที่ใชก้ ันเพื่อลดขนาด
ภาพท่ี 8.2
Principal Component Analysis (PCA) เป็นการค้นหาชุดค่าผสมที่เป็นเชิงเส้นที่ติดต่อกับความ
แปรปรวนสว่ นใหญใ่ นข้อมูล
Singular-Value Decomposition (SVD) แยกขอ้ มลู เปน็ เมทรกิ ซท์ ีเ่ ล็กลง
การลดมิติข้อมูลเป็นส่วนสำคัญของกระบวน Machine Learning ตัวอย่างภาพที่ขยายใหญ่ของการ
มองเหน็ คอมพิวเตอร์ (Computer Vision) หากชดุ ขอ้ มลู ของภาพมขี นาดใหญ่และสามารถลดขนาดของชดุ ฝึกสอน
จะเป็นการลดค่าใช้จ่ายในการคำนวณและการจัดเก็บลงอย่างมาก ในขณะเดียวกันก็ทำให้โมเดลทำงานได้เร็วขึ้น
ดว้ ย เปน็ เหตผุ ลท่ี PCA หรือ SVD มกั จะทำงานกบั ภาพในระหวา่ งการประมวลผล
แบบโมเดลรีเจนเนอร์เรทฟี (Regenerative) เป็นคลาสของโมเดลการเรียนรู้ที่ไม่มีผู้สอน ซึ่งให้ข้อมูลการ
ฝึกสอนและตัวอย่างใหม่ท่ีถูกสร้างขึ้นจากการแจกแจงแบบเดียวกัน โมเดลเหล่านี้จะต้องค้นหาและเรียนรู้อย่างมี
ประสิทธิภาพ สาระสำคัญของข้อมูลที่กำหนดเพื่อพยายามสร้างข้อมูลที่คล้ายกัน ประโยชน์ระยะยาวของโมเดล
ประเภทนีค้ อื ความสามารถในการเรยี นรูค้ ณุ สมบัตขิ องข้อมูลท่ีกำหนดโดยอัตโนมัติ
โครงการพัฒนาชุดทดลองปัญญาประดษิ ฐเ์ พ่อื พฒั นาทกั ษะดา้ นดจิ ทิ ลั ของนักเรียนและนกั ศกึ ษาในสายวชิ าชพี อาชวี ศึกษาและสามญั ศึกษา
(Open AI Kit for Thai Students) | 61
สำนกั งานคณะกรรมการดจิ ทิ ลั เพือ่ เศรษฐกิจและสังคมแหง่ ชาติ
ภาพที่ 8.3
ตัวอย่างทั่วไปของโมเดล คือ ชุดข้อมูลรูปภาพ เมื่อมีชุดของรูปภาพ แบบจำลองสามารถสร้างชุดของภาพ
ที่คล้ายกับชุดที่มีอยู่ก่อนหน้านี้ เป็นการแนะนำให้รู้จักและเข้าใจเบื้องต้นในเรื่องการจัดกลุ่มการบีบอัดข้อมูลของ
ภาพ เพราะดว้ ยกลอ้ ง CCTV ทำให้เกิดความตอ้ งการในการจดั กล่มุ บคุ คล การจำแนกหนา้ คน เป็นตน้
8.3 K-means Clustering
• K-means การจัดกลุ่มแบบ K-means หรือเรียกอีกอย่างหนึ่งว่า การวิเคราะห์กลุ่มแบบไม่เป็นขั้นตอน
(Nonhierarchical Cluster Analysis) หรอื การแบง่ ส่วน (Partitioning)
• K-means เป็นอัลกอรทิ ึมเทคนิคการเรยี นรโู้ ดยไมม่ ผี ้สู อนที่งา่ ยที่สดุ เพราะเป็นการแกป้ ญั หาการจัดกลุ่ม
ที่รู้จักกันทั่วไป โดยอัลกอริทึม K-Means จะตัดแบ่ง (Partition) วัตถุออกเป็น K กลุ่ม และแทนค่าแต่ละกลุ่มด้วย
ค่าเฉลีย่ ของกลมุ่ ซงึ่ ใชเ้ ป็นจุดศูนยก์ ลาง (Centroid) ของกลุ่มในการวดั ระยะห่างของข้อมลู ในกล่มุ เดยี วกัน
วิธีการทำ K-means Clustering
1. กำหนดหรือสุ่มค่าเริ่มต้น จำนวน K ค่า (กลุ่ม) และกำหนดจุดศูนย์กลางเริ่มต้น K จุด เรียกว่า
Cluster Centers หรือ Centroid)
2. นำวตั ถุทงั้ หมดจดั เขา้ กลุ่ม โดยทำการหาคา่ ระยะห่างระหว่างข้อมลู กับจุดศูนย์กลาง หากข้อมูลไหน
ใกลค้ ่าจุดศนู ย์กลางตวั ไหนทสี่ ดุ อยูก่ ลุม่ นน้ั
3. หาคา่ เฉล่ียแตล่ ะกล่มุ ให้เปน็ คา่ จุดศูนย์กลางใหม่
4. ทำซ้ำข้อ 2 จนกระท่ังคา่ เฉล่ยี หรือจุดศูนย์กลางในแต่ละกลุ่มจะไม่เปลยี่ นแปลงจึงหยุดทำ
โครงการพฒั นาชดุ ทดลองปญั ญาประดษิ ฐเ์ พ่อื พัฒนาทักษะดา้ นดจิ ิทลั ของนักเรียนและนักศึกษาในสายวชิ าชพี อาชวี ศกึ ษาและสามัญศกึ ษา
(Open AI Kit for Thai Students) | 62
สำนักงานคณะกรรมการดจิ ิทลั เพื่อเศรษฐกจิ และสังคมแห่งชาติ
ตัวอยา่ งการทำ K-Mean Clustering6
ภาพที่ 8.4
• ส่มุ คา่ เร่ิมต้น จำนวน K ค่า เรยี กว่า Cluster Centers หรือ Centroid
• สมมติ K = 3 แสดงว่า c1, c2 และ c3 เปน็ Centroid ที่สมุ่ ขน้ึ มา c1(2, 10), c2(5,8) และ c3(1,2)
ภาพท่ี 8.5
ข้นั ตอนที่ 1
• หาความหา่ งกนั ระหวา่ งขอ้ มลู 2 ขอ้ มูล คือ หาความหา่ งจากขอ้ มลู A=(x1,y1) และ centroid =(x2,y2)
โดยใชส้ ูตร Euclidean ดังน้ี
หรอื
6 บทเรยี นนี้เปน็ งานของ ม.บรพู า
โครงการพัฒนาชดุ ทดลองปญั ญาประดิษฐเ์ พ่อื พัฒนาทักษะดา้ นดิจิทลั ของนักเรียนและนกั ศึกษาในสายวชิ าชพี อาชวี ศกึ ษาและสามญั ศกึ ษา
(Open AI Kit for Thai Students) | 63
สำนกั งานคณะกรรมการดิจิทัลเพอ่ื เศรษฐกิจและสังคมแห่งชาติ
• และนำไปใส่ในตาราง
ขน้ั ตอนที่ 2
หาระยะหา่ งระหว่างข้อมูล กับจดุ ศนู ยก์ ลาง (ตวั อยา่ งบางชุดข้อมลู )
เมอ่ื ใสข่ ้อมูลในตารางจะได้การจัดกล่มุ ขอ้ มลู ดงั ต่อไปน้ี และนำไปสรา้ งกลุ่มใหม่
Point c1(2,10) c2(5,8) c3(1,2) Cluster
1
A1 (2,10) 0.00 3.61 8.06 3
2
A2 (2,5) 5.00 4.24 3.16 2
2
A3 (8,4) 8.49 5.00 7.29 2
3
A4 (5,8) 3.61 0.00 7.21 2
A5 (7,5) 7.07 3.60 6.71
A6 (6,4) 7.21 4.12 5.39
A7 (1,2) 8.06 7.21 0.00
A8 (4,9) 2.24 1.41 7.62
โครงการพัฒนาชุดทดลองปญั ญาประดษิ ฐเ์ พอ่ื พฒั นาทกั ษะดา้ นดิจิทัลของนักเรยี นและนกั ศึกษาในสายวิชาชพี อาชวี ศกึ ษาและสามญั ศกึ ษา
(Open AI Kit for Thai Students) | 64
สำนกั งานคณะกรรมการดจิ ทิ ลั เพ่อื เศรษฐกิจและสังคมแห่งชาติ
นำมาสรา้ งกลุม่ ใหม่
จะไดก้ ารจัดกล่มุ ใหมด่ ังภาพ
ภาพท่ี 8.6
ขั้นตอนที่ 3
หาค่าเฉลีย่ แตล่ ะกล่มุ ให้เปน็ คา่ จดุ ศนู ย์กลางใหม่
สำหรับ Cluster 1 มจี ดุ เดียวคือ A1(2, 10) แสดงวา่ C1(2,10) ยงั คงเดมิ
สำหรับ Cluster 2 มี 5 จุดอยู่กลุ่มเดียวกัน เพราะฉะน้ันหา C2 ใหม่ ( (8+5+7+6+4)/5, (4+8+5+4+9)/5
) = C2(6,6)
สำหรับ Cluster 3 มี 2 จุดอย่กู ลุ่มเดยี วกนั ( (2+1)/2, (5+2)/2 ) = C3(1.5,3.5)
รอบที่ 2 ทำตามวธิ ที ่ี 1-4 จะไดผ้ ลลพั ธ์ดังน้ี
โครงการพัฒนาชดุ ทดลองปญั ญาประดษิ ฐเ์ พอ่ื พัฒนาทักษะดา้ นดจิ ทิ ัลของนกั เรียนและนกั ศกึ ษาในสายวชิ าชพี อาชวี ศกึ ษาและสามญั ศกึ ษา
(Open AI Kit for Thai Students) | 65
สำนกั งานคณะกรรมการดิจทิ ลั เพือ่ เศรษฐกิจและสงั คมแห่งชาติ
Point c1(2,10) c2(6,6) c3(1.5,3.5) Cluster
A1 (2,10) 0.00 5.66 6.52 1
A2 (2,5) 5.00 4.12 1.58 3
A3 (8,4) 8.49 2.83 6.52 2
A4 (5,8) 3.60 2.24 5.70 2
A5 (7,5) 7.07 1.41 5.70 2
A6 (6,4) 7.21 2.00 4.53 2
A7 (1,2) 8.06 6.40 1.58 3
A8 (4,9) 2.24 3.61 6.04 1
รอบที่ 2 สรา้ งกล่มุ ใหม่
หาจดุ ศนู ยก์ ลางใหมจ่ ะได้
C1 = (2+4/2,10+9/2) = (3,9.5)
C2 = (6.5,5.25)
C3 = (1.5,3.5)
ภาพท่ี 8.7
รอบที่ 3
โครงการพัฒนาชดุ ทดลองปญั ญาประดษิ ฐ์เพอ่ื พฒั นาทักษะดา้ นดิจิทลั ของนกั เรียนและนกั ศกึ ษาในสายวชิ าชพี อาชวี ศกึ ษาและสามญั ศึกษา
(Open AI Kit for Thai Students) | 66
สำนักงานคณะกรรมการดจิ ทิ ลั เพือ่ เศรษฐกจิ และสงั คมแห่งชาติ
Point c1(3,9.5) c2(6.5,5.25) c3(1.5,3.5) Cluster
A1 (2,10) 1.11 6.54 6.52 1
A2 (2,5) 4.61 4.50 1.58 3
A3 (8,4) 7.43 1.96 6.52 2
A4 (5,8) 2.50 3.13 5.70 1
A5 (7,5) 6.02 0.56 5.70 2
A6 (6,4) 6.26 1.35 4.53 2
A7 (1,2) 7.76 6.39 1.58 3
A8 (4,9) 1.12 4.50 6.04 1
รอบท่ี 3 สรา้ งกลุ่มใหม่
หาจุดศูนยก์ ลางใหมจ่ ะได้
C1 = (3.67,9)
C2 = (7,4.33)
C3 = (1.5,3.5)
ภาพท่ี 8.8
รอบท่ี 4
โครงการพฒั นาชดุ ทดลองปัญญาประดิษฐ์เพ่อื พฒั นาทกั ษะดา้ นดิจทิ ลั ของนักเรยี นและนักศึกษาในสายวชิ าชพี อาชวี ศกึ ษาและสามญั ศกึ ษา
(Open AI Kit for Thai Students) | 67
สำนักงานคณะกรรมการดิจิทลั เพื่อเศรษฐกจิ และสงั คมแห่งชาติ
Point c1(3.67,9) c2(7,4.33) c3(1.5,3.5) Cluster
A1 (2,10) 1.94 7.56 6.52 1
A2 (2,5) 4.33 5.04 1.58 3
A3 (8,4) 6.62 1.05 6.52 2
A4 (5,8) 1.67 4.18 5.70 1
A5 (7,5) 5.21 0.67 5.70 2
A6 (6,4) 5.52 1.05 4.53 2
A7 (1,2) 7.49 6.44 1.58 3
A8 (4,9) 0.33 5.55 6.04 1
รอบท่ี 4 สรา้ งกลมุ่ ใหม่
หาจดุ ศนู ย์กลางใหม่จะได้
C1 = (3.67,9)
C2 = (7,4.33)
C3 = (1.5,3.5)
ภาพที่ 8.9
ผลลพั ธ์ จะได้ผลลพั ธด์ ังภาพ
กอ่ น
โครงการพัฒนาชุดทดลองปญั ญาประดษิ ฐ์เพือ่ พัฒนาทกั ษะดา้ นดจิ ทิ ัลของนักเรียนและนักศกึ ษาในสายวชิ าชีพอาชวี ศึกษาและสามญั ศึกษา
(Open AI Kit for Thai Students) | 68
สำนกั งานคณะกรรมการดิจิทัลเพ่ือเศรษฐกจิ และสังคมแหง่ ชาติ
ภาพที่ 8.10
ผลลพั ธ์
ภาพท่ี 8.11
ข้อดขี องการทำ K-means Clustering
1. เมื่อมจี ำนวนข้อมูลมากและมจี ำนวนกลุ่มน้อย การหาค่าเฉล่ียแบบ K-means จะคำนวณได้เร็วกว่า
การจัดกลุ่มแบบอืน่ ๆ เช่น Hierarchical
2. ขั้นตอนการหาค่าเฉลี่ยแบบ K-means อาจจะได้สมาชิกภายในกลุ่มหนาแน่นกว่าการจัดกลุ่มแบบ
Hierarchical โดยเฉพาะถ้ากล่มุ เปน็ วงกลม
ข้อด้อยของการทำ K-means Clustering
1. การหาคา่ K ทเี่ หมาะสมคาดเดาไดย้ าก
2. ทำงานได้ไม่ดีถา้ กล่มุ ขอ้ มูลไม่เป็นรูปวงกลม
3. มขี ้อจากดั ในเรือ่ งของขนาด ความหนาแนน่ และรปู รา่ ง
โครงการพัฒนาชดุ ทดลองปญั ญาประดษิ ฐ์เพอ่ื พฒั นาทักษะดา้ นดจิ ทิ ลั ของนักเรยี นและนกั ศึกษาในสายวิชาชพี อาชวี ศกึ ษาและสามัญศึกษา
(Open AI Kit for Thai Students) | 69
สำนกั งานคณะกรรมการดจิ ทิ ัลเพื่อเศรษฐกิจและสงั คมแหง่ ชาติ
8.4 Hierarchical Clustering
Hierarchical Clustering เป็นเทคนิคที่นิยมใช้ในการฝึก Machine Learning คลัสเตอริ่ง คือ การแยก
กลุ่มขอ้ มลู ออกเปน็ กลมุ่ ๆ ทม่ี คี วามเหมือนกัน ในการแยกเปน็ กลมุ่ นน้ั แตล่ ะจุดในคลัสเตอริ่งจะเป็นข้อมูลท่ีไม่มีการ
นำลาเบลของข้อมูลมาใช้เทคนิคการทำไฮราคิคัล คลสั เตอรงิ่ จะแบง่ ออกเปน็ 2 ชนดิ ไดแ้ ก่
1. อัลโกลเมอเรตีฟ (Agglomerative)
2. ดวิ ซิ ีฟ (Divisive)
วิธีอัลโกลเมอเรตีฟนั้นแต่ละจุดข้อมูลถือว่าเป็นแต่ละคลัสเตอริ่ง แต่ละรอบของการประมวลผล จะ
รวมคลัสเตอรง่ิ ท่ใี กล้กันเขา้ ด้วยกนั และทำจนกระทงั่ เหลืออยใู่ น 1 กล่มุ
ขั้นตอนการทำงาน คือ
1. คำนวณหาตารางระยะหา่ ง
2. ใหแ้ ต่ละจดุ ขอ้ มลู เปน็ คลัสเตอรงิ่
3. ให้รวมคลัสเตอรงิ่ ทอ่ี ยู่ใกลก้ นั และ Update ตารางระยะหา่ ง
4. ทำขอ้ 3 จนกระท่ังเหลือกลุ่มเพียงกลมุ่ เดียว
การคำนวณหาตารางระยะทาง
อธบิ ายโดยใช้ตวั อยา่ งในการรวมกล่มุ แบบอันโกลเมอเรตีฟ สมมตวิ ่ามขี อ้ มลู 6 ชุด (A, B, C, D, E, F)
ขนั้ ท่ี 1 คำนวณความห่างของแต่ละจดุ
ขอ้ 2 สมมติ B, C คล้ายกัน และ D, F คลา้ ยกนั กบั สามารถยบุ รวมกันเปน็ BC และ DE
ขั้น 3 สมมติกลุ่ม DE และ F คลา้ ยกนั รวมจะได้ DEF
ขนั้ 4 สมมติกลุ่ม BC , DEF คลา้ ยกัน รวมกนั แลว้ จะได้ BCDEF
ข้ัน 5 สมมติกลุ่ม A , BCDEF คล้ายกนั รวมกันก็จะได้ ABCDEF เปน็ 1 กลมุ่
สามารถแสดง (****) การทำอลั โกลเมเรตีฟดว้ ยเดนโดรแกรม (Dendrogram)
โครงการพฒั นาชดุ ทดลองปัญญาประดิษฐ์เพือ่ พฒั นาทกั ษะดา้ นดิจทิ ัลของนกั เรยี นและนกั ศกึ ษาในสายวชิ าชพี อาชวี ศึกษาและสามญั ศึกษา
(Open AI Kit for Thai Students) | 70
สำนกั งานคณะกรรมการดิจิทลั เพือ่ เศรษฐกิจและสงั คมแห่งชาติ
วธิ ดี ิวิซฟี คลัสเตอริ่ง คอื ทุกจดุ ขอ้ มูลอยใู่ น 1 คลสั เตอร่งิ จากนั้นเร่ิมแยกเปน็ คลัสเตอริง่ ย่อย (ย้อนทางการ
ทำอัลโกลเมอเรตฟี ) จนกระท่ังมีกลุ่ม n กลมุ่ จากตวั อยา่ งที่แล้วมี 6 กลุ่ม (6 จดุ ข้อมลู A, B, C, D, E, F)
วธิ ีการคำนวณความเหมอื นของ 2 กลุ่ม
ใช้วธิ ีการดงั น้ี
• Single Link : ระยะหา่ งระหวา่ งจุด 2 จดุ ที่ใกล้ที่สุด
• Complete Link : ระยะห่างระหวา่ งจุด 2 จุดท่ีไกลท่ีสดุ
• Average Link : ระยะห่างระหวา่ งจดุ 2 จุดท่ีเปน็ คา่ เฉล่ยี ท่ีสดุ
โครงการพฒั นาชดุ ทดลองปญั ญาประดิษฐ์เพื่อพฒั นาทกั ษะดา้ นดจิ ิทัลของนักเรยี นและนกั ศกึ ษาในสายวชิ าชพี อาชวี ศึกษาและสามัญศกึ ษา
(Open AI Kit for Thai Students) | 71
สำนักงานคณะกรรมการดิจิทลั เพอ่ื เศรษฐกิจและสงั คมแหง่ ชาติ
8.5 การประยกุ ต์ใชใ้ นโลกแห่งความเปน็ จริงของการเรียนร้ทู ีไ่ มม่ ีผู้สอน
แอปพลเิ คชันหลักของการเรยี นรูท้ ่ีไม่มผี ู้สอน ได้แก่ การจัดกลมุ่ การสรา้ งภาพ การลดขนาด การคน้ หา กฎ
การเชือ่ มโยง และการตรวจจบั ความผิดปกติ
การทำคลัสเตอร์
การทำคลัสเตอร์เป็นกระบวนการจัดกลุ่มข้อมลู ที่กำหนดให้เป็นคลัสเตอร์หรือกลุ่มต่างๆ การเรียนรู้ทีไ่ ม่มี
ผู้สอนสามารถใช้ในการทำคลัสเตอร์เมื่อไม่ทราบข้อมูลที่แน่ชัดเกี่ยวกับคลัสเตอร์ องค์ประกอบในกลุ่มหรือคลัส
เตอร์ควรมีความคล้ายคลึงกันมากที่สุด และคะแนนในกลุ่มต่างๆ ควรมีความแตกต่างกันมากที่สุด ตัวอย่างใน
ซุปเปอร์มาร์เก็ตมีการจัดกลุ่มและจัดเรียงรายการต่างๆ อย่างไร นอกจากนี้เว็บไซต์อีคอมเมิร์ซ เช่น Amazon ยัง
ใช้อัลกอริทึมการทำคลัสเตอร์เพื่อทำระบบแนะนำเฉพาะผู้ใช้ อีกหนึ่งตัวอย่าง สมมติว่าผู้เรียนมีช่อง YouTube
และข้อมูลจำนวนมากเกี่ยวกับสมาชิกของช่อง หากต้องการตรวจจับกลุ่มของสมาชิกที่คล้ายกัน สามารถใช้
อลั กอรทิ ึมการทำคลสั เตอร์ได้
การแสดงภาพ
การแสดงภาพเป็นกระบวนการสร้างไดอะแกรมรูปภาพ กราฟ แผนภูมิ ฯลฯ เพื่อสื่อสารข้อมูลบางอย่าง
วธิ ีน้ีสามารถทำได้โดยใช้ Machine Learning แบบไมม่ ผี สู้ อน ตัวอย่างเช่น สมมตวิ า่ ผูเ้ รยี นเปน็ โคช้ ทมี ฟุตบอลและ
มีข้อมูลเกี่ยวกับผลงานของทีมในทัวร์นาเมนท์ ผู้เรียนต้องการค้นหาสถิติทั้งหมดเกี่ยวกับการแข่งขันอย่างรวดเร็ว
จากการป้อนข้อมูลที่ซับซ้อนและไม่มีป้ายกำกับให้กับอัลกอริทึมการแสดงภาพบางอย่างได้ อัลกอริทึมเหล่านี้จะ
ส่งออกการแสดงข้อมูลของคุณแบบสองมิติหรือสามมิติที่สามารถลงจุดได้ง่าย จากนั้นการดูกราฟที่ลงจุดจะได้รับ
ข้อมูลจำนวนมากไดอ้ ยา่ งง่ายดาย
โครงการพฒั นาชดุ ทดลองปัญญาประดิษฐ์เพอ่ื พัฒนาทกั ษะดา้ นดิจทิ ัลของนักเรียนและนักศึกษาในสายวิชาชีพอาชวี ศกึ ษาและสามญั ศกึ ษา
(Open AI Kit for Thai Students) | 72
สำนักงานคณะกรรมการดิจิทัลเพอ่ื เศรษฐกจิ และสังคมแหง่ ชาติ
การลดขนาด
การลดขนาดเปน็ กระบวนการลดจำนวนตัวแปรสุ่มภายใตก้ ารพจิ ารณาโดยรับชดุ ของตวั แปรหลัก
การคน้ หากฎการเชอ่ื มโยง
กระบวนการค้นหาความเชื่อมโยงระหว่างพารามิเตอร์ต่างๆ ในข้อมูลที่มีอยู่ สามารถค้นพบความน่าจะ
เป็นของการเกิดร่วมกนั ของสินค้าในคอลเลกชัน เช่น คนทซี่ อ้ื X มักจะซื้อ Y เช่นกัน ในการเรียนรู้กฎการเช่ือมโยง
อัลกอริทึมจะเจาะลึกข้อมูลจำนวนมากและค้นหาความสัมพันธ์ที่น่าสนใจระหว่างแอตทริบิวต์ (Attribute)
ตวั อย่างเช่น เม่อื เขา้ ไปที่ Amazon และซ้ือสนิ คา้ บางรายการ จากนั้นพวกเขาจะแสดงผลติ ภัณฑ์ท่ีคล้ายกับโฆษณา
แมว้ า่ คณุ จะไมไ่ ด้อยู่ในเว็บไซตก์ ต็ าม
การตรวจจับความผิดปกติ
การตรวจจบั ความผดิ ปกติ คือ การระบสุ ง่ิ ของหายาก เหตกุ ารณ์ หรือการสังเกต ซง่ึ ทำให้เกดิ ความสงสัยที่
แตกต่างจากข้อมูลปกติอย่างมีนัยสำคัญ ตัวอย่างที่สำคัญอย่างหนึ่ง คือ การตรวจจับการฉ้อโกงบัตรเครดิต จาก
เหตุการณ์มากมายที่เกี่ยวข้องกับการฉ้อโกงบัตรเครดิต ขณะนี้ปัญหานี้ได้รับการแก้ไข โดยใช้เทคนิคการตรวจจบั
ความผิดปกติใน Machine Learning
โครงการพฒั นาชดุ ทดลองปัญญาประดิษฐ์เพ่ือพัฒนาทักษะดา้ นดจิ ทิ ลั ของนกั เรยี นและนกั ศึกษาในสายวชิ าชพี อาชวี ศึกษาและสามญั ศึกษา
(Open AI Kit for Thai Students) | 73
สำนักงานคณะกรรมการดจิ ทิ ัลเพื่อเศรษฐกิจและสังคมแห่งชาติ
บทที่ 9
อัลกอรทิ มึ ที่นิยมใน Machine Learning
วัตถุประสงค์ เมื่อรู้จักกับการเรียนรู้แบบมีผู้สอน (Supervised learning) และการเรียนรู้แบบไม่มีผู้สอน
(Unsupervised learning) จึงมาเรียนรู้กับอลั กอริทึม (Algorithms) ต่างๆ ที่นิยมใช้ในปัจจุบัน โดยประกอบด้วย
หัวขอ้ ดังนี้
9.1 อัลกอริทึมที่นิยมใช้ในการเรียนรู้แบบมีผู้สอน ( Supervised Learning Several Popular
Algorithms)
9.1.1 Logistic Regression
9.1.2 Linear Discriminant Analysis
9.1.3 K-Nearest Neighbors
9.1.4 Decision Tree
9.1.5 Naive Bayes
9.1.6 Support Vector Machines
9.2 อัลกอริทึมที่นิยมใช้ในการเรียนรู้แบบไม่มีผู้สอน (Unsupervised Learning Several Popular
Algorithms)
9.2.1 K-Mean Algorithm
9.1 อัลกอรทิ ึมท่นี ยิ มใชส้ ำหรับการเรียนรู้แบบมผี สู้ อนในปจั จบุ นั
9.1.1 การถดถอยโลจิสติกส์ (Logistic Regression) เป็นการวิเคราะห์เพื่อทำนายโอกาสที่จะเกิด
เหตุการณ์ที่สนใจ โดยอาศัยสมการโลจิสติกส์ที่สร้างขึ้นจากชุดตัวแปรทำนาย ที่เป็นตัวแปรที่มีข้อมูลอยู่ในระดับ
ช่วง (Interval Scale) เป็นอย่างน้อย โดยที่ระหว่างตัวแปรทำนายจะต้องมีความสัมพันธ์กันต่ำ และในการ
วิเคราะห์จะต้องใช้ขนาดตัวแปรทำนายไม่ต่ำกว่า 30 ตัวแปร การวิเคราะห์การถดถอยโลจิสติกส์แบ่งออกเป็น 2
ประเภท ได้แก่
1) การวิเคราะห์การถดถอยโลจิสติกส์ทวิ ใช้กับตัวแปรเกณฑ์ที่แบ่งออกเป็น 2 กลุ่มย่อย เช่น กลุ่มท่ี
ปรากฏเหตุการณท์ ่ีสนใจ มีค่า เป็น 1 กบั กลุ่มทไ่ี ม่ปรากฏเหตุการณท์ ่ีสนใจ มคี า่ เป็น 0
2) การวิเคราะห์การถดถอยโลจิสติกส์พหุกลุ่ม ใช้กับตัวแปรเกณฑ์ที่มีหลายกลุ่มย่อยหรือมีมากกว่า 2
กลุม่ ยอ่ ย เชน่ ขนาดโรงพยาบาล แบ่งเปน็ โรงพยาบาลขนาดใหญ่/กลาง/เล็ก หรือ โรงแรมมมี าตรฐานกาให้บริการ
สูง/ปานกลาง/ต่ำ การวิเคราะห์การถดถอยโลจิสติกส์นั้น ความสัมพันธ์ระหว่างตัวแปรทำนายกับตัวแปรเกณฑ์จึง
ไม่เป็นความสัมพนั ธเ์ ชงิ เสน้ ในการวิเคราะหจ์ ะต้องมกี ารปรับให้ความสัมพันธ์อยู่ในรูปเชงิ เส้น
โครงการพฒั นาชุดทดลองปัญญาประดษิ ฐเ์ พือ่ พฒั นาทกั ษะดา้ นดิจทิ ัลของนกั เรยี นและนักศกึ ษาในสายวชิ าชพี อาชวี ศึกษาและสามัญศกึ ษา
(Open AI Kit for Thai Students) | 74
สำนักงานคณะกรรมการดจิ ทิ ัลเพ่อื เศรษฐกิจและสังคมแหง่ ชาติ
ภาพที่ 9.1
9.1.2 Linear Discriminant Analysis เป็นเทคนิคทางสถิติที่ใช้ในการแยกแยะจัดกลุ่ม (Classification)
โดยใช้ตัวแปรอิสระ (Independent Variables / Discriminating Variables / Predictor Variables) ในการ
พยากรณ์ค่าของตัวแปรตาม (Dependent Variable / Criterion Variable / Grouping Variable) ซึ่งมีได้หลาย
ค่า แต่ละค่าจะแสดงกลุ่มที่สังกัด หากค่าของตัวแปรตามมีได้เพียงสองค่า เรียกวิธีการในการแยกแยะจัดกลุ่มทาง
สถิตินี้ว่า Discriminant Analysis (DA) แต่ถ้าตัวแปรตามมีค่ามากกว่าสองค่า เรียกวิธีการในการแยกแยะจัดกลมุ่
ทางสถิตินว้ี ่า Multiple Discriminant Analysis (MDA)
ภาพที่ 9.2
9.1.3 เคเนียร์เรสเนเบอร์ (k-Nearest Neighbors: kNN) เป็นวิธีการจำแนกประเภทข้อมูล (Data
Classification) จัดเป็นวิธีการจำแนกประเภทข้อมูลแบบมีผู้สอน (Supervised Learning) หรือการที่ทราบ
โครงการพัฒนาชุดทดลองปญั ญาประดษิ ฐ์เพอื่ พฒั นาทักษะดา้ นดจิ ิทัลของนกั เรียนและนักศกึ ษาในสายวชิ าชพี อาชวี ศกึ ษาและสามญั ศึกษา
(Open AI Kit for Thai Students) | 75
สำนักงานคณะกรรมการดจิ ิทัลเพอ่ื เศรษฐกจิ และสังคมแหง่ ชาติ
คำตอบของข้อมูลอยู่ก่อนแล้ว จากนั้นใช้โมเดลในการจำแนกประเภทข้อมูลจากข้อมูลฝึกสอนที่ทราบคำตอบ
วิธีการจำแนกของเคเนียร์เรสเนเบอร์ จะใช้วิธีการวิเคราะห์จากข้อมูลที่ใกล้เคียงที่สุดจำนวน k ตัว กับข้อมูลท่ี
ต้องการจำแนกประเภทของข้อมูลหรือต้องการทำนายคลาสของข้อมูลใหม่ โดยจะทำนายตามคลาสส่วนใหญ่ของ
ข้อมูลฝึก k ตัว ซึ่งเทคนิคดังกล่าวนิยมใช้กันอย่างแพร่หลายในหลายด้าน เช่น ด้านการแพทย์ (Hu and Shao,
2012) ดา้ นอุทกวิทยาและอุตนุ ิยมวิทยา (Lee and Ouarda, 2011) เปน็ ตน้
ภาพที่ 9.3
9.1.4 ต้นไม้ตัดสินใจ (Decision Tree) ต้นไม้ตัดสินใจเป็นการจำแนก (Classification) ข้อมูลออกเป็น
คลาส (Class) ต่างๆ โดยใช้คุณสมบัติ (Attribute) ของข้อมูลในการจำแนกว่าคุณสมบัติใดของข้อมูลที่เป็นตัว
กำหนดการจำแนกและคณุ สมบัติแตล่ ะตัวของข้อมลู มกี ารวัดความสำคญั อยา่ งไร ตน้ ไมต้ ัดสินใจ ประกอบไปดว้ ย
1) โหนดภายใน (Internal Node) คือ คุณสมบัตติ า่ งๆ ของขอ้ มูลท่ใี ช้ในการตัดสินใจว่าข้อมูลจะไปอยู่
ในกรณีไหน โดยโหนดภายในทีเ่ ป็นโหนดเรม่ิ ตน้ เรยี กว่า โหนดราก
2) กิ่ง (Branch หรือ Link) เป็นค่าคุณสมบัติหรือเงื่อนไขของคุณสมบัติในโหนดที่ใช้ในการจำแนก
ขอ้ มูล ซงึ่ โหนดภายในจะแตกกิง่ เป็นจำนวนเท่ากบั จำนวนคา่ คณุ สมบตั ิของโหนดภายในนัน้
3) โหนดใบ (Leaf Node) คือคลาสต่างๆ ซ่ึงเป็นผลลพั ธ์ในการจำแนกขอ้ มลู
ลักษณะการเรยี นรขู้ องตน้ ไม้ตดั สนิ ใจ
• ผลการเรยี นรแู้ สดงอยู่ในรูปที่งา่ ยต่อการความเข้าใจและการวเิ คราะห์คุณสมบัติท่ีมีผลต่อการจำแนก
คลาสตา่ งๆ
• แต่ละเสน้ ทางจากโหนดรากถึงโหนดใบสามารถแสดงให้อยใู่ นรปู กฎ if-then ได้
• มคี วามทนทานตอ่ ข้อมูลรบกวน (Noisy Data)
• การเรยี นรู้มคี วามรวดเรว็ เมอื่ เทยี บกบั อัลกอรทิ ึมสำหรับจำแนกชนิดอ่ืน
โครงการพัฒนาชดุ ทดลองปญั ญาประดิษฐเ์ พือ่ พัฒนาทกั ษะดา้ นดิจิทลั ของนักเรยี นและนักศึกษาในสายวิชาชีพอาชวี ศึกษาและสามญั ศึกษา
(Open AI Kit for Thai Students) | 76
สำนกั งานคณะกรรมการดิจิทัลเพือ่ เศรษฐกจิ และสงั คมแหง่ ชาติ
• เหมาะแก่การนำไปใช้ในการวิเคราะห์งานทางด้านธุรกิจ ความเสี่ยงของลูกหนี้ การวิเคราะห์เครดิต
สว่ นบุคคล เป็นต้น
ภาพที่ 9.4
9.1.5 นาอีฟเบย์ (Naïve Bayes) การเรียนรู้ของนาอีฟเบย์ เป็นการเรียนรู้โดยใชห้ ลักการของความน่าจะ
เป็น (Probability) โดยใช้พื้นฐานจากทฤษฎีของเบย์ (Bayes Theorem) หรือทฤษฎีว่าด้วยโอกาสที่จะเกิดของ
เหตุการณ์ต่างๆ ซึ่งจะใช้การคํานวณความน่าจะเป็นแบบมีเงือ่ นไขที่เรียกว่า Conditional Probability (Dietrich
et al., 2015) แสดงไดด้ งั สมการ
โดยที่ P(h) คอื ค่าความนา่ จะเป็นของสมมติฐานทีค่ ลาสเปน็ h
P(D) คอื ค่าความนา่ จะเป็นของสมมติฐานทข่ี ้อมลู เป็น D
P(h|D) คอื คา่ ความน่าจะเปน็ ของสมมติฐานท่ีขอ้ มลู เป็น D จะมคี ลาสเป็น h
P(D|h) คือ คา่ ความน่าจะเป็นของสมมตฐิ านท่ีคลาสเป็น h จะมีขอ้ มลู เป็น D
ในปัญหาที่มีตัวแปรต้นหรือข้อมูลที่ต้องพิจารณามากกว่า 1 ค่าความน่าจะเป็นของเหตุการณ์ สามารถ
คํานวณไดจ้ ากผลคณู ของความน่าจะเป็นของแตล่ ะข้อมลู ทมี่ ีคลาส h ดังสมการ
โครงการพฒั นาชดุ ทดลองปญั ญาประดษิ ฐเ์ พอ่ื พัฒนาทกั ษะดา้ นดจิ ทิ ลั ของนักเรียนและนักศึกษาในสายวชิ าชพี อาชวี ศกึ ษาและสามญั ศึกษา
(Open AI Kit for Thai Students) | 77
สำนกั งานคณะกรรมการดจิ ิทัลเพื่อเศรษฐกิจและสงั คมแหง่ ชาติ
ภาพท่ี 9.5
9.1.6 ซัพพอร์ตเวกเตอร์แมชชีน (Support Vector Machine) หรือ SVM เป็นอีกหนึ่งอัลกอริทึมในกลุ่ม
วิธีการเรียนรู้ของเครื่องแบบมีผู้สอน ที่สามารถนํามาช่วยแก้ปัญหาการจําแนกข้อมูลได้ โดยเฉพาะกับปัญหาที่มี
ขนาดของข้อมูลไม่ใหญ่มาก แต่มคี ณุ ลักษณะ (Features) ของข้อมูลเป็นจํานวนมาก หลักการทํางานของ SVM จะ
อาศัยใช้การสร้างเส้นแบ่ง หรือไฮเปอร์เพลน (Hyperplane) ในการแบ่งแยกคลาสของข้อมูลออกจากกัน จากน้ัน
จะทําการหาว่าไฮเปอร์เพลนใดเป็นเสน้ ทีใ่ ชแ้ ยกคลาสของขอ้ มูลได้ดีท่สี ุด (Optimal hyperplane) ลักษณะดงั รูป
ภาพท่ี 9.6
9.2 อัลกอริทึมที่นิยมใช้ในการเรียนรู้แบบไม่มีผู้สอน (Unsupervised Learning Several Popular
Algorithms)
การกำหนดวิธีวัดความคล้ายหรือความต่างของข้อมูล มีหลายวิธีด้วยกัน แต่ที่นิยมใช้ ได้แก่ ยูคลิเดียน
(Euclidean Distance) โคไซน์ (Cosine) และแมนฮัชตัน (Manhattan Distance) เปน็ ตน้ ในการศึกษาคร้ังน้ี จะ
ขอกลา่ วเฉพาะ วิธวี ดั ระยะแบบยคู ลเิ ดียนเท่าน้ัน
วิธีการวดั ความคลา้ ยของข้อมลู ดว้ ยวิธวี ัดระยะแบบยคู ลเิ ดียน (Euclidean Distance) สามารถคำนวณหา
ไดจ้ ากสมการ
โครงการพัฒนาชุดทดลองปญั ญาประดิษฐเ์ พอ่ื พัฒนาทกั ษะดา้ นดจิ ิทลั ของนักเรยี นและนักศึกษาในสายวิชาชีพอาชวี ศึกษาและสามัญศกึ ษา
(Open AI Kit for Thai Students) | 78
สำนกั งานคณะกรรมการดจิ ทิ ลั เพ่ือเศรษฐกจิ และสงั คมแหง่ ชาติ
โดยที่ D คอื ระยะห่างระหวา่ งขอ้ มูลท่ี 1 และ 2
ซงึ่ ถา้ คา่ เท่ากับ 0 แสดงว่าข้อมลู มคี วามเหมอื นกัน
คอื คา่ ของแอทรบิ ิวต์ท่ี i ของข้อมลู ที่ 1
คอื ค่าของแอทริบวิ ตท์ ่ี i ของข้อมูลที่ 2
9.2.1 อัลกอริทมึ เคมนี (K-Mean Algorithm)
อัลกอริทึมแบบเคมีน เป็นการจัดกลุ่มข้อมูล (clustering) ที่มีขั้นตอนการทำงานที่ไม่ซับซ้อน และ
เข้าใจไดง้ ่าย โดยมขี ้ันตอนการทำงานดงั นี้
ขน้ั ตอนที่ 1 เริม่ ตน้ ดว้ ยการกำหนดคา่ K หรอื จำนวนกลุ่มข้อมลู ท่ีตอ้ งการ
ข้นั ตอนที่ 2 สุ่มวางตำแหน่งจุดศูนยก์ ลางของข้อมูลแต่ละกลมุ่ หรือ เซ็นทรอยด์ (Centroid)
ขั้นตอนที่ 3 จากจุดศูนย์กลางแต่ละจุดจะมีการคำนวณระยะทางกับทุกข้อมูลในชุดข้อมูล ซึ่งคำนวณ
โดยวิธียูคลิเดียนดังได้อธิบายไว้แล้วก่อนหน้านี้ จากนั้นแต่ละข้อมูลจะถูกจัดอยู่ในกลุ่มของจุดศูนย์กลางที่มี
ระยะทางใกล้ที่สุดเท่าน้นั
ขั้นตอนที่ 4 หลังจากทำการจัดกลุ่มข้อมูลใหม่แล้วทำการคำนวณค่าเฉลี่ยของสมาชิกในกลุ่ม เพื่อ
กำหนดเปน็ จุดศนู ยก์ ลางของกลุม่ ขอ้ มูลใหม่
ขั้นตอนที่ 5 ทำซ้ำข้อ 3 ถึง 4 จนกระทั่งค่าจุดศูนย์กลางของกลุ่มข้อมูลใหม่ได้ค่าไม่ต่างหรือต่างเพียง
เล็กน้อยจากคา่ จุดศนู ย์กลางรอบกอ่ นหนา้
โครงการพฒั นาชุดทดลองปญั ญาประดิษฐ์เพ่ือพฒั นาทักษะดา้ นดจิ ทิ ลั ของนักเรียนและนกั ศกึ ษาในสายวิชาชีพอาชวี ศึกษาและสามัญศกึ ษา
(Open AI Kit for Thai Students) | 79
สำนกั งานคณะกรรมการดิจทิ ลั เพ่ือเศรษฐกิจและสังคมแห่งชาติ
ภาพท่ี 9.7
โครงการพัฒนาชดุ ทดลองปญั ญาประดษิ ฐ์เพ่อื พฒั นาทกั ษะดา้ นดิจิทลั ของนักเรยี นและนักศึกษาในสายวิชาชพี อาชวี ศึกษาและสามญั ศึกษา
(Open AI Kit for Thai Students) | 80
สำนักงานคณะกรรมการดิจิทัลเพื่อเศรษฐกจิ และสงั คมแหง่ ชาติ
บทท่ี 10
พ้ืนฐานของ AI
วัตถุประสงค์ ทำความเข้าใจเกี่ยวกับพื้นฐานของเอไอ (Artificial intelligence) และ ทำความเข้าใจ
เกี่ยวกับพื้นฐานของเอไอ (Artificial intelligence) และ จุดมุ่งหมายสูงสุดเกี่ยวกับพื้นฐานของเอไอ (Artificial
intelligence) สเู่ อไอทั่วไป (Artificial General Intelligence) โดยประกอบดว้ ยหัวข้อดงั นี้
10.1 หลักสำคญั ของเอไอ (Foundations of AI)
10.2 คำจำกดั ความของเอไอ (Definition & Motivations)
10.3 การทำความเขา้ ใจของเอไอ (Understanding AI)
10.4 เส้นทางสู่เอจีไอ (The Path to AGI, Artificial General Intelligence)
10.1 หลกั สำคัญของ AI (Foundations of AI)
หลกั สำคญั สำหรบั การทำความเขา้ ใจเทคโนโลยี AI ประกอบดว้ ย
1. การกำหนดคำจำกัดความและความหมายของปัญญาประดิษฐ์และการอธิบายว่า AI ส่งผลต่อการ
เปลย่ี นแปลงไปอย่างรวดเร็วกับมนุษย์และโลกอยา่ งไร
2. การจดั แบง่ กลุม่ ของ AI เป็นงานหลกั 5 ดา้ น ได้แก่
• ทางด้านMachine Learning (Machine Learning) และสมั ปชัญญะ
• ระบบผเู้ ชย่ี วชาญ (Expert Systems) และการจัดการองคค์ วามรู้
• คอมพวิ เตอรว์ ชิ น่ั (Computer Vision) และการประมวลผลสญั ญาณ
• การประมวลผลภาษาธรรมชาติ (Natural Language Processing) และภาษาพูด
• โรบอท (Robotics) และฮวิ แมนนอยด์ (Humanoid)
ภาพที่ 10.1
โครงการพฒั นาชดุ ทดลองปัญญาประดษิ ฐเ์ พอ่ื พัฒนาทักษะดา้ นดิจิทลั ของนักเรยี นและนกั ศกึ ษาในสายวิชาชีพอาชวี ศกึ ษาและสามญั ศกึ ษา
(Open AI Kit for Thai Students) | 81
สำนักงานคณะกรรมการดจิ ิทลั เพ่อื เศรษฐกิจและสงั คมแหง่ ชาติ
ในปัจจบุ ันงานวจิ ัย AI กา้ วไปอย่างรวดเร็ว เทคโนโลยกี ารเรียนรู้เชิงลกึ ทำให้ AI เป็นเทคโนโลยหี ลกั ในการ
สร้างระบบทเ่ี ปน็ ไปไมไ่ ด้ในอดีตแตเ่ ป็นไปแลว้ ในทกุ วันนี้ เชน่ รถยนต์ไร้คนขบั เป็นต้น ปจั จบุ ันงานดา้ น AI จะช่วย
และผลักดนั ให้มนษุ ย์สามารถค้นควา้ หาคำตอบในเรอื่ งยากๆ ในด้านต่างๆ เชน่
• ด้านปรชั ญา: ความรมู้ าจากไหน?
• ดา้ นภาษา: ภาษามคี วามสมั พันธ์กบั ความคดิ อย่างไร?
• ดา้ นสมอง: สมองคนทำงานอย่างไร?
• ดา้ นพฤตกิ รรมเศรษฐกิจ: คนเราตดั สนิ ใจในการใช้ประโยชนอ์ ย่างเตม็ ที่
• ด้านคณติ ศาสตร์: อะไรท่ีทำงานได้?
• ด้านวิทยาศาสตร์คอมพวิ เตอร์: เราจะสร้างคอมพิวเตอร์ท่ีมปี ระสิทธภิ าพได้อย่างไร?
10.2 คำจำกดั ความของ AI หรอื ปญั ญาประดิษฐ์ (Definition & Motivations)
AI หรือ ปัญญาประดิษฐ์ สร้างมาเพื่อชว่ ยการทำงานและลดภาระของมนุษย์ในงานที่ต้องทำซำ้ ๆ และใน
การวิเคราะห์ตัดสินใจ AI ถูกออกแบบให้มีการทำงานเหมอื นมนุษย์ มีลักษณะเหมือนมนษุ ย์ เพราะมนุษย์ต้องการ
สร้างสิ่งที่คล้ายตัวมนุษย์เอง AI จะเน้นการจำลองความฉลาดของมนุษย์ เพราะฉะนั้นจึงนิยาม AI คือ การจำลอง
ความฉลาดของมนุษย์โดยเครื่องจักรหรือคอมพิวเตอร์ เพื่อคิด ตัดสินใจ เข้าใจ เรียนรู้ และเลียนแบบพฤติกรรม
ของมนุษย์ สำหรับการจัดการกบั สถานการณ์นน้ั ๆ อยา่ งมเี หตุผล
AI จะประกอบไปดว้ ย การคิด วิเคราะห์ เรยี นรู้ การใหเ้ หตผุ ล แก้ปัญหา และการตดั สนิ ใจในการแก้ปัญหา
โดยเลียนแบบวิธีการคดิ ของมนุษย์ โดยใช้ทฤษฎแี ละแบบจำลองทางคณิตศาสตร์มาผสมผสานกัน AI มีมานานแล้ว
ในยุคต้นนั้น AI เป็นซอฟต์แวร์ที่ใช้งานเรียกว่า ระบบผู้ชำนาญการ หรือ ระบบผู้เชี่ยวชาญ หรือ Expert System
ซึ่งใช้คณิตศาสตร์ที่เป็นเหตุและผล เช่น ถ้าหิวก็ต้องกินข้าว ถ้าร้อนก็ต้องอยู่ในที่ร่ม เป็นต้น ซึ่งในยุคนี้จะเป็น
โครงสร้างต้นไม้การตัดสินใจท่เี รียกว่า Decision Tree
ปัจจุบันการพัฒนาโมเดลทำ AI มีการใช้คณิตศาสตร์ที่ซับซ้อนขึ้น ทำให้มีการใช้ความสามารถของ
คอมพิวเตอร์มาช่วยในการคำนวณที่สูงขึ้นตามไปด้วย และเทคโนโลยีหลักของ AI ยุคนี้ จำลองสมองคนมาสร้าง
เป็น Machine Learning ท่อี ลั กอริทึม เปน็ นวิ รอลเน็ตที่สามารถฝกึ ให้ฉลาดได้
10.3 การทำความเข้าใจของ AI (Understanding AI - 1)
ปีค.ศ. 1995 หนังสือชื่อ Artificial Intelligence: A Modern Approach เขียนโดย สจวร์ต รัสเซลล์ล์
(Stuart J. Russell) และปเี ตอร์ นอร์วิก (Peter Norvig) มีการแบง่ AI เป็น 5 กลุ่มตามกรอบงานวจิ ัยทีม่ าจากการ
ทดสอบของแอลัน ทวั รงิ (Alan Turing)
Machine Learning
ในบทที่ 3 ถึง 9 เรียนรู้เชิงลึกของ Machine Learning เป็นการเพิ่มขีดความสามารถให้กับเครื่องจักรใน
การตัดสินใจโดยแทบไม่ต้องอาศัยมนุษย์เข้ามาแทรกแซง Machine Learning ถือว่าเป็นหลักของ AI ที่ทำให้
คอมพวิ เตอร์สามารถเรยี นร้แู ละตีความรปู แบบภาพ เสยี ง ข้อความ และข้อมลู ทมี่ โี ครงสรา้ ง โดยใช้อาร์เรย์ (Array)
หลายมิติ Machine Learning มีการแบ่งยอ่ ยออกเปน็ สีป่ ระเภท ได้แก่ การเรยี นรู้แบบมีผู้สอน การเรยี นรแู้ บบไม่มี
ผู้สอน การเรียนรแู้ บบกึง่ มผี ู้สอน และการเรียนรูแ้ บบเสรมิ กำลงั
โครงการพฒั นาชดุ ทดลองปัญญาประดิษฐเ์ พือ่ พฒั นาทักษะดา้ นดจิ ิทัลของนกั เรยี นและนักศกึ ษาในสายวิชาชีพอาชวี ศกึ ษาและสามญั ศึกษา
(Open AI Kit for Thai Students) | 82
สำนกั งานคณะกรรมการดจิ ิทลั เพ่ือเศรษฐกจิ และสงั คมแห่งชาติ
ภาพที่ 10.2
ระบบผเู้ ช่ยี วชาญ (Expert System)
ระบบผู้เชี่ยวชาญ (ES) คือ ตัวแทนสิ่งประดิษฐ์ที่ถูกพัฒนษขึ้นมาให้ใช้ประโยชน์จากความรู้ที่สร้างไว้
ล่วงหนา้ เพื่อให้คำแนะนำหรือตดั สินใจ ตัวอย่างรูปแบบที่ง่ายท่ีสุดของระบบผเู้ ชย่ี วชาญ เปน็ โครงสรา้ งการตดั สินใจ
ที่ซับซ้อนหรือใช้ตรรกะ if-then ที่ซ้อนกัน เช่น ถ้า x, y และ w เกิดขึ้นแล้ว จะสั่งให้คอมพิวเตอร์ทำ z ถึงแม้ว่า
ระบบผ้เู ชี่ยวชาญจะไมไ่ ด้ทำงานแบบเดยี วกบั Machine Learning แต่กม็ หี ลายเหตุผลทใี่ หร้ ะบบผู้เช่ยี วชาญอยู่บน
Machine Learning
1. ระบบผเู้ ช่ียวชาญสามารถใชป้ ระโยชน์จากขอ้ มูลเชิงลกึ ของมนษุ ยท์ ค่ี ้นพบผ่านการลองผิดลองถูก
2. ระบบผู้เชี่ยวชาญสามารถทำนายได้มากกว่าและมีโอกาสที่จะเกิดข้อผิดพลาดน้อยมากเมื่อต้อง
เผชิญกับขอ้ มูลนำเขา้ ที่ไมร่ ู้มากอ่ นหนา้ นี้
3. ในอดีตระบบผู้เชี่ยวชาญมีความรวดเร็วและง่ายต่อการนำไปใช้แม้ว่า Machine Learning จะ
สามารถเขา้ ถึงได้มากข้นึ ในช่วงไมก่ ่ปี ีที่ผา่ นมาก็ตาม
ตวั อย่างท่ีใชใ้ นระบบผเู้ ช่ยี วชาญ ได้แก่ เนสเทอรโ์ มมเิ ตอรข์ องกเู กลิ (Google’s Nest Thermometer)
โครงการพฒั นาชุดทดลองปญั ญาประดษิ ฐเ์ พ่ือพัฒนาทกั ษะดา้ นดจิ ิทลั ของนกั เรยี นและนักศึกษาในสายวิชาชพี อาชวี ศึกษาและสามัญศึกษา
(Open AI Kit for Thai Students) | 83
สำนกั งานคณะกรรมการดจิ ิทัลเพ่อื เศรษฐกิจและสังคมแหง่ ชาติ
10.4 การทำความเข้าใจของ AI (Understanding AI - 2)
ภาพท่ี 10.3
คอมพวิ เตอรว์ ชิ ั่น (Computer Vision)
เป็นการสกัด วิเคราะห์ และแปลความของภาพถ่ายและวีดีโอโดยอัตโนมัติ คอมพิวเตอร์วิชั่นมีการแปลง
ภาพถ่ายและวีดีโอเป็นอาร์เรย์ตัวเลข ทำให้อัลกอริทึม Machine Learning สามารถวาดรูปจากการอนุมาน สร้าง
การทำนาย และแมแ้ ต่สร้างภาพใหมต่ าม Input ทผี่ ู้ใช้กำหนดด้วยตัวเองได้
การประมวลผลภาษาธรรมชาติ (Natural Language Processing)
ภาพที่ 10.4
การประมวลผลภาษาธรรมชาตเิ ป็นการสกัด วิเคราะห์ และสร้างภาษาของมนุษย์โดยอัตโนมัติ อัลกอริทึม
ในการประมวลผลภาษาธรรมชาติมีการบ่งแยกคำในหลายวิธีด้วยกัน เช่น การแบ่งคำ การแบ่งตัวอักษร การอ่าน
จากขวาไปซ้ายหรือซ้ายไปขวา เป็นต้น มีการอนุมาณถึงความหมายของผู้เขียนและความคิดแบบอัตโนมัติได้ ใน
โครงการพัฒนาชดุ ทดลองปญั ญาประดิษฐ์เพอื่ พัฒนาทักษะดา้ นดจิ ิทัลของนักเรยี นและนกั ศกึ ษาในสายวชิ าชีพอาชวี ศกึ ษาและสามญั ศกึ ษา
(Open AI Kit for Thai Students) | 84
สำนักงานคณะกรรมการดิจทิ ัลเพอื่ เศรษฐกจิ และสังคมแห่งชาติ
การประมวลผลภาษาธรรมชาติ มีการนำไปใช้หลากหลายและมีความสำคัญในอันดับต้นๆ ในการนำไปใช้งานใน
ปจั จบุ นั
ภาพท่ี 10.5
โรโบติกส์ (Robotics)
โรโบตกิ ส์เปน็ ศาสตร์ทางวิทยาศาสตร์ในด้านการออกแบบ การสร้าง การประมวลผล และการประยุกต์ใช้
หุ่นยนต์ไปแก้ปัญหาให้มนุษย์ หุ่นยนต์มีรูปร่างและขนาดที่แตกต่างกันมากเป็นหลายพันแบบ ทำให้ยากในการให้
คำจำกัดความที่ครอบคลุมได้ทั้งหมดได้ ปัจจุบันมีการผลิตหุ่นยนต์ประเภทฮิวแมนนอย (Humanoid) และมีการ
ผลติ ห่นุ ยนตส์ ัตวจ์ ัดจำหนา่ ยแล้วในปี 2021
ศริ ิ (Siri)
โครงการพัฒนาชุดทดลองปัญญาประดษิ ฐ์เพือ่ พฒั นาทกั ษะดา้ นดจิ ิทลั ของนักเรยี นและนกั ศึกษาในสายวิชาชพี อาชวี ศึกษาและสามัญศกึ ษา
(Open AI Kit for Thai Students) | 85
สำนกั งานคณะกรรมการดจิ ทิ ลั เพ่ือเศรษฐกิจและสงั คมแหง่ ชาติ
ศิริ (Siri) เปน็ ซอฟต์แวรป์ ระเภท Chatbot ทใ่ี ช้ AI เรยี นรโู้ ต้ตอบลกู คา้ ของ Apple เชอื่ หรอื ไมว่ า่ Apple
ละเมิดลขิ สทิ ธงิ์ านวจิ ยั ของดร.วรี ะ บญุ จริง ตอนเรียนและวิจัยที่ Rensselaer Polytechnic Institute (RPI) รฐั
นวิ ยอร์ก สหรัฐอเมริกา โดยมีอาจารย์ทปี่ รึกษาช่อื Professor Cheng Hsu ผลงานของดร.วรี ะกบั อาจารยท์ ่ี
ปรึกษาคือเรื่อง “Natural Language Interface” และได้จดลิขสิทธไ์ิ ว้ แตเ่ นอ่ื งจากเป็นงานวจิ ัยมหาวทิ ยาลัย
ลิขสิทธิ์จึงตกเปน็ ของ RPI และตอ่ มา RPI ก็ขายลิขสทิ ธ์นิ ้ีให้กับบริษทั Dynamic Advances สดุ ท้าย Apple ยอม
จ่าย 24.9 ล้านเหรียญสหรัฐ ใหก้ บั RPI เพ่ือยุติการฟ้องร้องนานนับ 10 ปี
10.5 เส้นทางสู่ AGI (Artificial General Intelligence)
ลักษณะของ AI แบ่งออกได้เปน็ 3 ประเภทใหญ่ๆ ไดแ้ ก่
1. ปัญญาประดิษฐ์แบบแคบ (Artificial Narrow Intelligence: ANI) สามารถทำงานตามสิ่งที่ถูก
กำหนดได้ สามารถเรียนรู้และพัฒนาตัวเองตามงานที่กำหนดเอาไว้เท่านั้น คือ AI ท่ีได้รับการออกแบบมาเพ่ือ
ช่วยงานดา้ นใดดา้ นหนึ่งเท่านัน้ จะให้ทำงานอื่นทำไม่ได้ ตัวอย่างของ AI ประเภทนี้ได้แก่ AI สำหรับเล่นหุ้น AI
ท่ีใช้สำหรบั จำใบหนา้ AI รูจ้ ำวัตถุ AI ตรวจจบั โครงรา่ งรูปร่าง เป็นต้น
โครงการพฒั นาชุดทดลองปัญญาประดษิ ฐ์เพื่อพฒั นาทกั ษะดา้ นดจิ ทิ ลั ของนักเรยี นและนักศึกษาในสายวิชาชีพอาชวี ศกึ ษาและสามัญศกึ ษา
(Open AI Kit for Thai Students) | 86
สำนักงานคณะกรรมการดิจิทัลเพอ่ื เศรษฐกิจและสังคมแห่งชาติ
ภาพท่ี 10.6
2. ปัญญาประดิษฐ์แบบทั่วไป (Artificial General Intelligence: AGI) มีความสามารถในการ
เข้าใจ วิเคราะห์ และทำงานในสถานการณ์ที่แตกต่างกันได้ ไม่จำเป็นต้องมีโปรแกรมเฉพาะแยกแต่ละงานกัน มี
ความสามารถเทยี บเทา่ มนุษย์
ภาพที่ 10.7
โครงการพัฒนาชุดทดลองปัญญาประดษิ ฐเ์ พอื่ พฒั นาทกั ษะดา้ นดจิ ทิ ลั ของนักเรยี นและนกั ศึกษาในสายวชิ าชีพอาชวี ศึกษาและสามญั ศึกษา
(Open AI Kit for Thai Students) | 87
สำนักงานคณะกรรมการดิจทิ ัลเพอื่ เศรษฐกิจและสังคมแหง่ ชาติ
3. ปัญญาประดิษฐ์แบบสุดขีด (Artificial Super Intelligence: ASI) มีความเข้าใจในจุดมุ่งหมายของ
การกระทำ มีความสามารถในการเลือก และสามารถตั้งจุดมุ่งหมายของการมีตัวตน สามารถวิวัฒนาการ และมี
ววิ ฒั นาการจนเหนือกว่ามนุษย์ โดยไม่ต้องเลียนแบบมนุษย์ AI แบบน้ีจะเป็นสิ่งมีชีวติ ชนิดใหม่ที่วิวัฒนาการตัวเอง
ได้ จงึ ทำงานไดห้ ลากหลาย ปรับตวั เองได้ เรียนรู้เองได้ เตบิ โตได้ถงึ ระดบั หนง่ึ
ภาพท่ี 10.8
ภาพท่ี 10.9
โครงการพัฒนาชุดทดลองปญั ญาประดษิ ฐเ์ พอ่ื พฒั นาทกั ษะดา้ นดจิ ทิ ลั ของนักเรยี นและนกั ศกึ ษาในสายวชิ าชีพอาชวี ศึกษาและสามัญศกึ ษา
(Open AI Kit for Thai Students) | 88
สำนักงานคณะกรรมการดิจิทลั เพือ่ เศรษฐกิจและสงั คมแหง่ ชาติ
บทที่ 11
นิวรอลเน็ตเวริ ค์ และการเรียนร้เู ชิงลึก
วัตถุประสงค์ ทำความเข้าใจเกี่ยวกับนิวรอลเน็ตเวิร์ค (Neural Networks) และการเรียนรู้เชิงลึก (Deep
Learning) ที่เป็นพื้นฐานของการสร้างโมเดล และการเรียนรู้ของเครื่อง (Machine learning) โดยประกอบด้วย
หัวข้อดังนี้
11.1 บทนำเบื้องต้นของนิวรอลเน็ตเวิร์คและการเรียนรู้เชิงลึก (Introduction to Neural Networks
and Deep Learning)
11.2 พนื้ ฐานนวิ รอลเนต็ เวิร์ค (Neural Networks Basics)
11.3 การเรียนรเู้ ชงิ ลกึ (Deep Neural Networks)
11.1 บทนำเบื้องต้นของนิวรอลเน็ตเวิร์คและการเรียนรู้เชิงลึก (Introduction to Neural Networks
and Deep Learning)
Neural Network หรือ โครงข่ายประสาทเทียม (Artificial neural networks: ANN) หรือ ข่ายงาน
ประสาทเทียม (Connectionist systems) คือ ระบบคอมพิวเตอร์จากโมเดลทางคณิตศาสตร์ เพื่อจำลองการ
ทำงานโครงขา่ ยประสาทชวี ภาพท่ีอย่ใู นสมองของสัตว์และคน โครงขา่ ยประสาทเทียมสามารถเรยี นรู้ที่จะทำงานท่ี
มอบหมายได้จากการเรียนรูผ้ า่ นตัวอย่าง โดยไม่ถูกโปรแกรมดว้ ยกฎเกณฑ์ตายตัวแบบระบบอัตโนมัติ ยกตัวอย่าง
เช่น ในการประมวลผลภาพ คอมพิวเตอร์ที่ทำงานด้วยระบบโครงข่ายประสาทเทียมจะเรียนรู้การจำแนกรูปภาพ
แมวได้จากการให้ตัวอย่างรูปภาพที่กำกับโดยผู้เขียนโปรแกรมว่า “เป็นแมว” หรือ “ไม่เป็นแมว” จากนั้นนำ
ผลลัพธ์ที่ได้ไปใช้ระบุภาพแมวในตัวอย่างรูปภาพอื่นๆ โปรแกรมโครงข่ายประสาทเทียมสามารถแยกแยะรูปภาพ
แมวได้โดยปราศจากการความรู้กอ่ นหนา้ วา่ ”แมว” คอื อะไร (อาทิ แมวมีขน มีหแู หลม มีเขยี้ ว มหี าง) แทนที่จะใช้
ความรู้ดงั กล่าว โครงขา่ ยประสาทเทยี มทำการระบุตวั แมวโดยอัตโนมัติดว้ ยการระบลุ ักษณะเฉพาะ จากชดุ ตวั อย่าง
ท่ีเคยไดป้ ระมวลผล
โครงการพฒั นาชดุ ทดลองปัญญาประดษิ ฐเ์ พอื่ พฒั นาทกั ษะดา้ นดิจทิ ัลของนักเรยี นและนักศกึ ษาในสายวชิ าชีพอาชวี ศึกษาและสามญั ศกึ ษา
(Open AI Kit for Thai Students) | 89
สำนักงานคณะกรรมการดจิ ิทลั เพือ่ เศรษฐกิจและสังคมแหง่ ชาติ
ภาพที่ 11.1
แนวคิดเริ่มต้นของเทคนิคนี้ได้มาจากการศึกษาโครงข่ายไฟฟ้าชีวภาพ (Bioelectric Network) ในสมอง
ซึ่งประกอบด้วย เซลล์ล์ประสาท (Neurons) และ จุดประสานประสาท (Synapses) ตามโมเดลนี้ ข่ายงาน
ประสาทเกดิ จากการเชอ่ื มตอ่ ระหว่างเซลล์ลป์ ระสาท จนเปน็ เครอื ข่ายทีท่ ำงานรว่ มกนั
การประมวลผลต่างๆ ของโครงขา่ ยประสาทเทียมเกดิ ขนึ้ ในหนว่ ยประมวลผลย่อย เรยี กวา่ โหนด (Node)
ซงึ่ โหนดเปน็ การจำลองลกั ษณะการทำงานมาจากเซลล์ลก์ ารสง่ สัญญาณ ระหว่างโหนดทีเ่ ชอื่ มตอ่ กัน จำลองมาจาก
การเชอื่ มต่อของใยประสาท และแกนประสาทในระบบประสาทของสมองมนุษยภ์ ายในโหนด จุดเช่ือมต่อแต่ละจุด
มีความคล้ายคลึงกับจุดประสานประสาท (Synapses) ในสมอง มีความสามารถในการส่งสัญญาณไปยังเซลล์ล์
ประสาทเซลล์ลอ์ น่ื ๆ ท่เี ช่อื มต่อกบั มันได้
ภาพที่ 11.2
การเรียนรู้เชิงลึก (Deep Learning) คือวิธีการเรียนรู้แบบอัตโนมัติด้วยการ เลียนแบบการทำงานของ
โครงข่ายประสาทของมนุษย์ (Neurons) โดยนำระบบโครงข่ายประสาท (Neural Network) มาซ้อนกันหลายชั้น
(Layer) และทำการเรียนรขู้ อ้ มูลตัวอยา่ ง ซึง่ ขอ้ มูลดงั กล่าวจะถกู นำไปใช้ในการตรวจจบั รูปแบบ (Pattern) หรอื จัด
หมวดหมู่ขอ้ มูล (Classify the Data)
โครงการพัฒนาชุดทดลองปญั ญาประดษิ ฐ์เพื่อพัฒนาทักษะดา้ นดิจิทลั ของนกั เรียนและนักศกึ ษาในสายวิชาชพี อาชวี ศึกษาและสามญั ศกึ ษา
(Open AI Kit for Thai Students) | 90
สำนักงานคณะกรรมการดิจทิ ัลเพ่อื เศรษฐกจิ และสังคมแหง่ ชาติ
ภาพท่ี 11.3
11.2 ระบบโครงข่ายประสาท (Neural Networks)
จุดประสงคข์ องการสร้างระบบโครงขา่ ยประสาท เปน็ การจำลองโครงสรา้ งของสมองของมนุษย์ที่สามารถ
เรียนรู้ไดผ้ ่านแบบจำลองทางคณิตศาสตร์หรือที่เราเรียกว่าโครงข่ายประสาทเทียม โครงสร้างทางสมองของมนษุ ย์
จะประกอบไปด้วยหลักๆ สามส่วน คือ เดนไดรท์ (Dendrites) นิวเคลียส (Nucleus) และโสมา (Soma: Cell
Body) ส่วนแรก เดนไดรท์ (Dendrites) คือ จุดที่รับสัญญาณเข้ามา นิวเคลียส คือ ตัวประมวลผล และโสมา
(Soma: Cell Body) คือ ตัวปล่อยสัญญาณออกไปยังเซลล์ล์ตัวอื่น ในการที่เรามีเซลล์ล์สมองเพียงตัวเดียวไม่
สามารถทำให้เกิดความฉลาดข้ึนมาได้เราจึงต้องสร้างข้ึนมาตวั ท่ีสองเพือ่ ให้เกิดความฉลาด เซลล์ล์สมองตวั ที่สองก็
จะมาประกบเซลล์ล์สมองตวั แรก โดยโสมา (Soma: Cell Body) จะเชื่อมกับ เดนไดรท์ (Dendrites) จะทำให้เกิด
จุดประสานประสาท (Synapses) ขึ้นมา
ซึ่งจุดประสานประสาท (Synapses) จะมีหน้าที่ทำการส่งต่อข้อมูลระหว่างเซลล์ล์สมองตัวแรก กับตัวที่
สอง โดยท่มี ันจะทำการเปลยี่ นสัญญาณท่ีเซลล์ล์สมองตัวแรกส่งออกมาให้กลายเปน็ สัญญาณทางเคมเี พ่ือจะทำการ
ส่งไปในระดับเซลล์ล์ได้นั่นเอง โดยที่ถ้าเซลล์ล์สมองสองตัวนี้ทำงานสนับสนุนกันหรือคิดทางเดียวกัน จะทำให้จุด
ประสานประสาท (Synapses) ตัวนี้แข็งแรงขึ้น แต่ถ้าเมื่อไหร่ก็ตามทีม่ ันทำงานขัดแย้งกัน สิ่งที่เกิดขึ้นจะทำให้จดุ
ประสานประสาท (Synapses) อ่อนแอลง
สญั ญา ภาพท่ี 11.4
แขง็ สญั ญาณ
โครงการพฒั นาชุดทดลองปญั ญาประดษิ ฐเ์ พอ่ื พฒั นาทกั ษะดา้ นดจิ ิทลั ของนกั เรียนและนักศึกษาในสายวชิ าชพี อาชวี ศึกษาและสามัญศกึ ษา
(Open AI Kit for Thai Students) | 91
สำนักงานคณะกรรมการดจิ ทิ ัลเพ่อื เศรษฐกจิ และสงั คมแหง่ ชาติ
ฟังค์ชั่นแอคติเวชั่น (Activation Function) คือ การจำลองเซลล์สมองของมนุษย์ ซึ่งเซลล์สมองของ
มนุษย์สามารถทำการตัดสินใจได้ จึงต้องทำให้ ฟังค์ชั่นแอคติเวชั่น (Activation Function) สามารถทำการ
ตดั สินใจได้เหมอื นเซลล์สมองของมนษุ ย์ โดยใชต้ รรกศาสตร์ ซง่ึ ตรรกศาสตรต์ ัวแรกทใ่ี ชค้ ือ 0 กับ 1 กค็ ือใชก่ บั ไม่ใช่
ซึ่งในโลกนี้มีการมีอะไรมากกว่านั้นที่ไม่สามารถตัดสินใจได้ว่าใช่หรือไม่ใช่ สิ่งที่ทำได้คือ การใช้หลักการ Fuzzy
Logic มสี ภาวะคลุมเครอื คือมีคา่ ไดจ้ าก 0 ถงึ 1
ฟังค์ชั่นแอคติเวชั่น (Activation Function) ที่นิยมนำมาใช้ในโครงข่ายประสาทเทียมคือ ตระกูลฟังค์ชั่น
ซกิ มอยด์ (Sigmoid Function) ท่ใี หค้ า่ ระหว่าง 0 – 1
ภาพที่ 11.5
นอกจากฟังค์ชนั่ ซิกมอยด์แล้ว ยงั มฟี งั คช์ ่นั อน่ื ๆ ทน่ี ำมาใช้ ซงึ่ ในปจั จบุ นั ยังมกี ารวจิ ัยฟงั คช์ ่ันเหล่าน้ีมาอยู่
เรอ่ื ยๆ เม่อื ทำโครงขา่ ยประสาทเทยี มทีม่ ีขอ้ มูลมากขน้ึ หรือมีค่ามากข้ึน สามารถทำการแบ่งกล่มุ ของขอ้ มูลได้ดังรูป
โครงการพฒั นาชุดทดลองปญั ญาประดษิ ฐเ์ พ่ือพัฒนาทักษะดา้ นดิจทิ ัลของนักเรียนและนกั ศึกษาในสายวชิ าชีพอาชวี ศกึ ษาและสามญั ศกึ ษา
(Open AI Kit for Thai Students) | 92
สำนักงานคณะกรรมการดิจทิ ัลเพอ่ื เศรษฐกิจและสังคมแห่งชาติ
ภาพที่ 11.6
ถ้าใช้การเรียนรเู้ ชงิ ลึก จะได้สมการดังรูปด้านลา่ ง คือการสร้างสมการเชิงเส้นเป็นลักษณะของ Vector
ภาพท่ี 11.7
ตวั อย่าง กลุม่ ขอ้ มลู โดยการสร้างระบบโครงข่ายประสาทข้ึนมาหลายๆ เลเยอร์ (Layer) และให้แตล่ ะเซลล์
สามารถเช่ือมตอ่ กัน และปลอ่ ยให้มันเรยี นรู้จนมันสามารถแบ่งขอ้ มลู สีสม้ กับสนี ำ้ เงนิ ออกจากกนั ได้
ทดลองเขา้ ไปท่ี https://playground.tensorflow.org/ แลว้ ใส่คา่ ต่างๆ แลว้ ดูผลแสดงออกมา
โครงการพัฒนาชุดทดลองปญั ญาประดิษฐเ์ พื่อพฒั นาทักษะดา้ นดิจทิ ัลของนักเรยี นและนักศึกษาในสายวชิ าชีพอาชวี ศกึ ษาและสามญั ศกึ ษา
(Open AI Kit for Thai Students) | 93
สำนกั งานคณะกรรมการดจิ ิทลั เพ่อื เศรษฐกจิ และสงั คมแห่งชาติ
ภาพที่ 11.8
11.3 การเปรียบเทียบระหว่าง การเรียนรู้ของเครื่อง (Machine Learning) กับการเรียนรู้เชิงลึก (Deep
Learning)
ตัวอย่างการใช้การเรียนรู้ของเครื่อง (Machine Learning) กับการเรียนรู้เชิงลึก (Deep Learning) มา
แกป้ ัญหาการแบ่งรปู สุนัขกบั รูปแมวว่าภาพที่เห็นคือตัวอะไร
กรณีการใช้การเรียนรู้ของเครื่อง (Machine Learning) ต้องมีการนำภาพสุนัขมาใส่ในเครื่องมือที่ใช้การ
สกัดคุณลักษณะด้วยมนุษย์ ที่เรียกว่า Manual Features Detector หลังจากนั้น มีการค้นหารูปร่างของภาพว่า
มันคอื อะไรมาผ่าน อัลกอรทิ ึมการจำแนก (Classification Algorithm) โดยอาจเลอื กอัลกอริทึมบางตวั หรือทุกตัว
ก็ได้ แลว้ มาแบง่ แยกวา่ มันคอื อะไร อัลกอรทิ ึมก็จะทำนายออกมาว่าเปน็ สุนัขหรือไมใ่ ชส่ นุ ัข
กรณีการใช้การเรียนรู้เชิงลึก (Deep Learning) นำภาพสุนัขมาใส่ในโครงข่ายประสาทเทียม ด้วยการส่ง
ภาพผ่านโมเดลทผี่ า่ นการสรา้ งมาก่อนหน้าน้ีแลว้ มนั กจ็ ะทำนายออกมาว่าเป็นสนุ ัขหรอื ไมใ่ ชส่ นุ ขั
ภาพที่ 11.9
โครงการพัฒนาชดุ ทดลองปัญญาประดิษฐเ์ พอ่ื พัฒนาทักษะดา้ นดิจทิ ลั ของนกั เรยี นและนักศึกษาในสายวิชาชีพอาชวี ศกึ ษาและสามัญศึกษา
(Open AI Kit for Thai Students) | 94
สำนกั งานคณะกรรมการดจิ ทิ ลั เพือ่ เศรษฐกิจและสงั คมแหง่ ชาติ
11.4 สอน Neural Network อย่างไร?
การจำลองการเรียนรู้ของมนุษย์ คอื การจำลองจากข้อผดิ พลาดนำมาแกป้ ญั หา
ภาพที่ 11.10
• มนษุ ย์ เรยี นรู้ จากขอ้ ผดิ พลาด
• ข้อผดิ พลาด = error
• ใช้ error ในการปรับค่า Weight + Bias
• เพื่อใหไ้ ด้ Weight + Bias ที่ error น้อยสดุ
Output = ส่ิงที่ คดิ ออกมาจาก จากโครงข่ายประสาทเทยี ม
Target = ส่งิ ที่ ควรจะได้ จริง ตามที่มนษุ ย์กำหนดเอาไว/้ มกี ารกระตนุ้ /แยกเอง
Error = Target - Output = ข้อผิดพลาด
โครงการพัฒนาชุดทดลองปัญญาประดิษฐ์เพอ่ื พัฒนาทักษะดา้ นดิจิทลั ของนักเรยี นและนกั ศึกษาในสายวชิ าชพี อาชวี ศึกษาและสามญั ศึกษา
(Open AI Kit for Thai Students) | 95
สำนกั งานคณะกรรมการดจิ ิทลั เพ่อื เศรษฐกิจและสังคมแหง่ ชาติ
บทที่ 12
ข้อความและเสยี งพดู
วัตถุประสงค์ เพื่อเรียนรู้เกี่ยวกับระบบข้อความและเสียงพูด (Text and Speech) ที่มีการใช้งานการ
เรียนรู้ของเครื่อง (Machine learning) ในการทำงานและหลักการทำงานของระบบข้อความและเสียงพูด(Text
and Speech) โดยประกอบดว้ ยหัวขอ้ ดงั น้ี
12.1 บทนำเบอ้ื งตน้ ของระบบข้อความและเสยี งพูด (Introduction Text and Speech)
12.2 การประมวลผลภาษาธรรมชาติ (Natural Language Processing)
12.1 บทนำเบ้อื งต้นของระบบขอ้ ความและเสียงพูด (Introduction Text and Speech)
12.1.1 คลน่ื เสียง
คลื่นเสยี งของมนุษย์ คืออะไร คลื่นเสยี งของมนุษยม์ ลี ักษณะเป็นคลืน่ ที่มกี ารเปลย่ี นแปลงกับเวลา โดยใน
ตัวอย่างนี้จะแสดงเปน็ คำวา่ สวัสดีค่ะ
ภาพท่ี 12.1
คลื่นเสียงมีลักษณะเฉพาะซึ่งถ้าคลื่นเสียงเหมือนเดิมสิ่งที่เกิดขึ้นก็คือเราจะได้ยินเหมือนเดิมแต่ว่าอาจจะ
ช้าลง แปลวา่ เราสามารถสกัดขอ้ มูลมาไดห้ รอื มีรูปแบบเฉพาะ สำหรบั คำวา่ สะ – หวดั – ดี ตามตวั อย่าง A
ภาพที่ 12.2
ภาพท่ี 12.3
A แปลว่าถ้าเสยี งสามารถมรี ูปแบบเฉพาะได้แปลวา่ เราก็สามารถแบ่งแยกได้ ถ้าสามารถทำความเขา้ ใจได้
โครงการพัฒนาชุดทดลองปัญญาประดษิ ฐ์เพอื่ พัฒนาทักษะดา้ นดจิ ิทลั ของนกั เรยี นและนักศกึ ษาในสายวชิ าชีพอาชวี ศึกษาและสามัญศึกษา
(Open AI Kit for Thai Students) | 96
สำนักงานคณะกรรมการดจิ ิทัลเพื่อเศรษฐกิจและสงั คมแหง่ ชาติ
12.2 การประมวลผลภาษาธรรมชาติ (Natural language processing)
การประมวลผลภาษาธรรมชาติ ( Natural Language Processing : NLP) คือ การทำ AI หรือ
ปญั ญาประดิษฐ์ใหเ้ ข้าใจภาษาของมนุษยผ์ า่ นเสียงกับอกั ษร โดยจะแบง่ ออกเป็น 4 แบบ
12.2.1 แปลงเสียงเปน็ ตัวอักษร (Speech to Text)
12.2.2 แปลงตวั อกั ษรเป็นเสยี ง (Text to Speech)
12.2.3 แปลงเสยี งเป็นเสยี ง (Speech to Speech)
12.2.4 แปลงอักษรเปน็ อักษร (Text to Text)
12.2.1 แปลงเสียงเป็นตัวอกั ษร (Speech to Text: STT)
เป็นการแปลงเสียงภาษาต่าง ๆ ให้กลายเป็นตัวอักษร บางครั้ง เรียกว่า การรู้จำเสียง (Speech
Recognition: SR) หลักการทำงาน เมื่อมีคนพูดออกมา เสียงที่พูดมีการนำเข้าสู่โปรแกรมที่ทำการประมวลผลว่า
เสียงพดู นค้ี อื อะไร โดยทกี่ ารประมวลผลสิ่งทไ่ี ดอ้ อกมาเมอ่ื ประมวลผลเสร็จแลว้ กค็ ือ ตวั อักษร (Text)
ภาพท่ี 12.4
เมื่อมีการแปลงข้อมลู แล้วเราจะสามารถนำข้อมลู ที่แปลงซึ่งเป็นข้อความ ไปทำได้มากมาย เช่น ถ้าเรา
มกี ารระบบโต้ตอบอตั โนมัติ (bot) ระบบสามารถตอบโต้ได้ หรอื การสัมภาษณ์คน จะมเี สียงการบันทึกจำนวนมาก
เราก็สามารถใช้โปรแกรมตัวนี้แปลงบทสัมภาษณ์ ออกมาเป็นตัวอักษรได้ ทำให้สามารถรู้ว่า คนพูด กล่าวถึง
อะไรบ้าง
ตัวอยา่ ง
สิริ (Siri) เป็นระบบโต้ตอบการสั่งงานด้วยเสียงพูดของ บริษัทแอปเปิล โดยทำงานบนเครื่อง
โทรศพั ทม์ อื ถือไอโฟน ไอเพด เป็นตน้ โดยที่วธิ ีการทำงานของ Siri 4 ข้ันตอนดว้ ยกนั
โครงการพฒั นาชุดทดลองปญั ญาประดิษฐเ์ พอื่ พฒั นาทักษะดา้ นดิจทิ ลั ของนกั เรียนและนกั ศึกษาในสายวชิ าชีพอาชวี ศกึ ษาและสามญั ศกึ ษา
(Open AI Kit for Thai Students) | 97
สำนกั งานคณะกรรมการดจิ ิทลั เพอื่ เศรษฐกจิ และสังคมแห่งชาติ
ขั้นตอนที่หนึ่ง เรียกว่า Simple Pattern Matching เป็นการหาว่าเสียงที่ได้รับนั้นไปตรงกับอะไร
ภาษาอะไรและค่าเปน็ อะไร
ขั้นตอนที่สอง เรียกว่า Pattern and Feature Analysis เป็นการวิเคราะห์รูปแบบและคุณลักษณะ
เพื่อที่จะดูว่ารูปแบบแต่ละส่วนว่าส่วนนี้มันเป็นอะไร เป็นเสียงของอะไร เป็นคำควบกล้ำหรือไม่ เป็นคำติด กัน
หรอื ไมต่ ิดกัน เราต้องรกู้ ่อนวา่ เสียงน้ีมนั เป็นพยญั ชนะหรอื สระหรอื อะไรก็ตาม เราต้องวิเคราะห์ออกมา
ขั้นตอนที่สาม เรียกว่า Language Modeling and Statistical Analysis เป็นการวิเคราะห์ตัวโมเดล
ของภาษาและสถิติที่นำมาใช้ เป็นการหาความหมายกลุ่มคำที่เราคุย โดยท่ีเราใช้โมเดลได้หลายๆอันบางครั้งเรา
เรียก Hidden Markov Acoustic Models คอื หาความสัมพันธ์กนั ระหว่างเสยี งพดู แตล่ ะอันท่เี อามาประกอบกัน
ขั้นตอนที่สี่ เรียกว่า Artificial Neural Network เป็นการนำเครือข่ายประสาทเทียมมาใช้ ซึ่ง
เปรียบเสมือนมนุษย์ มีนำทุกอย่างมาประกอบกัน และทุกอย่างจะถูกนำผลลัพธ์ออกมาเป็นข้อความให้มีความ
ถกู ตอ้ งตามแกรมม่าที่เราออกแบบไวส้ ำหรบั ภาษานั้นๆ
ภาพท่ี 12.5
รูปตัวอย่างของการทำงาน โดยที่ตัวมันจะค่อยๆ ไหลไปในระบบสิ่งที่ทำก็คือตัวโมเดลของภาษา
(Language Model) ที่ไปแยกว่าอะไรคือประธาน อะไรคือกริยา อะไรคือกรรม และสุดท้ายแล้วรวมกันเป็น
ประโยคไดย้ งั ไง
โครงการพัฒนาชดุ ทดลองปญั ญาประดิษฐ์เพือ่ พฒั นาทกั ษะดา้ นดิจิทัลของนกั เรียนและนกั ศึกษาในสายวิชาชีพอาชวี ศึกษาและสามญั ศึกษา
(Open AI Kit for Thai Students) | 98
สำนกั งานคณะกรรมการดิจิทลั เพื่อเศรษฐกิจและสังคมแหง่ ชาติ
ภาพท่ี 12.6
โครงสร้างของเครือข่ายใยประสาท (neural network) ที่เกี่ยวกับเป็นการเรียนรู้ต่อเนื่องกันตามแต่
ช่วงเวลาหรือเราเรียกว่า RNN system (Recurrent Neural Network) หรือ LSTM (Long Short Term
Memory) เพราะต้องมีการจำข้อความก่อนหน้านั้น เพื่อมาใช้การวิเคราะห์ถึงความสัมพันธ์กันของข้อความก่อน
หนา้ และขอ้ ความในปัจจุบัน
ภาพที่ 12.7
สำหรับการแปลงเสียงเป็นข้อความ จำรูป 12.7 เริ่มจากการรับเสียงเข้า (Speech Input) เป็นคลื่น
เสียง (Wave Form) หลังจากนน้ั ทำการสกัดคุณลักษณะของเสียง (Acoustic Feature Extraction) ดว้ ยการจับคู่
กัน ผลลัพธ์ออกมาเป็นคุณลักษณะของเสียง (Acoustic Feature) ออกมา หลังจากนั้นมีการเลือกภาษาว่าเป็น
ข้อความอะไร ด้วยการผ่านการสกัดคำ หรือการทำดิกชั่นนารี ถัดมามีการนำแกรมม่ามาจับตัวคำ ก็จะได้เป็น
ประโยคที่สมบรู ณท์ มี่ นษุ ย์เขา้ ใจได้นั่นเอง
12.2.2 แปลงตัวอกั ษรเป็นเสยี ง (Text to Speech: TTS)
โครงการพัฒนาชดุ ทดลองปญั ญาประดิษฐเ์ พื่อพฒั นาทกั ษะดา้ นดิจิทัลของนกั เรยี นและนักศกึ ษาในสายวิชาชพี อาชวี ศกึ ษาและสามัญศึกษา
(Open AI Kit for Thai Students) | 99