The words you are searching are inside this book. To get more targeted content, please make full-text search by clicking here.

ระบบประเมินและวิเคราะห์แนวโน้มสภาพอารมณ์ของผู้ใช้สื่อสังคมออนไลน์แบบอัตโนมัติ-Final (2)

Discover the best professional documents and content resources in AnyFlip Document Base.
Search
Published by rusma_2543, 2022-04-20 02:41:44

ระบบประเมินและวิเคราะห์แนวโน้มสภาพอารมณ์ของผู้ใช้สื่อสังคมออนไลน์แบบอัตโนมัติ-Final (2)

ระบบประเมินและวิเคราะห์แนวโน้มสภาพอารมณ์ของผู้ใช้สื่อสังคมออนไลน์แบบอัตโนมัติ-Final (2)

ระบบประเมนิ และวเิ คราะห์แนวโน้มสภาพอารมณ์ของผูใ้ ชส้ อ่ื สงั คมออนไลน์
แบบอตั โนมตั ิ

Automatic Assessment and Analysis of Online User Emotional
Trends on based Social Media

นางสาวนิรวรรณ อุส่าหก์ าร
Nirawan Ausakan
นางสาวดารารัตน์ ขันงงั่
Dararat Khanngang

โครงงานนเ้ี ป็นสว่ นหนึง่ ของการศึกษาตามหลักสูตรปริญญาตรี
วทิ ยาศาสตร์บัณฑิต สาขาวชิ านวตั กรรมสารสนเทศทางการแพทย์

มหาวิทยาลยั วลยั ลกั ษณ์
A Project Submitted in Partial Fulfillment of the Requirements

for the Degree of Bachelor of Science Program
in Innovation of Medical Informatics
Walailak University
2565



ระบบประเมนิ และวเิ คราะห์แนวโน้มสภาพอารมณ์ของผูใ้ ชส้ อ่ื สงั คมออนไลน์
แบบอตั โนมตั ิ

Automatic Assessment and Analysis of Online User Emotional
Trends on based Social Media

นางสาวนิรวรรณ อุส่าหก์ าร
Nirawan Ausakan
นางสาวดารารัตน์ ขันงงั่
Dararat Khanngang

โครงงานนเ้ี ป็นสว่ นหนึง่ ของการศึกษาตามหลักสูตรปริญญาตรี
วทิ ยาศาสตร์บัณฑิต สาขาวชิ านวตั กรรมสารสนเทศทางการแพทย์

มหาวิทยาลยั วลยั ลกั ษณ์
A Project Submitted in Partial Fulfillment of the Requirements

for the Degree of Bachelor of Science Program
in Innovation of Medical Informatics
Walailak University
2565



หัวข้อโครงงาน ระบบประเมินและวิเคราะห์แนวโน้มสภาพอารมณ์ของผูใ้ ช้ส่ือสงั คมออนไลน์แบบ
อัตโนมัติ

ผูเ้ ขยี น นริ วรรณ อุส่าห์การ
ดารารัตน์ ขนั งง่ั

สาขา นวัตกรรมสารสนเทศทางการแพทย์
ปีการศกึ ษา 2565

บทคดั ย่อ

ทวิตเตอร์เป็นไมโครบล็อกสำหรับการสื่อสารแบบเรียลไทม์ โดยผู้ใช้สามารถแสดงความเหน็
ข้อความในมิติต่าง ๆ เช่น ด้านความบันเทิง เศรษฐกิจ และการเมือง โครงงานน้ีมีวัตถุประสงค์เพ่ือ
สกดั สารสนเทศและวิเคราะหแ์ นวโน้มสภาพอารมณข์ องผู้ใชส้ ่อื สังคมออนไลน์แบบอตั โนมัติ โดยอาศัย
ข้อความบนแพลตฟอร์มของทวิตเตอร์เป็นกรณศี ึกษา การวิเคราะห์แนวโน้มในโครงงานนีจ้ ะคำนึงถงึ
4 อารมณ์หลัก ประกอบด้วย 1) ความสุข 2) ความเศร้า 3) ความโกรธ และ 4) ความกลัว ในการ
วิเคราะห์ข้อมูลจะใช้เทคโนโลยีการประมวลผลภาษาธรรมชาติ (Natural Language Processing
[NLP]) เพอื่ การประมวลผล และการเรียนรู้ของเคร่ือง (Machine Learning [ML]) ผา่ น อลั กอรทิ มึ 7
อัลกอริทึม คือ K-Nearest Neighbors(KNN) , Support Vector Machine (SVM) , Support
Vector Classifier (SVC) , Stochastic Gradient Descent (SGD) , Random Forest (RFC) , Naive
Bayes (NB), Decision tree (DT) จากการทดสอบ ประสิทธิภาพของอลั กอรทิ ึมแต่ละตัวพบว่า SVM
มีความแม่นยำในการระบุอารมณ์ประเภทอารมณ์ 88 % ผลของอารมณ์จะแสดงในรูปแบบของเว็บ
แอปพลิเคชัน เพื่อเป็นประโยชน์ให้กับ แพทย์ผู้เชี่ยวชาญทางด้าน สุขภาพจิต หรือกระทรวงการ
พัฒนาสังคมและความมั่นคงของมนุษย์ ที่สามารถ นำไปสู่การวางแผนและรับมือกับ สภาพอารมณ์
ของผู้ใช้เพ่ือป้องกนั ความรุนแรงทจ่ี ะเกิดขึน้ ไดใ้ นอนาคต
ค ำ ส ำ ค ั ญ : Social network analysis, Twitter, Ranking , Emotion analysis ,Social media
mental health



Project Title Automatic Assessment and Analysis of Online User Emotional

Trends on based Social Media

Author Nirawan Ausakan

Dararat Khanngang

Major Program Innovation of Medical Informatics

Academic Year 2022

Abstract

Microblogging is a popular tool that teenagers employ to express their feelings
and opinions in the form of messages such as politics and entertainment. It is
challenging to use Microblogging to understand political movements. This project aims
to extract information based on Twitter's platform on how people express their
emotions relevant to political movements. We consider four emotions that consist of
happiness, sadness, anger, and fear. We apply Natural Language Processing (NLP) and
Machine Learning to develop a political model, and use seven algorithms including
K-Nearest Neighbors (KNN) , Support Vector Machine (SVM) , Support Vector Classifier
(SVC) , Stochastic Gradient Descent (SGD) , Random Forest (RFC) , Naive Bayes (NB),
Decision tree (DT). We found that SVM reaches the highest accuracy at around 88%.
The model can be applied by a web application that benefits physicians that let them
understand teenagers who suffer from mental health caused by political movements.

Keywords: Social network analysis, Twitter, Ranking, Emotion analysis, Social media
mental health



กิตตกิ รรมประกาศ

โครงงานระบบประเมินและวิเคราะห์แนวโน้มสภาพอารมณ์ของผู้ใช้สื่อสังคมออนไลน์แบบ
อัตโนมัติ สามารถดำเนินการจนประสบความสำเร็จลุล่วงไปด้วยดีด้วยความกรุณาจากอาจารย์ดร.
บูคอรี ซาเหาะ อาจารย์ที่ปรึกษาโครงงาน ที่ได้ให้คำปรึกษาและแนะนำตลอดจนตรวจทานแก้ไข
ขอ้ บกพร่องต่าง ๆ ด้วยความเอาใจใส่เปน็ อยา่ งยง่ิ จึงขอขอบพระคณุ เปน็ อย่างสงู ไว้ ณ ท่ี นี้

ขอขอบพระคุณแพทย์ผู้เชี่ยวชาญจากคลินิกเวชกรรมเฉพาะทางจิตเวชเด็กและวัยรุ่นสถิติ
ด้านสุขภาพจิตเด็กและวัยรุ่น โรงพยาบาลสงขลานครินทร์ที่ได้เปิดโอกาสในการสัมภาษณ์เกี่ยวกับ
ประเด็นปัญหาสภาพจิตใจของเยาวชนที่ได้รับผลกระทบจากเหตุการณ์ต่าง ๆ จากการการรับรู้และ
แสดงความคิดเห็นบนสื่อสังคมออนไลน์ และขอขอบพระคุณอาจารย์มัลลิกา เกลี้ยงเคล้า ที่ได้กรุณา
ให้ความรู้และช่วยเหลือในส่วนการแสดงผลของระบบประเมินและวิเคราะห์แนวโน้มสภาพอารมณ์
ของผู้ใช้สื่อสังคมออนไลน์แบบอัตโนมัติด้วย Firebase ให้สำเร็จไปด้วยดีตามวัตถุประสงค์ของ
โครงงาน และขอขอบคุณอาจารย์ประจำหลักสูตรนวัตกรรมสารสนเทศทางการแพทย์ และ
คณะกรรมการการสอบโครงงานที่ได้ให้คำแนะนำเกี่ยวกับโครงงาน ตลอดจนเพื่อนๆที่ให้กำลังใจ
สนับสนนุ เปน็ อยา่ งดีมาโดยตลอด ขอบคณุ มา ณ โอกาสน้ี

สุดท้ายนี้ผูพ้ ัฒนาหวังว่าระบบประเมินและวิเคราะหแ์ นวโน้มสภาพอารมณ์ของผู้ใช้ส่ือสังคม
ออนไลน์แบบอตั โนมัตจิ ะเป็นประโยชน์ให้กบั ทางแพทย์ผเู้ ช่ยี วชาญทางดา้ นสุขภาพจิตหรือกรมพัฒนา
สงั คมและมนษุ ย์ ตลอดจนหน่วยงานทเี่ กี่ยวขอ้ ง หรือเปน็ ประโยชนใ์ ห้กบั ผู้ที่สนใจศกึ ษาและถ้าหากว่า
โครงงานเล่มนี้ มขี อ้ ผดิ พลาดประการใดก็ขออภยั ไว้ ณ ที่ น้ี

นริ วรรณ อสุ ่าหก์ าร
ดารารตั น์ ขันงง่ั



สารบัญ

หน้า

บทคดั ย่อ.........................................................................................................................................(ก)

Abstract......................................................................................................................................... (ข)

กติ ติกรรมประกาศ ..........................................................................................................................(ค)

สารบัญ.............................................................................................................................................(ง)

สารบัญตาราง.................................................................................................................................. (ซ)

สารบญั ภาพ ................................................................................................................................... (ญ)

บทที่ 1 .............................................................................................................................................. 1
บทนำ................................................................................................................................................ 1

1.1 ความสำคญั และทม่ี าของปญั หา ............................................................................................ 1
.1.2 วัตถปุ ระสงค์ ......................................................................................................................... 1
1.3 ขอบเขตงาน.......................................................................................................................... 2
1.4 ประโยชนท์ คี่ าดว่าจะไดร้ ับ.................................................................................................... 2
1.5 ผลที่คาดวา่ จะไดร้ ับ .............................................................................................................. 2
1.6 แผนการปฏิบัติงาน ............................................................................................................... 3
1.7 เครือ่ งมือท่ีใช้ ........................................................................................................................ 5
บทท่ี 2 .............................................................................................................................................. 6
ทฤษฎีและเทคโนโลยที ่ีเก่ยี วข้อง........................................................................................................ 6
2.1 ทฤษฎที ่ีเกี่ยวข้อง.................................................................................................................. 6

2.1.1 สอื่ สังคมออนไลน์และสุขภาพจติ (Social Media and Mental Health) .................... 6
2.1.2 ทวิตเตอร์ (Twitter) ..................................................................................................... 8



สารบญั (ตอ่ )

หน้า

2.2.1 ไพธอน (Python)......................................................................................................... 9

2.2.2 Twitter API (Application Programming Interface)............................................... 9

2.2.3 การประมวลผลภาษาธรรมชาติ (Natural language processing [NLP])................... 9

2.2.4 การรู้จำอารมณ์ (Emotion Recognition) ................................................................. 13

2.2.5 การเรยี นรขู้ องเครื่อง (Machine Learning [ML])...................................................... 13

2.2.6 เทคโนโลยีการตดั คำสำหรับภาษาไทย ........................................................................ 15

2.2.7 Scikit-Learn.............................................................................................................. 14

2.2.8 การแสดงผล (User Interface) .................................................................................. 14

2.3 การทบทวนวรรณกรรมท่ีเกย่ี วขอ้ ง...................................................................................... 18

บทท่ี 3 ............................................................................................................................................ 22

การวิเคราะห์ข้อมลู .......................................................................................................................... 22

3.1 การทำความเข้าใจปัญหา (Business Understanding)...................................................... 22

3.2 การทำความเข้าใจข้อมลู (Data Understanding).............................................................. 22

3.3 การเตรยี มข้อมูล (Data Preparation) ............................................................................... 24

3.3.1 การกำหนดขอบเขตของคำ (Data Determining)...................................................... 24

3.3.2 การตดั คำตามขอบเขตและการลบคำขยะหรือคำทไ่ี มส่ ือ่ ความหมาย (Tokenization
and Noise Removal)........................................................................................................... 26

3.3.3 การคำนวณค่าความถแ่ี ละน้ำหนักของคำ (TF-IDF Based Vectorization) ............... 29

3.4 การวเิ คราะห์ความต้องการของผู้ใช้..................................................................................... 31

3.4.1 ความตอ้ งการดา้ นการระบุสภาพอารมณบ์ นส่ือสังออนไลน์......................................... 31

บทท่ี 4 ............................................................................................................................................ 34

วธิ กี ารดำเนินโครงการ..................................................................................................................... 34



สารบัญ (ตอ่ )

หน้า

4.1 สถาปตั ยกรรมซอฟต์แวร์ของระบบ..................................................................................... 34

4.1.1 กระบวนการสอนใหเ้ ครื่องเรยี นรู้งานเพ่ือแกป้ ัญหา (Training Process).................... 35

4.1.2 กระบวนการทดสอบประสทิ ธิภาพการทำงานของเคร่ือง (Testing Process) ............. 36

4.2 การดึงข้อความจากฐานข้อมลู ทวติ เตอร์ (Tweet Streaming)............................................ 37

4.3 การกำหนดผลเฉลยให้กบั ข้อความทวตี (Tweet Labelling) .............................................. 41

4.4 กระบวนเตรยี มข้อมลู (Data Preprocessing).................................................................... 41

4.5 การเรยี นรแู้ ละการทำนายของเครื่อง (Machine Learning and Prediction)..................... 42

4.6 การออกแบบส่วนแสดงผล (Output Design)..................................................................... 44

บทที่ 5 ............................................................................................................................................ 46

การพัฒนาโมเดลและโปรแกรมประยกุ ต์.......................................................................................... 46

5.1 การพฒั นาโมเดล................................................................................................................. 46

5.1.1 การสร้างโมเดล (Modeling) ...................................................................................... 46

5.1.2 การประเมนิ โมเดล (Evaluation) ............................................................................... 46

5.1.3 การนำโมเดลไปใชง้ าน (Deployment)...................................................................... 53

5.2 การพัฒนาโปรแกรมประยุกต์.............................................................................................. 53

5.2.1 โครงสร้างของไฟลโ์ ปรแกรม ....................................................................................... 53

5.2.2 โครงสรา้ งของไฟลข์ อ้ มูล............................................................................................. 55

บทที่ 6 ............................................................................................................................................ 56

สรุปผลการดำเนินงาน..................................................................................................................... 56

6.1 สรปุ ผลการดำเนนิ งาน......................................................................................................... 56

6.2 ปัญหาในการดําเนนิ งาน...................................................................................................... 56



สารบญั (ตอ่ )

หนา้

6.3 ข้อเสนอแนะ....................................................................................................................... 57

บรรณานุกรม...................................................................................................................................(ฏ)

ภาคผนวก .......................................................................................................................................(ฑ)

ภาคผนวก ก...............................................................................................................................(ฒ)

ตารางแสดงค่าพารามเิ ตอร์ของโมเดล .................................................................................... (ฒ)

ประวัตผิ ู้จดั ทำ.................................................................................................................................(ถ)



สารบัญตาราง

หน้า

ตารางท1่ี . 1 แผนการปฏบิ ัตงิ าน ....................................................................................................... 3
ตารางท1ี่ . 2 แผนการปฏิบัตงิ าน (ต่อ)............................................................................................... 4
ตารางท2ี่ . 1 โมเดลท่ีใชใ้ นการเรยี นร้แู ละจดจำสภาพอารมณ์.......................................................... 15
ตารางท2่ี . 2 การทบทวนวรรณกรรมท่ีเกย่ี วข้อง.............................................................................. 18
ตารางท2ี่ . 3 การทบทวนวรรณกรรมที่เก่ยี วข้อง (ต่อ) ..................................................................... 18
ตารางท2่ี . 4 การทบทวนวรรณกรรมทเี่ กีย่ วข้อง (ต่อ) ..................................................................... 20

ตารางท3ี่ 1ตวั อย่างการกำหนดขอบเขตของคำตามกลมุ่ อารมณ์ ..................................................... 24
ตารางท3่ี 2 เทคนิคการตัดคำ.......................................................................................................... 27
ตารางท3่ี .3 ตัวอยา่ งข้อมลู ท่ีใช้ในการหาค่าความถี่และน้ำหนัก ....................................................... 29
ตารางท3ี่ . 4 การคำนวณหาค่าความถ่แี ละน้ำหนักของคำ ............................................................... 23

ตารางท4่ี . 1 ตวั อยา่ งการพยากรณอ์ ารมณ์จากข้อความ.................................................................. 37
ตารางท4ี่ . 2 การระบตุ ัวตนผ่านรหัสเพอื่ เข้าถึงข้อมูลด้วยสถานะ Twitter Developer Team ...... 38
ตารางท4่ี . 3 ตัวอย่างรายการข้อมูล................................................................................................. 40

ตารางท5ี่ . 1 ตารางเปรียบเทียบประสิทธภิ าพของโมเดลในแตล่ ะอารมณจ์ ากชดุ ข้อมลู จำนวน 2,000
ทวีต................................................................................................................................................. 47
ตารางท5่ี . 2 ตารางเปรียบเทียบประสทิ ธภิ าพของโมเดลในแตล่ ะอารมณ์จากชุดข้อมูลจำนวน 2,000
ทวีต (ตอ่ ) ........................................................................................................................................ 47
ตารางท5ี่ . 3 ตารางเปรียบเทียบประสทิ ธภิ าพของโมเดลในเเตล่ ะอารมณจ์ ากชุดข้อมลู ท่ีผ่านเทคนิค
วธิ ีการของ Over-sampling............................................................................................................ 49
ตารางท5ี่ . 4 ตารางเปรียบเทียบประสทิ ธภิ าพของโมเดลในเเตล่ ะอารมณจ์ ากชุดขอ้ มูลที่ผ่านเทคนคิ
วิธกี ารของ Over-sampling (ต่อ) ................................................................................................... 49
ตารางท5่ี . 5 ตารางเปรียบเทียบประสิทธภิ าพของโมเดลในเเตล่ ะอารมณจ์ ากชดุ ขอ้ มูลทีเ่ กบ็ เพิ่มเตมิ
........................................................................................................................................................ 52



สารบญั ตาราง (ต่อ)

หน้า

ตารางท5่ี . 6 ตารางเปรยี บเทียบประสิทธิภาพของโมเดลในเเต่ละอารมณ์จากชดุ ข้อมูลที่เก็บเพ่ิมเตมิ
(ต่อ)................................................................................................................................................. 52



สารบัญภาพ

หน้า

ภาพท3่ี . 1 สัดส่วนอารมณจ์ ากการรวบรวมข้อความทวตี ................................................................ 23
ภาพท4ี่ . 1สถาปตั ยกรรมระบบประเมนิ และวเิ คราะห์แนวโน้มสภาพอารมณ์ของผ้ใู ช้สือ่ สังคมออนไลน์
แบบอตั โนมัติ................................................................................................................................... 34
ภาพท4ี่ . 2 ขนั้ ตอนการดึงข้อความจากฐานข้อมลู ทวติ เตอร์............................................................. 38
ภาพท4ี่ . 3 การเรียนรู้และการทำนายของเคร่ือง ............................................................................. 42
ภาพท4่ี . 4 การแสดงผลแนวโน้มสภาพอารมณ์................................................................................ 44
ภาพท5ี่ . 1การเปรยี บเทียบ f1 score ของโมเดลในแตล่ ะอารมณ์ ................................................... 52
ภาพท5่ี . 2 ตัวอยา่ ง Domain ท่ีได้มีการ Deploy Hosting ............................................................ 53
ภาพท5่ี . 3 โครงสรา้ งของข้อมูลที่มีการจัดเกบ็ เป็น Real time Database ..................................... 55

บทที่ 1

บทนำ

1.1 ความสำคัญและท่มี าของปญั หา
เครือข่ายสงั คมออนไลนท์ ีผ่ คู้ นใช้ในปัจจบุ นั ไดร้ บั การพฒั นาในชว่ งต้นปี 2000 และในปัจจุบนั

นี้มีผู้ใช้งานเว็บไซตเ์ หล่านี้มากกว่า 3 พันล้านคน ซึ่งผู้ใช้งานเวบ็ ไซต์เหลา่ นีม้ าจากจากหลายประเทศ
หลากหลายกลุ่มอายุ รวมไปถึงมีความหลากหลายทางอาชีพ แน่นอนว่าวัตถุประสงค์จากการใช้งาน
ยอ่ มมีความแตกตา่ งกัน ไมว่ ่าจะเปน็ การใช้ในการตดิ ต่อสื่อสาร ใช้เพ่อื ความบนั เทงิ และการหาความรู้
หรือเหตุผลที่เกี่ยวข้องกับวิชาชีพนั้น แม้ว่าการใช้โซเชียลมีเดียจะใช้เพื่ออำนวยความสะดวกในเรื่อง
ต่าง ๆ แต่การใชโ้ ซเชยี ลมเี ดยี มากเกนิ ไปอาจเกิดผลเสยี ต่อสุขภาพจิตของผู้ใช้

ในปัจจุบันนี้อินเตอร์เน็ตหรือโซเชียลมีเดียเข้ามามีบทบาทในชีวิตประจำวันของผู้คนมาก
ยิ่งขึ้น การเผยแพร่ข้อมูลหรือการรับรู้ข่าวสาร จากสื่อออนไลน์เป็นไปด้วยความสะดวกสบายและ
รวดเร็ว ทกุ คนมโี ซเชียลมีเดยี (Social Media) อยู่ในมือทำให้เกดิ Social Movement ในหลากหลาย
ด้าน ที่เห็นได้ชัดเจนที่สุดคือ แฮชแท็กต่าง ๆ ใน Twitter จากข่าวสารของบ้านเมืองในตอนนี้ ทำให้
เกิดหัวข้อหรือประเด็นต่าง ๆ ในโลกออนไลน์ เกิดเป็นกระเเส ผู้คนออกมาแสดงความคิดเห็นที่จะ
ช่วยกันขับเคล่ือนสังคมเกีย่ วกบั ประเด็นต่าง ๆ แต่ในขณะเดียวกันเองนั้นก็มีอีกด้านหนึ่งที่สะท้อนให้
เห็นถึงการใช้อินเตอร์เน็ตเพื่อสร้างความเกลียดชังและความรุนแรงที่เกิดจากความคิดเห็นที่แตกต่าง
กัน การโต้ตอบกันด้วยความรุนแรง อาจจะนำไปสู่การเสพตดิ โซเชยี ลและสง่ ผลเสยี ต่อสุขภาพจิตของ
ผใู้ ชง้ านได้

จากที่กล่าวมาข้างต้นทำให้เกิดความสนใจในการนำข้อมูลมาวิเคราะห์โดยใช้ข้อมูลทาง
Twitter มาเป็นกรณีศึกษาเนื่องจากเป็นแพลตฟอร์มที่ได้รับความนิยมมากที่สุดสำหรับงานวิเคราะห์
อารมณ์โดยจะรวบรวมข้อมูลผ่านระบบเพื่อที่จะสร้างตัวจำแนกอารมณ์ในการกำหนดระดับอารมณ์
ของบคุ คลทีใ่ ช้งานได้

.1.2 วตั ถปุ ระสงค์
1.2.1 เพ่อื สกัดสารสนเทศที่เกย่ี วขอ้ งกบั สภาพอารมณ์จากข้อมูลบน Twitter

1.2.2 เพื่อพัฒนาตัวแบบการวิเคราะห์สารสนเทศและหาแนวโน้มสภาพอารมณ์ของผู้ใช้
Twitter

2

1.2.3 เพื่อพฒั นาโปรแกรมประยกุ ตส์ ำหรบั แสดงผลการวเิ คราะหใ์ หก้ ับผใู้ ช้งาน
1.3 ขอบเขตงาน

1.3.1 ดึงข้อมูลจาก Twitter ที่ไม่ซ้ำกันอย่างน้อย 4000 ทวีตสำหรับข้อมูลสอนเครือ่ ง ใช้
ทดสอบเครอ่ื ง

1.3.2 วิเคราะหแ์ นวโนม้ สภาพอารมณ์ : ความสขุ ความเศร้า ความกลัว ความโกรธ
1.3.3 แสดงผลแนวโน้มสภาพอารมณ์เฉลยี่ ในรอบ 1 วัน ในรูปแบบ Dashboards
1.4 ประโยชนท์ ค่ี าดว่าจะได้รบั
1.4.1 ได้ระบบอัตโนมัติเพื่อแสดงแนวโน้มของสภาพอารมณ์เพื่อสนับสนุนการทำงานของ

ผู้เชี่ยวชาญด้านสุขภาพจิต กรมสุขภาพจิต และนักวิเคราะห์กระแสสังคม กรม
พัฒนาสงั คมและความมน่ั คงของมนุษย์
1.4.2 ผลการวิเคราะห์ในรปู แบบ Dashboards ทีผ่ ้ใู ช้งานสามารถเข้าใจได้
1.5 ผลที่คาดวา่ จะได้รับ
1.5.1 ไดต้ ัวแบบการวิเคราะห์อารมณ์ของผูใ้ ช้ Twitter แบบอัตโนมตั ิ
1.5.2 ได้ Web Application เพ่อื แสดงผลแนวโน้มในรปู แบบ Dashboards

1.6 แผนการปฏิบตั ิงาน
ตารางท่ี1. 1 แผนการปฏิบัติงาน

กิจกรรม มิ.ย. ก.ค. ส.ค. ก

12341234123412

1.Planning

1.1 ศึกษาปัญหาที่เกิดจากการใช้

สือ่ สังคมออนไลน์ (Twitter)

1.2 ศึกษาบทความที่เกี่ยวข้อง

เพื่อหาแนวทางและขั้นตอนการ

แกป้ ัญหา

1.3 กำหนดที่มาและความสำคัญ

และวตั ถปุ ระสงค์ของโครงการ

1.4 กำหนดประโยชน์ที่คาดว่าจะ

ไดร้ บั

1.5 กำหนดขอบเขตของโครงการ

ให้เหมาะสม

2. Data Streaming

3

ระยะเวลาการดำเนินงาน 2564 - 2565

ก.ย. ต.ค. พ.ย. ธ.ค. ม.ค. ก.พ. ม.ี ค

234123412341234123412341 234

ตารางที่1. 2 แผนการปฏิบัติงาน (ตอ่ )

กจิ กรรม ม.ิ ย. ก.ค. ส.ค. ก

12341234123412

3. Data Preprocessing

4. Topic Detection

5. Ranking

6. Application

7. การนำระบบไปใช้

8. สรุปผลจากงานวิจัยและ

จดั ทำเอกสาร

4

ระยะเวลาการดำเนนิ งาน 2564 - 2565

ก.ย. ต.ค. พ.ย. ธ.ค. ม.ค. ก.พ. ม.ี ค

2 3 4 1 2 3 4 1 2 3 4 1 2 3 4 1 2 3 41 2 3 4 1 2 3 4

5

1.7 เคร่ืองมอื ท่ใี ช้
1.7.1 Python: เปน็ ภาษาในการพฒั นาโปรแกรม
1.7.2 Twitter API based Tweepy: เป็นโปรแกรมประยุกต์ที่สามารถให้นักพัฒนา
โปรแกรมเข้าถึงฐานขอ้ มลู ของ Twitter
1.7.3 Natural Language Toolkit: เป็นโปรแกรมประยุกต์สำหรับการจัดการกับข้อมูลท่ี
อยู่ในรปู แบบของภาษาธรรมชาติ เช่น ขอ้ มลู ทอ่ี ยู่ใน Twitter
1.7.4 SciKit-Learn: เป็นแพลตฟอร์มสำหรับการสร้างตัวแบบจากการเรียนรู้ของเครื่องที่
จะถูกนำไปใชร้ ะบบรจู้ ำความรแู้ บบอัตโนมตั ิ เช่น การรจู้ ำอารมณ์

บทท่ี 2

ทฤษฎีและเทคโนโลยีท่เี กยี่ วข้อง

บทท่ี 2 จะกลา่ วทฤษฎีและเทคโนโลยีทเี่ กีย่ วข้องกับโครงการ โดยมรี ายละเอยี ดดังตอ่ ไปน้ี

2.1 ทฤษฎที ี่เกย่ี วข้อง
ทฤษฎีและหลักการสำคัญที่จะนำไปสู่การพัฒนาระบบประเมินและวิเคราะห์แนวโน้มสภาพ

อารมณ์ของผู้ใช้สื่อสังคมออนไลน์แบบอัตโนมัติ ต้องพิจารณา 2 ประเด็นที่สำคัญคือ 1) สื่อสังคม
ออนไลนแ์ ละสุขภาพจิต (Social Media and Mental Health) และ 2) ทวิตเตอร์ (Twitter)

2.1.1 สือ่ สงั คมออนไลน์และสขุ ภาพจิต (Social Media and Mental Health)
โซเชียลมีเดีย (Social Media) หรือ สื่อสังคมออนไลน์ เป็นเทคโนโลยีทางคอมพิวเตอร์ท่ี

อำนวยความสะดวกในการแบ่งปันความคิด และข้อมูลผ่านการสร้างเครือข่ายและชุมชนเสมือนจริง
โซเชียลมีเดียจะใช้อินเทอร์เน็ตช่วยใหผ้ ู้ใช้สื่อสารเนื้อหาทางอิเล็กทรอนิกส์ได้อย่างรวดเร็ว ผู้คนส่วน
ใหญพ่ ึ่งพาแพลตฟอรม์ โซเชยี ลมเี ดยี เชน่ Facebook Twitter Snapchat YouTube และ Instagram
เพื่อค้นหาและเชือ่ มต่อซึง่ กันและกัน อย่างไรก็ตามหากใช้เวลามากเกินไปกับโซเชียลมีเดียอาจจะเกดิ
ความรู้สึกเศร้า ความไม่พอใจ ความคับข้องใจ หรือความเหงาที่จะส่งผลกระทบต่อการใช้ชีวิต
(Lawrence Robinson and Melinda Smith, 2021)

Twitter เป็นโซเชียลมีเดียที่ได้เข้ามามีอิทธิพลด้านการสื่อสาร แลกเปลี่ยนข้อมูล และเปิด
กว้างเรื่องการแสดงความคิดเห็นเป็นอย่างมาก เห็นได้จากการแสดงความเห็นผ่านแพลตฟอร์ม
Twitter ของผู้คนจะสามารถสื่อถึงอารมณ์ (Emotion) หรือความคิด (Thought) เกิดขึ้นมากมาย ที่
เกี่ยวข้องปรากฏการณ์ใดปรากฏการณ์หนึ่งที่ทำให้มีอิทธิพลส่งผลต่อความรู้สึกที่มีความสุข ความ
โกรธ ความเศร้า ความความสขุ เปน็ ต้น

ผู้ใช้งานโซเซยี ลมเี ดยี มหี ลากหลายอารมณข์ ้ึนอยกู่ บั แต่ละสถานการณ์ และอารมณ์ ความร้สู กึ
หรือความคิดต่าง ๆ จากโลกเสมือนในโซเซียลมีเดียกลับมีอิทธิพลกับในการใช้ชีวิตบนโลกของความ
เป็นจริง นักจิตวิทยาได้จำแนกความแตกต่างของอารมณ์เหล่านั้นออกมาผ่านทฤษฎีและหลักการต่าง
ๆ เพ่ืออธิบายอารมณ์ของมนุษย์ โดยจัดแนวโน้มสภาพอารมณ์ออกเป็น 6 ประเภทดังนี้ (Cherry,
2021)

1. ความสุข (Happiness)
ความสุขท่ีเปน็ อารมณ์ที่ผู้คนปรารถนาและอยากครอบครอง ความสขุ สามารถแสดงออก

ได้หลากหลายรูปแบบ เช่น ความพึงพอใจ การหวั เราะ ปลาบปลมื้ รวมไปถงึ ความสมหวัง

7

จากสิ่งต่าง ๆ ทั้งต่อตนเองและคนรอบข้าง ความสุขเป็นสิ่งทำให้การดำเนินชีวิตนำไปสู่
การมีสขุ ภาพจิตท่ดี ี ทำใหก้ ารพัฒนาตนเองการมีสมั พนั ธภาพท่ีดกี ับคนรอบขา้ งและสังคม

2. ความโกรธ (Anger)
ความโกรธเป็นการตอบสนองของผู้คนต่อสงิ่ เรา้ ท่ีเกิดขึน้ จากความไม่พอใจ ความโกรธจะ

มีคุณสมบัติที่ตรงข้ามกับความสุข ความโกรธจะเป็นจุดเริ่มต้นที่จะนำไปสู่ความเครียดไป
จนถึงมีความทุกข์ซึ่งจะนำไปการแสดงออกในลักษณะของความรุนแรง ความโกรธจะส่ง
ผลร้ายต่อผู้คนทั้งต่อตนเองและคนรอบข้าง การปล่อยปละละเลยให้ความโกรธเกิดขึ้นจะ
นำไปสู่การสร้างความเสียหายตอ่ สงั คมในระยะยาว

3. ความเศรา้ (Sadness)
ความเศรา้ เป็นสภาวะอารมณช์ ่วั คราวท่ีมลี กั ษณะของความผิดหวัง ความโศกเศร้า ความ

ส้ินหวัง และความแปรปรวนทางอารมณ์ ความเศร้าคือสิ่งท่ีทุกคนสามารถพบเจอได้เป็นคร้ัง
คราว ในบางกรณีผู้คนอาจได้สัมผัสกับช่วงเวลาแห่งความเศร้าที่ยืดเยื้อและรุนแรง ซึ่ง
สามารถเปลี่ยนไปเป็นภาวะซึมเศร้าได้ อาจจะทำให้การใช้ชีวิตประจำวันไม่มีความสุขอีก
ต่อไป

4. ความความสขุ (Happiness )
ความรู้สึกความสุขเป็นอารมณ์อันเกิดจากการกระทบกับสิ่งที่ไม่พึงปรารถนา ซ่ึง

ความรู้สึกความสุขนี้สามารถเกิดขึ้นได้จากหลายสิ่งหลายอย่างที่ไม่พึงประสงค์ สายตา หรือ
กลิ่น ความรู้สึกความสขุ สามาราถพฒั นาเป็นปฏิกริ ิยาท่อี าจจะเป็นอนั ตรายต่อการใชช้ ีวิต

5. ความประหลาดใจ (Surprise)
ความประหลาดใจเป็นอารมณ์ที่ก่อให้เกิดการเปลี่ยนแปลงของสิ่งเร้าในระบบประสาท

อย่างฉับพลัน มคี วามนกึ คดิ ท่อี าจอยู่ในรปู แบบของความต่ืนเต้น ตืน่ ตระหนกตกใจ ซึ่งเป็นไป
ไดท้ ้ังด้านบวกและดา้ นลบ

6. ความกลวั (Fear)
ความกลัวคือการตอบสนองทางอารมณ์ต่อการคุกคามในทนั ทีหรือภัยคุกคามที่คาดว่าจะ

เกดิ ขนึ้ โดยทว่ั ไปแล้วความกลวั จะนำไปสวู่ ่าเปน็ ความกังวล

จากการศึกษาข้อมูลที่เกี่ยวข้องสภาพอารมณ์ที่กล่าวมาข้างต้น ทั้ง 6 อารมณ์ที่มีการแสดง
ออกมาในรูปแบบที่แตกต่างกันเป็นพื้นฐานความคิดของมนุษย์ การแสดงออกของอารมณ์ที่ผู้คนรู้สึก
นึกคดิ สามารถแสดงอารมณผ์ ่านการสือ่ สารทง้ั ในโลกของความเปน็ จรงิ และโลกเสมอื นผา่ นตวั อักษรที่

8

เป็นข้อความต่าง ๆ ซึ่งการวิเคราะห์อารมณ์ผ่านข้อความจึงมีความสำคัญที่จะนำไปสู่การทำความ
เข้าใจผู้คนในสงั คมทก่ี ำลังตอบสนองตอ่ สถานการณืใดสถานการณ์หนงึ่

2.1.2 ทวติ เตอร์ (Twitter)
Twitter เป็นแพลตฟอร์มสังคมออนไลน์ที่เน้นความเร็วในการส่งข้อความเข้าสู่สังคมเสมือน

โลกความจริง ผู้ใช้ Twitter สามารถติดตามความเคลื่อนไหวในประเด็นที่สนใจได้ เป็นไมโครบล็อก
สำหรับการสื่อสารแบบเรียลไทม์โดยผู้ใช้จะเห็นข้อความในทันทีและรองรับการเข้าถึงข้อมูลของผู้คน
และองค์กรหลายล้านคน ผู้ใช้ Twitter ติดต่อกันโดยการโพสต์อัปเดตที่เรียกว่า "ทวีต" ไปยังเว็บไซต์
เพื่อแบ่งปันแลกเปลี่ยนและค้นหาข้อมูล ประเด็นสำคัญที่ส่งผลให้ Twitter ได้รับความนิยมคือ มี
ความรวดเร็วในการติดต่อสื่อสาร เปน็ สอื่ สังคมเสมือนจริง ง่ายตอ่ การแลกเปลี่ยนความรู้ เผยแพร่ข่าว
ข้อเท็จจริง Twitter เป็นแพลตฟอร์มที่อนุญาตการแลกเปลี่ยนความรู้โดยเน้นสารสนเทศ ณ เวลาใด
เวลาหนึ่งที่ผู้คนสารมารถนำไปใช้เพื่อรับรู้และใช้ในการตัดสินใจต่อไป นอกจากนี้ Twitter ยังเป็น
ช่องทางให้ผู้คนเข้าถึงสื่อสารมวลชนได้โดยตรง เมื่อเทียบกับสังคมในรูปแบบเดิมที่ผู้คนต้องรอข้อมูล
ข่าวสารทางเดียว เช่น รับข่าวโทรทัศน์ ที่อาจจะไม่ได้รับรู้ได้ทันที ในขณะที่ Twitter สามารถ
แก้ปัญหาดังกล่าวได้ที่อนุญาตให้ผู้ข่าวสารมารถติดตามข่าวสารเหล่านั้นได้ทุกที่ทุกเวลา (Webwise,
2021)

สำหรับความรวดเร็วของ Twitter ในการติดต่อสื่อสาร เช่น อัปเดตเทรนด์ล่าสุดผ่านการ
ติดตามแฮชแท็กยอดนิยม คนไทยนิยมใช้ในการติดตามเรื่องราวข่าวสารและบทสนทนาสาธารณะใน
ประเด็นด้านกระแสสังคม ไม่ว่าจะเป็นเรื่องเกี่ยวกับละคร วงการบันเทิง ดารา หรือเหตุการณ์ต่าง ๆ
ผา่ น แฮชแทก็ ยอดนยิ ม เช่น อะไรกต็ ามท่เี กิดขึ้น จะเกิดข้นึ บน Twitter #WhatsHappenig

Twitter ยังเป็นแพลตฟอร์มที่อิงตามความสนใจของผู้ใช้ หรือเป็นสื่อสังคมเสมือนจริง โดย
ผใู้ ช้งาน Twitter สามารถมีสว่ นรว่ มในบทสนทนาในหัวข้อต่าง ๆ ได้ผา่ นการใช้แฮชแทก็ ทจี่ ะเช่ือมโยง
ผ้คู นทสี่ นใจและใหค้ วามสำคญั ในประเด็นเดยี วกนั (POSITIONING, 2021)

2.2 เทคโนโลยที เี่ กี่ยวข้อง
เทคโนโลยีทีส่ ำคญั ที่นำไปสู่การพฒั นาระบบประเมินและวเิ คราะห์แนวโนม้ สภาพอารมณ์ของ

ผู้ใช้สื่อสังคมออนไลน์แบบอัตโนมัติต้องพิจารณา 8 ประเด็นสำคัญคือ 1) ไพธอน (Python) 2)
Twitter API (Application Programming Interface) 3) การประมวลผลภาษาธรรมชาติ (Natural
language processing [NLP]) 4) การรู้จำอารมณ์ (Emotion Recognition) 5) การเรียนรู้ของ
เครื่อง (Machine Learning [ML]) 6) เทคโนโลยีการตัดคำสำหรับภาษาไทย 7) Scikit-Learn และ
8) การแสดงผล (User Interface)

9

2.2.1 ไพธอน (Python)
Python เป็นหนึ่งในภาษาเชิงโครงสร้างที่ง่ายต่อการทำความเข้าใจ สามารถสื่อสารเชิงวัตถุ

(object-oriented) ทีส่ อ่ื ความหมายและง่ายตอ่ การปรบั เปลยี่ น แกไ้ ข และนำกลบั มาใช้ใหม่ Python
ไดร้ บั ความนยิ มย่างกว้างขวางในการพฒั นาโปรแกรมเพื่องานต่าง ๆ เนือ่ งจากเป็นภาษาท่ีมีไวยกรณ์ที่
เรยี บง่าย กระชบั งา่ ยต่อการทดสอบและบำรุงรักษาชุดคำสัง่ ตา่ ง ๆ

Python มไี ลบรารร่ี องรับทค่ี รอบคลุมการทำงานทหี่ ลากหลายเพ่ือนำไปประยุกต์ใช้แก้ปัญหา
ต่าง ๆ เช่น มีไลบรารี่สำหรับการประมวลผลภาษาธรรมชาติ (Natural Language Processing
[NLP]) ในรูปแบบต่าง ๆ นอกจากนี้ยังมีไลบรารี่สำหรับให้ระบบคอมพิวเตอร์สามารถเรียนรู้ได้ด้วย
ตนเอง (Machine Learning [ML]) โดย NLP และ ML มีบทบาทสำคัญในการพัฒนาเทคโนโลยีด้าน
ปัญญาประดิษฐ์เพื่อนำไปสู่การสร้างระบบที่ฉลาดและเป็นเครื่องมือที่สนับสนุนการตัดสินใจของ
มนษุ ย์ (Python , 2021)

จากความโดดเด่นดังกล่าว ในการจัดทำโครงการนี้ได้พิจารณาภาษา Python ในการจัดการ
ขอ้ มูลดว้ ยกระบวนการต่าง ๆ เพื่อท่ีจะนำขอ้ มูลไปใช้ในการวเิ คราะห์แนวโน้มสภาพอารมณ์ เนอ่ื งจาก
มีไลบราร่ีท่เี กย่ี วขอ้ งและเหมาะสมในการจัดการกับข้อมลู บน Twitter

2.2.2 Twitter API (Application Programming Interface)
Twitter API (Application Programming Interface) เป็นโปรแกรมประยุกต์ที่ช่วยให้

นักพัฒนาโปรแกรมสามารถเข้าถึงฐานข้อมูลของ Twitter เช่น ข้อความ รูปภาพ ภาพเคลื่อนไหว ไป
จนถึงข้อมูลของผู้ให้ข้อมูล Twitter อนุญาตให้นักพัฒนาดึงข้อมูลอดีตผ่านการสืบค้นคำสำคัญโดย
อาศัย REST API และยังอนุญาตให้นักพัฒนาดึงข้อมูลตามเวลาจริงซึ่งจะเรียกว่าข้อมูลสตรีมมิ่ง ซึ่ง
ข้อมูลสตรีมมิ่งจะไหลเข้าสู่ระบบคอมพิวเตอร์ผ่าน Streaming API เพื่อเชื่อมต่อระหว่าง โปรแกรม
ประยุกต์กับแหล่งข้อมูลสตรีมมิ่ง สำหรับสตรีมมิ่งจำเป็นต้องมีการกำหนดค่าและติดตั้งชุดคำสั่งที่
จำเปน็ โดยข้ันตอนวธิ ีและการตั้งคา่ มีรายละเอยี ดดังนี้ :

Step 1 : ยืนยันสิทธกิ ารเข้าถงึ ข้อมลู

การเข้าถึงข้อมูลต่าง ๆ บน Twitter ไม่สามารถเข้าถึงได้โดยคนทั่วไป การเข้าถึง
ขอ้ มูลเพื่อนำไปวิเคราะห์เชิงธรุ กิจต้องเสยี ค่าใช้จ่าย นอกจากการเข้าถึงเพ่ือศึกษาและวิจัยใน
ฐานะนักพฒั นา ซ่งึ จะตอ้ งระบุตวั ตนั ผา่ นรหัสเฉพาะ (Authentication codes)

Step 2 : เชือ่ มตอ่ กบั (API Connect to the API) และ Data Employment

10

เมื่อตั้งค่าสมบูรณ์แล้วผู้พัฒนาจะต้องกำหนดรูปแบบการเชื่อมต่อผ่าน Protocols
ท่ี Twitter เปน็ ผกู้ ำหนดชุดคำสง่ั เพื่อยนิ ยอมให้ผู้พัฒนาสามารถเข้าถงึ ขอ้ มลู ตามเง่ือนไขที่ได้
ตกลงทั้งในรูปแบบ REST API และ Streaming API เมื่อการยืนยันตัวตนถูกต้องผู้พัฒนา
สามารถดึงชุดข้อมูลซึ่งจะอยู่ในรูปแบบ JSON ที่ผู้พัฒนาต้องดึงส่วนที่เกี่ยวข้องมาวิเคราะห์
เพื่อนำไปสังเคราะห์เป็นองค์ความรู้ในเรื่องใดเรื่องหนึ่งซึ่งจะเป็นสารสนเทศที่ช่วยให้ผู้คน
นำไปประกอบการตดั สินใจไดด้ ยี ิง่ ขึ้น (Developer Platform, 2021)

โครงงานนี้จะใช้ Twitter API ในการเข้าถึงฐานข้อมูล Twitter ที่เกี่ยวข้องกับสภาพอารมณ์
ของผู้ใช้งานที่ได้แสดงความเห็นต่อเหตุการณ์ต่าง ๆ โดยจะใช้ REST API เพื่อดึงข้อมูลที่เกิดขึ้นและ
นำไปให้ความหมาย (Label) ที่จะถูกนำไปใช้ในการฝึกฝนให้ระบบคอมพิวเตอร์สามารถจำแนกและ
แยกแยะสภาพอารมณ์ต่าง ๆ ได้ นอกจากนี้จะใช้ Streaming API สำหรับดึงข้อมูลที่เกิดขึ้นจริงเพื่อ
นำไปประมวลผลผ่านระบบแยกแยะอารมณ์และเพื่อที่นำไปแสดงผลในรูปแบบของ Dashboards
ตอ่ ไป

2.2.3 การประมวลผลภาษาธรรมชาติ (Natural language processing [NLP])
การประมวลผลภาษาธรรมชาติ หรือ Natural language processing (NLP) เป็นวิทยาการ

แขนงหนึ่งในหมวดหมู่ของเทคโนโลยีปัญญาประดิษฐ์ หรือ Artificial Intelligence ซึ่งช่วยให้
คอมพิวเตอร์สามารถเข้าใจภาษาของมนุษย์ ตลอดจนตีความและใช้งานภาษาปกติที่มนุษย์ใช้สื่อสาร
ได้ โดยเทคโนโลยี NLP นี้ มีรากฐานจากวิทยาการหลากหลายสาขาด้วยกนั โดยเฉพาะด้านวิทยาการ
คอมพิวเตอร์ (Computer Science) และภาษาศาสตร์เชิงคำนวณ (Computational Linguistics)
เพ่อื วัตถุประสงคใ์ นการปิดชอ่ งวา่ งทางการสอ่ื สารระหวา่ งมนุษยแ์ ละระบบคอมพิวเตอร์

กระบวนการของการประมวลผล NLP นั้นจะเริ่มจากการรับข้อมูลเข้า (Input) ที่เป็น
ข้อความภาษาธรรมชาติ จากนั้นระบบจะประมวลผล (Process) โดยการวิเคราะห์ข้อมูลเข้าไปทั้งใน
เชงิ โครงสรา้ งและความหมายทางภาษาโดยอาศยั การทำงานร่วมกับฐานความร้เู พ่ือหาคำตอบ ก่อนจะ
แทนความหมายและสร้างเป็นข้อมูลนำออก (Output) ที่เป็นภาษาธรรมชาติให้ผู้ใช้สามารถอ่านและ
เข้าใจข้อมลู ได้

ความสำคัญของการประมวลผลภาษาธรรมชาติ

NLP เป็นเทคโนโลยที ชี่ ว่ ยให้ระบบคอมพวิ เตอรส์ ามารถวเิ คราะหแ์ ละตีความข้อมูลทอ่ี ยู่ในรูป
ของภาษาธรรมชาติ เชน่ ชดุ ข้อความ NLP จะสนับสนนุ ให้ระบบคอมพิวเตอร์สามารถเขา้ ใจการ

11

สื่อสารของมนุษย์ได้และสามารถตอบสนองต่อความต้องการสื่อสารได้อย่างเป็นเหตุและผล
และดำเนนิ การทำงานต่าง ๆ ทเ่ี กยี่ วขอ้ งกับภาษาได้

ยกตัวอย่างเช่น NLP ช่วยให้ระบบคอมพิวเตอร์สามารถอ่านอักขระภาษาธรรมชาติ หรือทำ
ความเข้าใจและตีความคำพูดของมนุษย์ ไปจนถึงการแยกแยะและจำแนกอารมณ์และ ความรู้สึกที่
แฝงอยู่ในการสื่อสารเหล่านั้น NLP สามารถประมวลผลข้อมูลได้แบบอัตโนมัติซ่ึงมักจะถูกนำไปใช้ใน
การวิเคราะห์ข้อมูลที่มีขนาดมหาศาลและเกินความสามารถของมนุษย์ โดยเฉพาะอย่างยิ่งชุดข้อมูล
บน Twitter ท่ผี ใู้ ชง้ านมหาศาล นอกจากน้ขี ้อมลู ตา่ ง ๆ จะถูกส่ือสารในรูปแบบของภาษาธรรมชาติซ่ึง
จะมงุ่ เน้นใหม้ นษุ ย์ดว้ ยกันสามารถเข้าใจและตีความได้

NLP จึงมีบทบาทสำคัญในโครงการนี้เนื่องจากการวิเคราะห์อารมณ์ของผู้ใช้ Twitter ที่มี
ข้อมูลในปริมาณมหาศาลและการสื่อสารอย่างรวดเร็ว จึงทำให้การประยุกต์ใช้ NLP นั้นมีความท้า
ทาย

การตัดคำ (Tokenization)

คุณลักษณะที่สำคัญของข้อมูลบน Twitter คือการสื่อสารผ่านข้อความโดยเฉพาะอย่างยิ่ง
สำหรับภาษาที่ไม่มีขอบเขตระหว่างคำอย่างภาษาไทยซึ่งเป็นภาษาที่รูปประโยคจะเป็นการเรียงตัว
ของตัวอักษรที่เรียงกันเป็นสายอักขระ ที่ไม่มีตัวชี้วดั ชดั เจนในการกำหนดคำ ดังนั้นข้อมูลเหล่านี้ตอ้ ง
ผ่านการประมวลผลท่เี รียกว่าการตัดคำ

การตัดคำ หมายถึง การแบ่งชุดตัวอักษรจากสายอักขระที่เรียงต่อกัน (String) และหา
ขอบเขตของแต่ละหนว่ ยคำ (Morpheme) การตัดคำสำหรับภาษาไทยจะประมวลผลด้วยเทคนิคต่าง
ๆ เชน่ การตัดคำโดยใช้พจนานุกรม (Dictionary Based Approach) และการตัดคำโดยใช้คลังข้อมูล
(Corpus Based Approach) เครื่องมอื การตัดคำจะทำหน้าท่ีในการแบ่งสายอักษร (String) ออกเป็น
คำโดยเฉพาะอย่างยิ่งชื่อเฉพาะหรือชื่อที่ไม่รู้จัก เพื่อให้ข้อมูลเหล่านั้นสามารถนำไปประมวลผลได้
อย่างมีประสิทธภิ าพ

การใชช้ ่องวา่ งระหวา่ งคำ (White Space Tokenization)

เป็นหลักการพื้นฐานทีน่ ยิ มใช้ตามคุณลักษณะของภาษาโดยเฉพาะภาษาอังกฤษตัวอย่างเช่น
“I have a major in IMI” สามารถแบ่งคำตามช่องว่างได้ “| I | | have | | a | | major | in | | IMI
|” อย่างไรก็ตามคุณลักษณะของภาษาไทยไม่มีช่องว่างระหว่างกันแต่มีคุณลักาณะเป็นอักขระเรียง
ตอ่ เน่ืองซ่ึงไม่มีสามารถตัดคำไดด้ ว้ ยวิธีดังกลา่ ว เช่น ขอ้ มลู ทวตี “กุอายมากที่เกิดเป็นคนไทย นอกจาก
จะมนี ายกโงแ่ ล้ว ยงั มคี นทไ่ี มม่ ีจิตสำนกึ เรื่องลขิ สิทธ์ิอกี ”สามารถตัดคำได้เป็น “กุ | อายมาก | ท่ี | เกดิ

12

เป็น| คนไทย นอกจาก | จะ | มี | นายกโง่ | แล้ว ยังมี | คน | ที่ | ไม่มีจิตสำนึก | เรื่อง |
ลขิ สิทธ์ิ | อกี ” ซง่ึ ตอ้ งการวธิ กี ารที่เหมาะสมกับคุณลักษณะดงั กลา่ วได้

หลกั การประมวลผลเพื่อตดั คำภาษาไทยสามารถแบ่งไดห้ ลายรปู แบบโดยในแต่ละรูปแบบจะ
มีรายละเอียดดังน้ี

1) หลักการตดั คำโดยใชพ้ จนานุกรม (Dictionary Based Approach)

วิธีการนี้จะเลือกคำที่ยาวที่สุดโดยเริ่มจากตัวอักษรซ้ายสุดของข้อความนั้นไปยัง ตัวอักษร
ถัดไป จนกว่าจะพบว่าเป็นคำที่มีอยู่ในพจนานุกรม จากนั้นค้นหาคำถัดไปจนกว่าจะครบข้อความ ใน
กรณที พ่ี บวา่ เปน็ คำในพจนานุกรมจากจดุ เร่ิมต้นเดียวกัน จะเลือกคำทยี่ าวท่ีสุด

1.1 วธิ กี ารตดั คำแบบยาวทสี่ ุด (Longest Matching)

วิธีการนี้จะเลือกคำที่ยาวที่สุดโดยเริ่มจากตัวอักษรซ้ายสุดของข้อความนั้นไปยัง
ตัวอักษรถัดไป จนกว่าจะพบว่าเป็นคำที่มีอยู่ในพจนานุกรม จากนั้นค้นหาคำถัดไปจนกว่าจะ
ครบข้อความ ในกรณีที่พบว่าเป็นคำในพจนานุกรมจากจุดเริ่มต้นเดียวกัน จะเลือกคำที่ยาว
ทีส่ ุด

1.2 วธิ กี ารตัดคำแบบสอดคลอ้ งมากท่สี ดุ (Maximal Matching)

วิธีการนี้จะเป็นวิธีการตัดคำโดยใช้วิธีการตัดคำที่สามารถจะเป็นไปได้ทั้งหมดและ
เลือกข้อความท่แี บง่ คำแลว้ มจี ำนวนคำน้อยทีส่ ดุ

2. หลักการตดั คำโดยใช้การเรียนรขู้ องเครื่องจักร (Machine Learning-Based Approach)
หลักการตัดคำโดยใช้คลังข้อมูลเป็นการตัดคำโดยใช้วิธกี ารจดจำรูปแบบของภาษาธรรมชาติ

โดยการประมวลผลจะใช้คลังข้อมูลทางภาษา (Corpus) ที่เป็นฐานความรู้เพื่อใช้ในการฝึกฝน ทั้งนี้
เพื่อแก้ปัญหาคำที่ไม่ปรากฏในพจนานุกรม เช่น ชื่อเฉพาะ คำที่ยืมมาจากภาษาต่างประเทศ และ
ความคลุมเครือในการแบ่งขอบเขตของคำได้อย่างถูกต้อง การตัดคำโดยใช้การเรียนรู้ของเครื่องจักร
แบง่ ไดเ้ ปน็ 2 แนวทาง ไดแ้ ก่

2.1 การตดั คำโดยอาศยั ความนา่ จะเป็น (Probabilistic Word Segmentation)
วิธีการนี้จะนำเอาค่าทางสถิติการเกิดของคำและลำดับของหน้าที่ของคำ( Part-of-

Speech) เข้ามาช่วยในการคำนวณหาความน่าจะเป็น เพื่อที่จะใช้เลือกแบบที่มีโอกาสเกิด
มากทส่ี ุด

13

2.2 การตัดคำโดยอาศัยคณุ ลักษณะของคำ (Feature Based Word Segment)

วิธีการนี้จะพิจารณาจากบริบท (Context) และการเกิดร่วมกันของคำ หรือหน้าที่
ของคำ (Collocation) เขา้ มาชว่ ยในการตดั วิธีการตดั คำโดยใชค้ ลงั ข้อมลู น้ีจำเป็นที่จะต้องมี
ฐานข้อมูลเป็นจำนวนมาก และจะต้องมีการเรยี นรูก้ ารสร้างคำในบรบิ ท หรือการเกิดร่วมกัน
ของคำแตล่ ะคำ เพอื่ ใหม้ ีข้อมูลทน่ี ำมาใช้ในการตดั คำ

จากการศึกษารูปแบบการตัดคำ โครงการนี้จะเลือกวิธีการตัดคำที่ใช้หลักการตัดคำโดยใช้
พจนานกุ รม โดยจะเลอื กใชว้ ิธกี ารตัดคำแบบยาวที่สุด (Longest Matching) เนอ่ื งจากหลักการตัดคำ
โดยใช้พจนานุกรมเป็นวิธีที่สามารถกำหนดกลุ่มคำในขอบเขตที่เกี่ยวข้องได้โดยการกำหนดลงใน
พจนานกุ รม ซ่งึ ความถูกต้องของการตดั คำจะขน้ึ อยูก่ ปั ริมาณของคำศัพทบ์ รรจุลงในพจนานุกรม

2.2.4 การรจู้ ำอารมณ์ (Emotion Recognition)
การรู้จำอารมณ์ หมายถึง การกำหนดและระบุประเภทของนิพจน์ผ่านการสื่อสารในรูปแบบ

ข้อความบนTwitterอาจจะประกอบ นิพจน์เป็นประเภทสื่ออารมณ์ ความสุข ความเศร้า ความโกรธ
หรือความความสุข ความกลัว ความประหลาดใจ การรู้จำประเภทนิพจน์เป็นพื้นฐานสำคัญสำหรับ
งานวิจัยในด้านปัญญาประดิษฐ์หรือการสร้างความฉลาดให้คอมพิวเตอร์ เพราะถ้าหากการระบุ
ประเภทของนิพจน์มีความถูกต้องจะส่งผลให้การประมวลผลในขั้นตอนต่าง ๆ มีประสิทธิภาพมาก
ยิ่งข้ึน เชน่ จากตัวอย่างในข้างต้น กลุ่มนิพจน์ “กุอายมากทเ่ี กิดเปน็ คนไทย นอกจากจะมีนายกโง่แล้ว
ยังมคี นท่ีไม่มีจิตสำนึกเร่ืองลิขสทิ ธ์ิอีก” ถา้ ระบบสามารถรู้จำไดว้ า่ นิพจน์ “อายมาก” “นายกโง่” และ
“ไม่มีจิตสำนึก”เป็นประเภทคำด้านลบประเภทไม่พอใจ แล้วระบบจะสามารถให้คำอธิบายเชิง
ความหมายกบั นพิ จน์ดังกล่าววา่ กำลงั บง่ ช้ีถึงอารมณ์ โกรธ ได้ถูกตอ้ ง

2.2.5 การเรยี นรขู้ องเคร่ือง (Machine Learning [ML])
ML เปน็ กระบวนการที่เคร่ืองเรยี นรูจ้ ากประสบการณ์หรือเรียนรู้จากข้อมลู (Data Training)

โดยมีจุดมุ่งหมายให้เครื่องได้เรียนรู้จากข้อมูลและผลเฉลย (Labels) เพื่อแก้ปัญหางานใดงานหนึ่ง
โดยตัวเครื่องสามารถที่จะพัฒนาการเรียนรู้ได้ดียิ่งขึ้นจากการใช้ข้อมูลที่ถูกป้อนให้ เรียนรู้ซ้ำไปซ้ำมา
ดังนั้น ML ที่ใช้สำหรับวิเคราะห์อารมณ์จึงเป็นการเรียนรู้ขั้นตอนวิธีจดจำรูปแบบของอารมณ์แต่ละ
ประเภท (Task) โดยที่เครื่องสามารถเรียนรู้จากอารมณ์ต่าง ๆ ที่เป็นเหตุการณ์ในอดีตซึ่งนับเป็น
บทเรียน (Experience) เพื่อนำไปสู่การทำนายอารมณ์ต่าง ๆ ที่จะเกิดขึ้นในอนาคตได้อย่างถูกต้อง
และแม่นยำยงิ่ ข้ึน (Improvement)นี้ (Garg, 2021)

ระบบประเมนิ และวเิ คราะหแ์ นวโนม้ สภาพอารมณ์ของผู้ใชส้ อ่ื สังคมออนไลน์แบบอัตโนมัติอ
อาศัยการเรียนรแู้ บบมีผู้สอน (Supervised Learning) โดยจะถกู แบง่ ออกเปน็ 3 แบบกลุ่ม

14

กลุ่ม Geometry เป็นการวิเคราะห์คุณลักษณะอารมณ์ผ่านการหาระยะหา่ งของแต่ละคลาส
โดยเครื่องจะเลือกจับกลุ่มกับคลาสที่ อยู่ใกล้ที่สุด ยกตัวอย่างอัลกอริทึม เช่น Artificial Neural
Network (ANN), k-Nearest Neighbors (k-NN) และ Support Vector Machine (SVM)

กล่มุ Probability เป็นการวเิ คราะหค์ ณุ ลักษณะอารมณผ์ ่านการหาความน่าจะเป็นของคลาส
แต่ละคลาส ซึ่งจะมีการคำนวณโดยใช้การแจกแจงความน่าจะเป็นแบบมีเงื่อนไข P (Y | X) โดยที่
เครื่องจะแบ่งประเภทให้กับคลาสที่มีค่าความน่าจะเป็นมากที่สุด ยกตัวอย่างอัลกอริทึมเช่น Naive
Bays

กลุ่ม Logical Expression เป็นการวเิ คราะหค์ ณุ ลักษณะอารมณผ์ ่านการใชก้ ฎเชงิ ตรรกะ (If-
Part Expression) ซึ่งจะมีการใช้ฟังก์ชันค่าBoolean (If X then-part Y) เพื่อที่จะให้เครื่องสามารถ
แบ่งประเภทคลาสผ่านตรรกะที่แตกต่างกัน ยกตัวอย่างอัลกอริทึม เช่น Decision Tree และ
Random Forest

ดังนั้นทางผู้พัฒนาระบบประเมินและวิเคราะห์แนวโน้มสภาพอารมณ์ของผู้ใช้สื่อสัง คม
ออนไลน์แบบอัตโนมัติ มีความต้องการที่จะทดลองใช้อัลกอริทึมในทุก ๆ กลุ่ม ดังที่ได้ระบุไปด้านบน
เพื่อที่จะให้ทราบได้ว่าข้อมูลทวิตเตอร์ที่มีการดึงมาเหมาะกับอัลกอริทึมใดและจัดอยู่กลุม่ ใดที่สามรถ
ทำนายอารมณ์ที่เกิดขึ้น โดยใช้อัลกอริทึมแบบใดถึงจะมีประสิทธิภาพที่ดีที่สุดจะถูกนำไปใช้ในระบบ
ดังกล่าว อัลกอริทึมหรือโมเดลที่ใช้ในการเรียนรู้และจดจำสภาพอารมณ์จากกลุ่มต่าง ๆ แสดงดัง
ตารางที่ 2.1

15

ตารางที่2. 1 โมเดลท่ีใช้ในการเรียนรแู้ ละจดจำสภาพอารมณ์

ลำดบั โมเดล (Model)
1 K-Nearest Neighbors
2 Decision Tree
3 Naïve Bayes
4 Support Vector Classifier (SVC)
5 Support Vector Machine (SVM)
6 Random Forest
7 Stochastic Gradient Descent (SGD)

2.2.6 เทคโนโลยีการตัดคำสำหรบั ภาษาไทย
การสื่อสารผ่านข้อความเป็นภาษาธรรมชาติของมนุษย์ประเภทหนึ่งท่ีใช้ในชีวิตประจำวันทัง้

โดยข้อความในรูปแบบของภาษาไทยมักจะเรียงเป็นรูปประโยคความยาวแบบไม่มีขอบเขตแบ่งคำ
ชัดเจน แตกต่างจากภาษาอังกฤษที่จะใสช่องว่างระหว่างคำ เมื่อมนุษย์อ่านแล้วจะเข้าใจความหมาย
แต่คอมพิวเตอร์ไม่สามารถเข้าใจได้ ดังนั้นจำเป็นต้องมีการนำข้อความเหล่านั้นเข้าสู่กระบวนการ
ประมวลผลภาษาธรรมชาติ ในโครงงานน้ีจะอาศยั Thai Natural Language Processing in Python
(PyThaiNLP) เป็นโปรแกรมประยุกต์สำหรับจัดการกับข้อมูลที่อยู่ในรูปแบบของภาษาธรรมชาติของ
มนุษย์

PyThaiNLP เป็นแพลตฟอร์มมาตรฐานด้านการประมวลผลภาษาธรรมชาติบนพื้นฐานการ
เขียนชดุ คำสั่งผ่านภาษา Python PyThaiNLP สารมารถเรียกใช้งานง่ายผ่านการเรียกใช้วิธีการต่าง ๆ
เช่น การตัดคำ การลบคำขยะ และการกำหนดประเภทของคำ (คำนาม คำกิริยา หรือคำวิเศษ เป็น
ตน้ ) โดยฐานขอ้ มูลคำศัพท์มาตรฐาน เชน่ กลมุ่ คำศัพท์ WordNet ทร่ี องรับการประมวลผลคำพ้องรูป
พ้องเสียง หรือลำดับชั้นของคำ (เช่นลำดับ การแสดงออก ร้องไห้ บ่งชี้พฤติกรรม เศร้าใจ ซึ่งเป็นส่วน
หนึ่งของ อารมณ์) เป็นต้น การเรียกใช้เครื่องมือการตัดคำผ่าน PyThaiNLP สามารถรองรับเทคนิค
ต่าง ๆ ทั้ง หลักการตัดคำโดยใช้พจนานุกรมและหลักการตัดคำโดยใช้การเรียนรู้ของเครื่องจักร ทั้งน้ี
ความหลากหลายดังกล่าวจะช่วยในการประมวลผลภาษาธรรมชาติของมนุษย์เพื่อให้อยู่ในรูปแบบที่
คอมพวิ เตอรส์ ามารถท่ีจะเขา้ ใจได้ เช่น ขอ้ ความบน Twitter

16

โดยโครงงานนี้จะมีแพลตฟอร์ม PyThaiNLP ซึ่งมีบทบาทสำคัญในการจัดรูปแบบของ
ขอ้ ความและการเตรียมขอ้ ความเพื่อท่จี ะเข้าสู่กระบวนการเรยี นรขู้ องเครื่อง (Machine Learning)

2.2.7 Scikit-Learn
Scikit-Learn เป็นไลบรารีแบบไม่มีค่าใช้จ่าย โดยนักพัฒนาสามารถเรียนใช้ขั้นตอนวิธีและ

การประมวลผลต่าง ๆ ได้เต็มรูปแบบผ่านชุดคำสั่งภาษา Python ในลักษณะการโปรแกรมเชิงวัตถุ
Scikit-Learn ถูกพัฒนาเต็มรูปแบบเพื่อรองรับการใช้งานด้าน ML โดยจุดเด่นคือสามารถนำไปใช้ใน
การแบ่งประเภทข้อมลู (Data Classification) การแบง่ กลุ่มข้อมลู (Cluster Analysis) การวิเคราะห์
การถดถอย (Regression)

Scikit-Learn ถูกออกแบบสามารถใช้ร่วมกับไลบรารีระเบียบวิธีเชิงตัวเลข (Numerical
Method: NumPy) ไลบรารีระเบียบวิธีการคำนวนเชิงวิทยาศาสตร์ (Scientific Computing Tools
for Python: SciPy) ของ Python โดยเฉพาะนักวเิ คราะห์ข้อมูลจะอาศยั Scikit-Learn เป็นเครือ่ งมือ
ในการประมวลผลเนื่องจากการใช้งานที่เรียบง่ายแต่มีประสิทธิภาพสูง สามารถเข้าถึงได้ง่ายไม่มี
เงื่อนไข รองรับการปรบั เปลย่ี นและใชง้ านซำ้ ได้ (ActiveState, 2021)

สำหรับการจัดทำโครงการนี้มีการประยุกต์ใช้การเรียนรู้ของเคร่ืองผ่าน Scikit-Learn เพ่ือ
เป็นเทคโนโลยีในการกำหนดชุดคำสั่งให้เครื่องเรียนรู้และจดจำรูปแบบอารมณ์ต่าง ๆ ผู้ใช้สื่อสังคม
ออนไลน์บน Twitter สื่อสารในรูปแบบข้อความ โดยผลลัพธ์ที่ได้จาก Scikit-Learn คือตัวแบบท่ี
สามารถรจู้ ำอารมณ์ซ่งึ สามารถนำไปรู้จำอารมณ์ของข้อความทจ่ี ะเกิดขน้ึ ในอนาคต

2.2.8 การแสดงผล (User Interface)
สำหรับการพัฒนาหรือออกแบบโปรแกรม นอกเหนอื จากส่วนท่เี ป็นการนำเข้าข้อมูลผู้พัฒนา

ได้ออกแบบตวั แบบในการนำเข้าข้อมูลนน้ั เพื่อใชใ้ นการในการจดั การกบั ตวั ระบบเพ่ือให้ไดผ้ ลลพั ธ์ตาม
วัตถุประสงค์และอีกส่วนที่มีความสำคัญมากเช่นเดียวกันคือ ส่วนที่ใช้ในการเชื่อมต่อกับผู้ใช้งาน
(User Interface) เป็นส่วนที่ให้ผู้ใช้งานสามารถโต้ตอบกับการใช้งานของระบบได้ ซึ่งจะมุ่งเน้นไปท่ี
เรอ่ื งของหนา้ ตา การออกแบบ และการดีไซน์ ยกตวั อย่างเชน่ หนา้ จอ แพลตฟอรม์ เมนู ฟอรม์ ต่าง ๆ
การวางภาพ ขนาดตวั อักษร เป็นต้น (ธนศรีพนิชชยั , 2021)

ผู้พัฒนาต้องให้ความสำคัญกับส่วนที่ใช้เชื่อมต่อกับผู้ใช้งานเพื่อที่จะให้ตัวระบบกับผู้ใช้งาน
สามารถทจี่ ะประสานหรอื ติดตอ่ กบั ระบบงานได้อยา่ งมปี ระสทิ ธิภาพ สำหรบั การออกแบบในส่วนนี้แต่
ละรูปแบบงานน้นั ผพู้ ฒั นาจะมกี ารออกแบบหรือจดั การกบั ส่วนทเี่ ป็น User Interface จะมีการ

17

ออกแบบและจัดวางการแสดงผลท่ีแตกต่างกัน ซึ่งในการจัดทำโครงการระบบประเมินและวิเคราะห์
แนวโน้มสภาพอารมณ์ของผู้ใช้สื่อสังคมออนไลน์แบบอัตโนมัติ ได้จัดทำเป็น Web Application เพ่ือ
แสดงผลแนวโน้มในรูปแบบ Dashboards ที่ได้จากการวิเคราะสภาพอารมณ์ของผู้ใช้สื่อสังคม
ออนไลนบ์ น Twitter

การพัฒนาระบบในส่วนการแสดงผลของระบบจะใช้ภาษาโปรแกรมคอมพิวเตอร์ 3 ภาษา
เป็นตัวช่วยในการสร้างเว็บไซต์ ประกอบด้วย 1) Hyper Text Markup Language (HTML) 2)
Cascading Style Sheets ( CSS ) 3) JavaScript (JS ) ทั้งสามภาษาเป็นภาษาที่ใช้กันอย่าง
แพร่หลาย ในปจั จบุ นั นี้ คนส่วนใหญ่กำลังเรยี นรทู้ ้งั สามภาษา ซึง่ เป็นความรู้ท่ีทำใหเ้ ว็บไซต์เติบโตขึ้น
ทกุ วัน และนำไปสู่การแขง่ ขนั ท่เี พ่มิ ขนึ้ จงึ เปน็ เหตผุ ลท่ที ำให้ผพู้ ฒั นาเลือกใช้

1.Hyper Text Markup Language (HTML) เป็นภาษาที่ใช้ในการแสดงผลในลักษณะของ
ข้อความ รูปภาพ รวมไปถึงเสียง วิดีโอและภาพเคลื่อนไหวต่าง ๆ ภาษา HTML เป็นภาษาที่ง่ายต่อ
การเรยี นรู้ สามารถกำหนดรปู แบบและโครงสร้างไดง้ ่าย ทำให้ ไดร้ บั ความนยิ ม และมีการพัฒนาอย่าง
ต่อเนื่องเพื่อให้ใช้งานง่ายขึ้น และตอบสนองต่องานด้านกราฟิก มากยิ่งขึ้น (วิชาการพัฒนาเว็บไซต์
ทางธรุ กิจเบอ้ื งต้น BC10203, 2022)

2.Cascading Style Sheets (CSS) ภาษาสไตลช์ ีตทีมรี ปู แบบการเขียน Syntax ท่ีเฉพาะ ใช้
เพื่อจัดรูปแบบเช่นสี พื้นหลัง สไตล์ แบบอักษร ฯลฯ เพื่อให้เว็บไซต์มีความน่าสนใจ ซึ่งผู้พัฒนา
สามารถที่จะแก้ไข ปรับปรุง หรือควบคุมการนำเสนอในส่วนข้อมลู ตา่ ง ๆของเว็บไซต์ผ่านตวั CSS ได้
สะดวกและรวดเรว็ CSS นี้จะถกู กำหนดมาตรฐาน โดย W3C (World Wide Web Consortium) ใน
การกำหนดค่าต่าง ๆ ของเอกสาร HTML หรือ XHTML ที่ถูกสร้างขึ้นมา (WYNNSOFT SOLUTION
CO,LTD., 2022)

3.JavaScript (JS) เป็นภาษาโปรแกรมที่ได้รับความนิยมมากที่สุดในโลก ง่ายต่อการเรียนรู้
ได้ถกู ออกแบบมาเพอื่ ใชเ้ ป็นส่วนเพมิ่ ขยายในภาษา HTML โดยเฉพาะ ช่วยให้สามารถควบคมุ เว็บเพจ
ได้อย่างง่ายดาย ซึ่ง JavaScript สามารถติดต่อกับส่วนต่าง ๆ ที่ผู้พัฒนาได้กำหนดกับหน้าเว็บไซต์
และ JavaScript สามารถนำมาใช้แสดงหรือกำหนดคุณสมบัติของเว็บไซต์ที่ผู้พัฒนาได้ออกแบบไว้
(จันทีนอก, 2000)

2.3 การทบทวนวรรณกรรมทเ่ี ก่ียวขอ้ ง
การทบทวนวรรณกรรมทเ่ี กย่ี วข้องจะมุ่งเนน้ ศกึ ษางานงานวิจัยทวี่ เิ คร

ต่าง ๆ โดยการวิเคราะห์ดังกล่าวจะอาศัยการประมวลผลแบบอัตโนมัติ กา
เก่ียวข้องซ่ึงจะพิจารณาเบ้ืองต้นผ่านช่ือบทความ 2) รูปแบบขอ้ มูลที่ใช้ในการ
วเิ คราะหอ์ ารมณ์ และ 5) ความถูกตอ้ งแม่นยำในการวเิ คราะหอ์ ารมณ์ตา่ ง ๆ

ตารางท่ี2. 2 การทบทวนวรรณกรรมที่เกี่ยวข้อง

Title Datatype E

(Problem Solving) Neutral
(Concern
Twitter trends: A ranking twitter
4 หมวดหม
algorithm analysis on real ความสขุ
ความเศร้า
time data ( Hikmat Ullah ความโกรธ
ความกล
Khan, 2021) ประหลาดใ

Role of Emotion in twitter

Excessive Use of Twitter

During COVID-19

Imposed Lockdown in

India (Anshika Arora,

2021)

18

ราะห์อารมณ์ของผใู้ ช้งานบนส่ือสังคมออนไลน์ผา่ นการแสดงความเห็นต่อสถานการณ์
ารทบทวนวรรณกรรมนี้จะพิจารณาประเด็นหลัก ๆ ซึ่งจะประกอบด้วย 1) ปัญหาที่
รวิเคราะห์ 3) กลุ่มอารมณ์ท่ีสามารถวิเคราะห์ได้ 4) วิธีการหรือขั้นตอนวิธีที่ใช้ในการ
ซง่ึ สามารถอธิบายได้ดังตารางท่ี 2.1

Emotions Method Accuracy/P value
N/A
(Analysis)

Emotion ranking algorithms

ning on Fact)

มู่อารมณ์: 1 . Algorithm K- mean ความแมน่ ยำ 95%

clustering

2. Statistically significant

ธหรือความความสุข analysis ( IBM SPSS

ล ั ว ห ร ื อ ค ว า ม Statistics 26.0 โปรแกรม

ใจ วเิ คราะหท์ างสถิต)ิ

ตารางท่ี2. 3 การทบทวนวรรณกรรมที่เกี่ยวข้อง (ต่อ)

Title Datatype E

(Problem Solving)

Emotion Detection and Social media เช่น Twitter, 6 หมวดหม

Analysis on Social Media Facebook ความสขุ

(Bharat Gaind, 2019) ความเศรา้

ความกลัว

ความโกรธ

ความประห

ความความ

Automatic Detection of Twitter 7หมวดหม

Emotions in Twitter Data ความเศร้า

- A Scalable Decision ความสุขสบ

Tree Classification ความเช่อื ใจ

Method (Jaishree ความความ

Ranganathan, 2018) ความโกรธ

ความกลวั

ความประห

19

Emotions Method Accuracy/P value

มู่อารมณ์: (Analysis)

ธ 1. Natural language SMO ความแมน่ ยำ 91.7%
หลาดใจ
มสุข processing J48 ความแมน่ ยำ 85.4%
มู่อารมณ์
2. Machine Learning
บายใจ
จ classification algorithms
มสุข
ธ 2.1 SMO

หลาดใจ 2.2 J48

Algorithm: ML- based ความแมน่ ยำ 96.45%
Decision Tree

ตารางท่ี2. 4 การทบทวนวรรณกรรมท่ีเก่ยี วข้อง (ต่อ)

Title Datatype E

(Problem Solving) 6 หมวดหม
ความสุข
Twitter Discussions and Twitter ความเศรา้
ความกลัว
Emotions About the ความโกรธ
ความประห
COVID- 19 Pandemic: ความความ

Machine Learning

Approach (Xue J, 2020)

20

Emotions Method Accuracy/P value
มอู่ ารมณ์ :
(Analysis)

หลาดใจ 1. Algorithm Machine ข้อมูล Twitter มีความสำคญั
มสุข
Learning Unsupervised ก ั บ อ า ร ม ณ ์ ข อ ง ผ ู ้ ค น ใ น

2. Algorithm Dirichlet สถานการณ์โรคระบาดโควิด-

Allocation (LDA) 19 (P<0.001)

3. Natural language

processing

4 . Statistically significant

analysis

21

จากตารางที่ 2.2-2.4 จะเห็นได้ว่าวรรณกรรมที่กล่าวมาข้างต้นจะใช้ข้อมูลที่มาจาก Twitter โดย
Twitter เป็นทางเลือกที่ได้รับความนิยมในการใช้ติดต่อสื่อสารหรือติดตามข่าวสาร เนื่องจาก Twitter เอื้อให้
ผู้ใช้งานสามารถใช้งานได้ง่ายและสามารถแสดงออกเชิงอารมณ์และความคิดได้อย่างเสรี ในส่วนข องกลุ่ม
อารมณ์จะพบว่าแต่ละวรรณกรรมจะวเิ คราะห์ถงึ อารมณโ์ ดยตรง เชน่ ความสุข หรือ ความโกรธ หรอื วิเคราะห์
ทางออ้ มทจ่ี ะสอ่ื ความหมายอารมณ์ถงึ ความเปน็ Negative และ Positives สว่ นวธิ ีการทีน่ ิยมมากท่ีสุดกจ็ ะมี 3
แบบด้วยกัน คอื Machine Learning Approaches Rule-based Approachesและ Hybridge Approaches
ความแม่นยำของวธิ กี ารในวรรณกรรมยงั ไม่ระบแุ ต่บางวรรณกรรมระบคุ วามแมน่ ยำของวธิ กี ารแลว้

จากการศึกษาวรรณกรรมที่เกี่ยวข้องทำให้ทราบถึงแนวทางที่นำมาใช้ในการพัฒนาโครงการระบบ
ประเมินและวเิ คราะห์แนวโนม้ สภาพอารมณ์ของผใู้ ช้สื่อสังคมออนไลนแ์ บบอัตโนมตั ิ โดยโครงการน้ีจะใช้ข้อมูล
ที่มาจาก Twitter เพื่อวิเคราะห์แนวโน้มสภาพอารมณ์ของผู้ใช้โซเชียลมีเดีย โดยจะเน้นไปที่การวิเคราะห์
อารมณ์ของคนรุ่นใหม่ ซึ่งคือวัยรุ่นที่มีการแสดงออกเชิงอารมณ์ต่อเหตุการณ์บ้านเมือง และในส่วนของกลุ่ม
อารมณ์ที่สามารถวิเคราะห์ได้ จะแบ่งออกเป็น 6 อารมณ์ด้วยกัน คือ ความสุข ความเศร้า ความกลัว ความ
โกรธ ความประหลาดใจ และความความสขุ วธิ ีการทใ่ี ช้ในการวิเคราะห์อารมณ์ทีเ่ ลือกใช้ คือวิธีการเรียนรู้ของ
เครือ่ ง (Machine Learning) เพอ่ื ใหเ้ ครือ่ งสามารถแกป้ ญั หาการรู้จำอารมณ์ตา่ ง ๆ

บทท่ี 3

การวิเคราะหข์ ้อมลู

การวิเคราะห์ข้อมูลของโครงการระบบระบบประเมินและวิเคราะห์แนวโน้มสภาพอารมณ์ของผู้ใช้สอ่ื
สังคมออนไลน์ ซึ่งมีเป้าหมายเพื่อศึกษาสภาพอารมณ์ของผู้ใช้สื่อสังคมออนไลน์ที่เกิดจากการแสดงความ
คดิ เห็นตอ่ ประเด็นต่าง ๆ บนแพลตฟอร์มทวติ เตอร์ เพือ่ ที่จะนำปญั หาดงั กลา่ วน้ีไปใช้ในการออกแบบและสร้าง
ระบบ เพื่อที่จะให้ระบบที่ออกแแบบและสร้างขึ้นจะเป็นไปตามวัตถุประสงค์ โดยจะมีการวิเคราะห์ข้อมูลของ
ระบบดังกล่าวซึ่งมรี ายละเอียดดังน้ี

3.1 การทำความเข้าใจปญั หา (Business Understanding)
ปจั จบุ นั สื่อสังคมออนไลน์เขา้ มามีบทบาทในชวี ติ ประจำวนั ของผู้คนมากยิ่งขึ้น โดยเฉพาะการรับรู้และ

แสดงความคิดเห็นต่อประเด็นข่าวสารต่าง ๆ ซึ่งจะเห็นว่าทวิตเตอร์หรือเฟสบุคเป็นแพลตฟอร์มที่มีการโพสต์
หรือแสดงความคิดเห็นต่อเหตุการณ์ที่เกิดขึ้นได้อย่างรวดเร็ว โดยจะพบว่าผู้คนมักจะมีการแสดงข้อความ
เพื่อที่จะระบายความรู้สึกของตัวเองผ่านการสื่อสารด้วยความโกรธ ความเศร้า และความวิตกกังวลจาก
เหตุการณ์ทีเ่ กดิ ขึน้ ซึ่งการโพสตด์ งั กลา่ วจะสง่ ผลเสียตอ่ สขุ ภาพจติ ของผู้ใช้สือ่ สงั คมออนไลน์

จากปัญหาดังกลา่ วทำให้แพทยผ์ ้เู ชี่ยวชาญด้านสุขภาพจิต ตอ้ งการที่จะเข้าใจปัญหาของวัยรุ่นท่ีมีการ
แสดงความคิดเห็นบนสื่อสังคมออนไลน์ จากการสัมภาษณ์แพทยผ์ ู้เชีย่ วชาญจากคลินิกเวชกรรมเฉพาะทางจติ
เวชเด็กและวัยรุ่นสถิติด้านสุขภาพจิตเด็กและวัยรุ่น โรงพยาบาลสงขลานครินทร์ พบว่า เจ้าหน้าท่ี ต้องการ
ติดตามเพื่อดูพฤติกรรมอารมณ์ของผู้คนบนสื่อสังคมออนไลน์รวมถึงแนวโน้มสภาพจิตใจของเยาวชนที่ได้รับ
ผลกระทบจากเหตุการณ์ต่าง แต่พบข้อจำกัดเนื่องจากข้อมูลที่มีการแสดงความคิดเห็นนั้นมีการอัพเดตอยู่
ตลอดเวลาและมีจำนวนมหาศาลในขณะที่เจ้าหน้าท่ีทีเ่ ก่ียวข้องมจี ำนวนจำกัด ทำใหผ้ เู้ ช่ยี วชาญด้านสุขภาพจิต
ไม่สามารถทจ่ี ะจดั การกับข้อมูลเหล่าน้ันได้

3.2 การทำความเข้าใจข้อมลู (Data Understanding)
ข้อมูลท่ีมกี ารโพสต์หรือแสดงความคิดเหน็ บนแพลตฟอร์มของทวิตเตอร์เปน็ ข้อมูลที่อยู่ในรูปแบบของ

ภาษาธรรมชาติทม่ี ีความยาวเรียงตอ่ กนั และมกั จะมีความคลุมเครือ คอมพวิ เตอรไ์ มส่ ามารถทจี่ ะประมวลผลได้
ซึ่งจัดอยู่ในรูปแบบของข้อมูลที่ไม่มีโครงสร้าง (Unstructured Data) ข้อมูลประเภทนี้ไม่สามารถระบุ
โครงสร้างที่ชัดเจนได้ ทำให้เกิดความยากในการเข้าใจความหมายของข้อมูล ดังนั้นจึงนำข้อมูลเหล่านี้มาระบุ
ความหมายในเชงิ มิตดิ า้ นอารมณเ์ พือ่ ใหเ้ กิดความชัดเจนในการทำความเขา้ ใจขอ้ มูล เชน่ ข้อความทวตี “โอมคิ

23

รอนไอสสั นรก ไอเปรตมาบา้ นกูทำไมว่ะ” ซึ่งผพู้ ฒั นาไดใ้ หค้ วามหมายของข้อความทวีตดงั กล่าวน้ีว่าผู้
โพสมีความโกรธ ณ ขณะการตอบสนองตอ่ ปรากฏดังกลา่ ว

จากการที่ผู้พัฒนาได้รวบรวมข้อมูลจำนวน 2,000 ความเห็นจากแพลตฟอร์มทวิตเตอร์ (หนึ่งทวีตต่อ
หนึง่ ความเห็น) และได้กำกับความหมายของอารมณ์ต่าง ๆ ทผ่ี ู้โพสไดใ้ ห้ความเห็นจึงพบว่าสัดส่วนอารมณ์ต่าง
ๆ สามารถแสดงได้ดังภาพที่ 3.1

Emotions
anger fear happiness sadness

15% 49%
34%

2%

ภาพท3ี่ . 1 สัดส่วนอารมณ์จากการรวบรวมข้อความทวตี

จากภาพที่ 3.1 เป็นภาพที่แสดงสัดส่วนอารมณ์จากการรวบรวมข้อความทวีต จะเห็นได้ว่าแนวโน้ม
สภาพอารมณ์โกรธมีสัดส่วนเปอร์เซ็นต์ที่มากที่สุด ณ ช่วงเวลาที่ได้ทำการรวบรวมข้อมูล เพราะผู้คนมักจะ
โพสต์หรือแสดงความคิดเห็นด้วยความโกรธและความเกลียดต่อเหตุการณ์ที่ผู้ใช้งานไมพ่ ึงพอใจ ซึ่งรองลงมาก็
จะเป็นสดั ส่วนแนวโน้มสภาพอารมณม์ คี วามสขุ ความเศร้า และความกลัว ตามลำดับ

จากตัวอย่างการกระจายของอารมณใ์ นข้างต้นจะพบว่าอารมณ์โกรธซึ่งเป็นภาพสะท้อนของผู้คนส่วน
ใหญ่นั้นจำเป็นต้องได้รับการดูแลหรือให้คำแนะนำแก้ผู้ใช้สื่อสังคมเพื่อป้องกันผลกระทบต่ อจิตใจ
(Psychological Violence) ทั้งนี้เพื่อเป็นการป้องกันภาวะอันตรายจากอารมณ์โกรธที่เกิดขึ้นยาวนานจน
อาจจะนำไปสู่อุปนิสัยการแสดงออกของพฤติกรรมความรุนแรงและกลายเป็นโรคเรื้อรังซ่ึ งยากต่อการรักษา
(รุ่งสาง, 2563)

สื่อสังคมออนไลน์กลายเป็นเครื่องมือหรือพื้นที่ที่เยาวชนจะแสดงออกความรุนแรงซึ่งข้อมูลอารมณ์
ดังกล่าวนั้นเป็นปัจจัยสำคัญต่อการนำไปใช้เพื่อการจัดการพฤติกรรมก้าวร้าวรุนแรงในวัยรุ่น (Managing
Violence Among Adolescents)

24

3.3 การเตรียมขอ้ มูล (Data Preparation)
เพื่อจัดการกับข้อมูลทีไ่ ม่มีโครงสร้างท่ีอยู่ในรูปแบบของภาษาธรรมชาติ โดยจะผ่านกระบวนการย่อย

ต่าง ๆ เพื่อที่จะให้การประมวลผลข้อมูลมีประสิทธิภาพมากยิ่งขึ้น ซึ่งประกอบด้วย 3 ขั้นตอนดังนี้ 1) การ
กำหนดขอบเขตของคำ (Data Determining) 2) การตัดคำตามขอบเขตและการลบคำขยะหรือคำที่ไม่สื่อ
ความหมาย (Tokenization and Noise Removal) 3) การคำนวณค่าความถี่และน้ำหนักของคำ (TF-IDF-
based Vectorization)

3.3.1 การกำหนดขอบเขตของคำ (Data Determining)
การกำหนดขอบเขตของคำเป็นการอธิบายถึงความเป็นธรรมชาติของภาษาธรรมชาติที่จะ

เปลี่ยนแปลงตามประเด็นปัญหาต่าง ๆ เชน่ ในขอบเขตการจำแนกอารณ์จะต้องมีการกำหนดขอบเขต
เฉพาะตัวอย่างเช่น “โนสนโนแคร์” “ชั้นต่ำ” “ไร้จิตสำนึก” “บุกจับ” “หิวแสง” ไม่สามารถแบ่งคำ
ออกจากกันได้ถึงแม้คำเหล่านี้สามารถแยกออกจากกันและสื่อความหมายที่แตกต่างกัน “หิว” เป็น
กิริยาสะท้อนพฤติกรรมของมนุษย์ที่ต้องการอาหาร ในขณะท่ี “แสง” เป็นเป็นคำนามของพลังงาน
ชนิดหนึ่งที่ช่วยให้สิ่งมีชีวิตมองเห็นวัตถุต่าง ๆ ได้ อย่างไรก็ตามในมิติของอารมณ์ “หิวแสง” กลับมี
ความหมายเชิงความสุขที่ผูแ้ สดงความเห็นสะทอ้ นถึงเหตกุ ารณท์ ่เี กิดขึน้

การกำหนดขอบเขตคำต่าง ๆ ในโครงงานนี้แบ่งตามกลุ่มอารมณ์ 4 อารมณ์ คือ ความกลัว
(Fear) ความเศร้า (Sad) ความสขุ (Happiness) และความโกรธ (Angry) ดังที่แสดงในตารางท่ี 3.1

ตารางท่ี3 1ตัวอยา่ งการกำหนดขอบเขตของคำตามกล่มุ อารมณ์

อารมณ์ (Emotions) คำ (Word)
ความกลวั (Fear : F) F = {“อกตญั ญ”ู , “โปรดอยา่ ท้งิ ”, “ไม่ยตุ ธิ
ความสขุ (Happy : H) H = {“นา่ รกั ”, “ปังมากแม”่ , “สวยงาม”,
ความเศรา้ (Sad : S) S = {“ผิดหวัง”, “เศร้า”, “น้อยใจ”, “ส้นิ ห
ความโกรธ (Angry : A) A = {“สงิ่ ชวั่ รา้ ย”, “ผีเบ๋อ”, “อยา่ โง”่ , “ต

จากตารางที่3.1 เป็นการยกตัวอย่างของกลมุ่ คำท่ีผ่านการกำหนดขอ
การตัดคำ ซึ่งจะสามารถสอนเครือ่ งให้เกดิ การเรียนรแู้ ละจดจำสภาพอารมณต์

25

ธรรม”, “อรี ัฐบาล”, “แย่จงั ”, “ระแวง”, “ร้องไห”้ ,..., “ไมส่ นใจ”}
“ไพเราะ”, “ตา๊ ชมาก”, “ปังมาก”, “สุดยอด”, “ชอบ” ,..., “เพลิน”}
หวงั ”,“อดทน”, “ทกุ ข”์ , “ทรมาน”, “คราบนำ้ ตา”, “ขม่ เหง” ,..., “รงั แก}”
ตำ่ ”, “เลกิ เหยยี ด”, “เลกิ บลู ลี่”, “น่าเกลียด”, “โกงชาต”ิ ,...,”ทุเรศ”}

อบเขตของคำ โดยจะนำคำเหลา่ นี้มาสรา้ งเปน็ พจนานุกรมคำศพั ทเ์ พ่ือใช้ในขัน้ ตอน
ต่าง ๆได้

26

3.3.2 การตัดคำตามขอบเขตและการลบคำขยะหรือคำที่ไม่สื่อความหมาย (Tokenization and
Noise Removal)

ขั้นตอนของการตัดคำจากประโยคข้อความต่าง ๆ จะประมวลผลตามฐานคำศัพท์มาตรฐาน
ซึ่งในโครงงานนี้จะอาศัยฐานข้อมูลร่วมกับ National Electronics and Computer Technology
Center หรือ NECTEC ที่ได้พัฒนาคำศัพท์พื้นฐานข้อมูล Lexitron นอกจากนี้เพื่อให้การตัดคำ
สอดคล้องกับโดเมนการวิเคราะห์อารมณ์ โครงงานนี้จะอิงข้อมูลจากขัน้ ตอนของการกำหนดขอบเขต
ของคำเพื่อให้ได้กลุ่มคำที่สื่อความหมายและสะท้อนอารมณ์ตามเจตนาของผู้ใช้ทวีตให้เป็นธรรมชาติ
เชน่ ขอ้ มลู ทวตี

“เสียภาษีมาเพื่อโดนยิงหรอ การออกมาเรียกร้องประชาธิปไตยทำไมต้องโดนทำร้ายขนาดนี้
ประชาชนเขาไมไ่ ดม้ อี าวุธเลย เทยี บกับพวกตำรวจทหารท่ีมีปนื มีกระบอง มอี าวุธครบมือ บางคนแม่ง
ทำเพื่อความสะใจของตัวเอง พวกกูออกมาเรียกร้องเผลอๆพวกเดนนรกห่านี่แม่งได้ผลประโยชน์ไป
ดว้ ย #ม็อบ14พฤศจกิ า64”

มูลทวีตดงั กล่าว ถูกโพสเม่อื วนั ท่ี 14 เดือน พฤศจกิ ายน พุทธศกั ราช 2564 ในเวลา 12:44:28
น. โดยเจ้าของบัญชีใช้ชื่ออ้างอิง @gwhtr3pieks มีรหัสการทวีตคือ 1459864812687530000 มี
จำนวนผู้ติดตาม 28 คน จำนวนการกดถูกใจทวีต 1 คน เเละมีจำนวนการรีทวีต 3 ครั้ง จึงสามารถ
สรุปได้ว่าข้อความดังกล่าวสะท้อนจากผู้ใช้งานจริงและไม่ได้เป็นข้อมูลจากบอทหรือ หน่วย IO ของ
ภาครฐั

จากตัวอย่างข้อมูลทวีตข้างต้นสามารถนำมาตัดคำตามขอบเขตโดยทดลองใช้เทคนิค
Pythainlp ซึ่งจะมวี ธิ ตี า่ ง ๆ ดังทีป่ รากฏในตารางที่ 3.2

ตารางท่ี3 2 เทคนิคการตัดคำ

ลำดบั เทคนคิ เสยี ภาษี | มา | เพ่อื |
1. Customized Dictionary- based | ทำร้าย | ขนาดนี้ | |
ที่ | มี | ปืน | | มี |กร
longest- Matching based on ตัวเอง | | พวกกู | ออ
Emotional Terminology (CDLMT) ด้วย | | # | มอ็ บ | 14
(Our propose)
| เสียภาษี | มา | เพื่อ
2. Maximal Matching Algorithm and โดน | ทำรา้ ย | ขนาด
Thai Character Cluster ( MMA- ทหาร | ที่ | มี | ปืน | |
TCC) | ของ | ตัวเอง | | พว
ผลประโยชน์ | ไป | ดว้
3. Dictionary- based Longest-
Matching Thai Word | เสียภาษี | มา | เพื่อ
segmentation (DLMT) โดน | ทำร้าย | ขนาด
ทหาร | ท่ี | มี | ปืน | |
ของ | ตัวเอง | | พวก
ประโยชน์ | ไป | ดว้ ย

27

ผลลัพธ์

โดนยงิ | หรอ | | การ | ออก | มา | เรยี กรอ้ ง | ประชาธิปไตย | ทำไม | ต้อง | โดน
ประชาชน | เขา | ไม่ได้ | มี | อาวุธ | เลย | | เทียบ | กับ | พวก |ตำรวจ | ทหาร |
ระบอง | | มี |อาวุธ | ครบมือ | | บางคน | แม่ง | ทำ | เพื่อ |ความสะใจ | ของ |
อกมา | เรียกร้อง | เผลอๆ | พวก | เดนนรก | ห่านี่ | แม่ง |ได้ | ผลประโยชน์ | ไป
4 | พฤศจิกา | 64

อ | โดน | ยิง | หรอ | | การ | ออกมา | เรียกร้อง | ประชาธิปไตย | ทำไม | ต้อง |
| นี้ | | ประชาชน | เขา | ไม่ | ได้ | มี | อาวุธ | เลย | | เทยี บ | กบั | พวก |ตำรวจ |
|มี | กระบอง | | มี | อาวุธ | ครบมือ | | บางคน | แม่ | ง | ทำ | เพือ่ | ความ | สะใจ
วก | กู | ออกมา | เรียกร้อง | เผลอ | ๆ | พวก | เดนนรก | ห่า |น่ี | แม่ | ง | ได้ |
วย | | # | ม็อบ | 14 | พฤศจกิ า | 64 |

อ | โดน | ยิง | หรอ | | การ | ออกมา | เรียกร้อง | ประชาธิปไตย | ทำไม | ต้อง |
ด| นี้ | | ประชาชน |เขา | ไม่ | ได้ | มี | อาวุธ | เลย | | เทียบ | กับ| พวก |ตำรวจ |
|มี | กระบอง | | มี | อาวธุ | ครบมอื | |บางคน | แม่ | ง | ทำ | เพอ่ื |ความ | สะใจ |
ก | กู | ออกมา | เรียกร้อง | เผลอๆ | พวก | เดนนรก | ห่า | นี่ | แม่ | ง | ได้ผล |
| | # | มอ็ บ | 14 | พฤศจกิ า | 64 |

ลำดบั เทคนิค | เสีย | ภาษี | มา | เพ
4. 1D Convolution Neural Network- | โดน | ทำร้าย | ขนาด
| ทหาร | ที่ | มี | ปืน
based Thai Word Tokenization สะใจ | ของ | ตวั | เอง
(CNNTW) ได้ | ผล | ประโยชน์ |

จากตารางที่3.2 จะเป็นการทดลองการตัดคำด้วย 4 เทคนิค 2 กล
MMA-TCC และ 3) DLMT หลักการตัดคำโดยใช้การเรียนรู้ของเครื่องคือ 4
ปญั หาดา้ นอารมณไ์ ด้ ดังน้ันจะพบว่าเทคนิค CDLMT สามารถตดั คำไดถ้ ูกต้อ
ความผิดพลาดมากที่สุดเนื่องจากการฝึกฝนตัวแบบการตัดคำภาษาไทย
ภาษาธรรมชาติ ดังนั้นโครงงานนี้จะอาศัย CDLMT เพื่อใช้ในการตัดคำสำหร
อตั โนมัติ

28

ผลลัพธ์

พือ่ | โดน | ยงิ | หรอ | | การ | ออก | มา | เรียกร้อง | ประชาธิปไตย | ทำไม | ต้อง
ด | น้ี | | ประชาชน | เขา | ไม่ | ได้ | มี | อาวุธ | เลย | | เทยี บ | กบั | พวก | ตำรวจ
| | มี | กระบอง | | มี | อาวุธ | ครบ | มือ | | บาง | คน | แม่ง | ทำ | เพื่อ | ความ |
ง | | พวก | กู | ออก | มา | เรยี กร้อง | เผลอ | ๆ | พวก | เดนนรก | หา่ | น่ี | แม่ง |
ไป | ด้วย | | # | ม็อบ | 14 | พฤศจิกา | 64 |

ลุ่มวิธีการ โดยวิธการแรกคือ หลักการตัดคำโดยใช้พจนานุกรม ได้แก่ 1) CDLMT 2)
4) CNNTW โดย CDLMT เป็นเทคนิคที่ออกแบบมาให้สามารถตัดคำที่สอดคล้องกับ
องตรงตามขอบเขตของโครงงานในขณะที่วธิ ีการอื่น ๆ นอกจากน้ยี งั พบวา่ CNNTW มี
ยจำเป็นต้องอาศัยฐานความรู้มหาศาลเพื่อให้สามารถรองรับความหล ากหลาย
รับระบบประเมินและวิเคราะห์แนวโน้มสภาพอารมณ์ของผู้ใช้สื่อสังคมออนไลน์แบบ

29

และในส่วนของขั้นตอนของการลบคำขยะหรือคำที่ไม่สื่อความหมายเชิงอารมณ์เพื่อที่จะ
นำไปจำแนกตามอารมณ์ที่ผู้พัฒนาได้กำหนดไว้ ในขั้นตอนนี้จะต้องผ่านขั้นตอนการตัดคำตาม
ขอบเขต (Tokenization) ตามที่กล่าวมาข้างต้น ยกตัวอย่างการตัดคำด้วยเทคนิค Customized
Dictionary- based longest- Matching based on Emotional Terminology ( CDLMT) ( Our
propose) “เสียภาษี | มา | เพื่อ | โดนยิง | หรอ | | การ | ออก | มา | เรียกร้อง | ประชาธิปไตย |
ทำไม | ต้อง | โดน | ทำร้าย | ขนาดนี้ | | ประชาชน | เขา | ไม่ได้ | มี | อาวุธ | เลย | | เทียบ | กับ |
พวก |ตำรวจ | ทหาร | ที่ | มี | ปืน | | มี |กระบอง | | มี |อาวธุ | ครบมอื | | บางคน | แม่ง | ทำ | เพื่อ
|ความสะใจ | ของ | ตวั เอง | | พวกกู | ออกมา | เรียกร้อง | เผลอๆ | พวก | เดนนรก | หา่ นี่ | แม่ง |ได้
| ผลประโยชน์ | ไปด้วย | | # | ม็อบ | 14 | พฤศจิกา | 64” เมื่อผ่านการลบคำขยะหรือคำที่ไม่สื่อ
ความหมาย จะได้เป็น โดนยิง |เรียกร้อง | ทำร้าย | อาวุธ | แม่ง |ความสะใจ | เดนนรก | ห่านี่ | เป็น
ตน้

3.3.3 การคำนวณค่าความถแี่ ละนำ้ หนกั ของคำ (TF-IDF Based Vectorization)
ขั้นตอนของการคำนวณหาค่าความถี่และน้ำหนักของคำ (TF-IDF Based Vectorization)
เป็นการเปลี่ยนรูปแบบของข้อความให้อยูใ่ นรูปแบบของตัวเลขเชงิ เวกเตอร์ โดยการหาความถี่ของคำ
จากขอ้ ความท่ีมีการแสดงความคดิ เห็นผ่านทวติ เตอร์ โดยจะได้มาซ่งึ น้ำหนักของคำท่ีส่งผลต่ออารมณ์
เพือ่ ให้ง่ายต่อการนำไปสอนใหเ้ ครื่องเรยี นรแู้ ละจดจำรูปแบบของคำแตล่ ะสภาพอารมณ์ได้

ยกตวั อยา่ งการคำนวณหาคา่ ความถ่ีและนำ้ หนักของคำจากข้อมูลท่ไี ด้รวบรวมจากฐานข้อมูล
ของทวิตเตอร์ ดังตารางต่อไปน้ี

ตารางท่ี3.3 ตวั อย่างข้อมูลทใ่ี ชใ้ นการหาคา่ ความถ่แี ละน้ำหนกั

ข้อความ (tweet_text) อารมณ์ (Emotions)

1) เรา รัก สนับสนุน มธสุ อน ความสุข (Happiness)

2) เรา เกลียด มนั อี มธุสอน ความโกรธ (Anger)

จากตารางที่3.3 จะเป็นข้อมูลที่ผ่านขั้นตอนของการกำหนดผลเฉลยให้กับข้อความทวีต (Tweet

Labelling) การกำหนดขอบเขตของคำ (Data Determining) การตัดคำตามขอบเขตและการลบคำ

ขยะหรือคำทไี่ ม่ส่ือความหมาย (Tokenization and Noise Removal) โดยจะนำข้อมูลทผ่ี ่านขัน้ ตอน

ดังกล่าวมาคำนวณค่าความถี่และน้ำหนักของคำ (TF-IDF-based Vectorization) โดยแสดงการ

คำนวณไดด้ งั ตารางตอ่ ไปน้ี


Click to View FlipBook Version