The words you are searching are inside this book. To get more targeted content, please make full-text search by clicking here.

บทความภาษาศาสตร์

Discover the best professional documents and content resources in AnyFlip Document Base.
Search
Published by พานิดา ชื่นชม, 2023-03-21 04:02:52

บทความภาษาศาสตร์

บทความภาษาศาสตร์

การแปลภาษาไทย-อีสานโดยใช้ฐานกฎ Thai - Isan Machine Translation Using Rule-Based Approach ทัศนวรรณ ศูนย์กลาง , สุนีย์ พงษ์พินิจภิญโญ และวีณาวดี ม่วงอ้น ภาควิชาคอมพิวเตอร์ คณะวิทยาศาสตร์ มหาวิทยาลัย ศิลปากร วิทยาเขตพระราชวังสนามจันทร์ อ.เมือง จ.นครปฐม ภาษาอีสานเป็นภาษาพูดท้องถิ่นที่ใช้มากในภาคอีสาน หรือภาคตะวันออกเฉียงเหนือของ ประเทศไทย ในบางครั้งเป็นการยากที่จะทำความเข้าใจหรือสื่อสารระหว่างคนท้องถิ่นที่พูดภาษาอีสานกับคน อื่น ๆ ที่ไม่ใช่คนท้องถิ่นนั้น งานวิจัยนี้นำเสนอสถาปัตยกรรมของระบบการแปลภาษา 2 ทางระหว่างภาษา อีสานและภาษาไทยที่เป็นภาษาทางการ งานวิจัยนี้จะมีประโยชน์สำหรับบุคคลทั่วไปที่ต้องการเรียนรู้หรือ สื่อสารด้วยภาษาอีสาน ในปัจจุบันโปรแกรมแปลภาษามีการแปลภาษาต่างประเทศหลากหลายภาษาแต่ยังไม่มี โปรแกรมใดที่รองรับการแปลภาษาไทยเป็นภาษาถิ่นต่างๆของไทยเนื่องจากคำศัพท์ในภาษาถิ่นไม่มีใน พจนานุกรมบัญญัติคำศัพท์ไว้การสะกดคำศัพท์คำเดียวกันอาจจะสะกดได้หลายแบบแต่อ่านออกเสียงได้ เหมือนกันหรือใกล้เคียงกันนอกจากนี้ยังมีการผันวรรณยุกต์ที่แตกต่างกันบ้าง งานวิจัยนี้จึงได้ทดลองพัฒนา โปรแกรมแปลภาษาไทยเป็นภาษาไทยอีสานเพื่อเป็นต้นแบบในการพัฒนาโปรแกรมแปลภาษาไทยเป็นภาษา ถิ่นอื่นๆ วัตถุประสงค์ เพื่อทดสอบประสิทธิภาพของระบบการแปลภาษาไทย-ภาษาอีสาน การออกแบบและวิเคราะห์ระบบแปลภาษาไทย-อีสานโดยใช้ฐานกฎ การทำงานโดยรวมของระบบจะเริ่มจากส่วนติดต่อกับผู้ใช้งาน ซึ่งมีหน้าที่รับความต้องการของ ผู้ใช้ ซึ่งก็คือ ประโยคภาษาไทยหรือภาษาอีสานที่จะถูกแปลไปยังภาษาเป้าหมาย และแสดงผลลัพธ์ของระบบ โดยผลลัพธ์จะมี 2 ส่วนคือ ประโยคที่แปลเป็นภาษาเป้าหมาย และคำศัพท์ โดยการสร้างระบบแปลภาษานี้จะ ประกอบไปด้วยส่วนสำคัญคือการสร้างคลัง การวิเคราะห์คำ ค้นหาคำใกล้เคียง การวิเคราะห์ประโยค และการ แปล คลังสำหรับโปรแกรมแปลภาษาไทย-อีสาน ในส่วนคลังประโยคภาษาไทยจะประกอบด้วยประโยคภาษาไทยจำนวน 100 ประโยค และ ตัวอย่างประโยคภาษาอีสานจำนวน 100 ประโยค โดยแต่ละประโยคจะติดหน้าที่ของคำแต่ละคำในประโยค คลังคำศัพท์ภาษาไทยและอีสานที่ใช้ในงานวิจัยนี้สร้างมาจากคำศัพท์ภาษาไทยจำนวน1,895 คำ


และคลังคำศัพท์ภาษาอีสานประกอบด้วยคำศัพท์ภาษาอีสานจำนวน 1,895 คำ คลังคำศัพท์เหล่านี้จะถูก นำไปใช้ในขั้นตอนการหาคำศัพท์ใกล้เคียง คลังคำอ่านภาษาไทย-อีสาน คำอ่านในคลังนี้จะถูกนำไปใช้ใน ขั้นตอนการเปรียบเทียบคำอ่านของคำศัพท์ที่รับเข้า เพื่อวิเคราะห์คำพ้องเสียง ซึ่งแต่ละบรรทัดจะประกอบไป ด้วยคำอ่านภาษาไทยเพียงแค่บรรทัดละ 1 คำ ในกรณีที่คำศัพท์นั้นมีมากกว่า 1 พยางค์ จะมีโครงสร้างในรูปแบบ คำอ่านต่อคำอ่าน (คำอ่าน -คำอ่าน) ใน 1 บรรทัด โครงสร้างการเก็บของพจนานุกรมทั้งภาษาไทยและภาษาอีสานนี้จะประกอบด้วยการ ระบุหน้าที่ของคำและความหมาย พจนานุกรมทั้งสองนี้จะถูกนำไปใช้ในขั้นตอนการหาความหมายของคำศัพท์ ภาษาอีสานแปลไปเป็นภาษาไทย จะมีเก็บคำศัพท์ หน้าที่ของคำ ความหมายของคำศัพท์ 1 คำเท่านั้น การวิเคราะห์คำและออกแบบระบบค้นหาคำใกล้เคียง ในงานวิจัยนี้จึงนำเอาหลักการแปลงคำเป็นคำอ่านมาเพื่อแก้ไขปัญหาการสะกดไม่ตรงกัน ใน กรณีที่ไม่สามารถหาคำพ้องเสียงในคลังคำศัพท์ได้ระบบจะนำคำอ่านไปเข้าหลักการการหาค่าระยะการแก้ไขที่ น้อยที่สุดซึ่งขั้นตอนนี้เป็นการวัดหาค่าความต่างของสายอักขระสองชุดโดยจะเลือกคำที่มีค่าความต่างน้อยที่สุด เป็นผลลัพธ์จากนั้นนำผลลัพธ์ไปติดหน้าที่ของคำ 1. ขั้นตอนวิเคราะห์คำ ในระบบการแปลภาษาไทย-อีสาน เริ่มแรกระบบจะดำเนินการตัดคำจากประโยค ที่รับเข้ามา โดยประโยคภาษาไทยจะตัดคำโดยใช้โปรแกรม SWATH (Charoenpornsawat, 1999) และประโยคภาษาอีสานจะตัดคำโดยใช้โปรแกรม LexTO 2. จับคู่คำอ่านและหาค้นหาคำพ้องเสียงเมื่อตัดคำเสร็จแล้ว จากนั้นก็จะนำคำที่ได้จากการตัดคำนำมา เปลี่ยนเป็นคำอ่านจะได้คำอ่านของคำแต่ละคำในประโยคที่ตัดคำได้นำคำอ่านของคำศัพท์ที่รับเข้ามา ไปเปรียบเทียบกับไฟล์คำอ่าน เพื่อนำมาวิเคราะห์คำพ้องเสียงเนื่องจากภาษาอีสานมักจะพบคำ 3. การติดหน้าที่ของคำขั้นตอนของการติดหน้าที่ของคำเริ่มต้นจากนำผลลัพธ์ที่ได้มาจากการเปรียบเทียบ คำอ่านและการหาระยะห่างที่น้อยที่สุดนำคำไปเทียบกับข้อมูลในคลังประโยค โดยคำที่นำไปเทียบนั้น จะพิจารณาบริบทรอบข้าง (Bigram Tagger) ว่าถ้าตามด้วยอีกคำแล้วคำที่เราต้องการติดหน้าที่ของ คำด้วยชนิดใด การวิเคราะห์ประโยคและการแปล เมื่อได้โครงสร้างประโยคพร้อมกับหน้าที่ของคำแล้วก็จะนำโครงสร้างไวยากรณ์ของประโยคที่ ได้มานั้นเข้าสู่กระบวนการแปลภาษาเพื่อแปลไปยังภาษาเป้าหมาย และดึงความหมายมาจากพจนานุกรม โดย อาศัยกฎไวยากรณ์ (Grammars)


1. การวิเคราะห์ไวยากรณ์ และความหมาย การวิเคราะห์ไวยากรณ์(Danthanavanich, 2008) คือ และความสัมพันธ์ระหว่างคำใน ประโยคเพื่อนำไปประมวลผลหาผลลัพธ์มาแสดงให้กับผู้ใช้ ซึ่งงานวิจัยนี้ใช้เทคนิคการเครื่องแปลภาษาโดยใช้ ฐานกฎ (Rule-Based Machine Translation) ซึ่งผู้พัฒนาได้สร้างกฎไวยากรณ์เพื่อใช้ในการแปลความหมาย โดยจะแบ่งประโยคเป็น 5 ประเภท ได้แก่ ประโยคบอกเล่า25 ประโยค ประโยคปฏิเสธ 20 ประโยค ประโยค คำถาม 15 ประโยค ประโยคขอร้อง 10 ประโยคและประโยคคำสั่ง 10 ประโยค ซึ่งกฎที่ได้ในงานวิจัยนี้มี ทั้งหมด 34 กฎ 2. การแปลภาษา เมื่อผ่านกระบวนการตรวจสอบไวยากรณ์จากกฎไวยากรณ์ว่าประโยคนั้นมีการติดหน้าที่ของคำ แล้วมีโครงสร้างกฎไวยากรณ์ที่ถูกต้อง จึงนำเข้าสู่กระบวนการแปล โดยนำคำที่ติดหน้าที่ของคำไปเทียบหา ความ หมายของคำหรือประโยคจากพจนานุกรม สรุปและอภิปรายผล จากระบบการแปลภาษาไทย-อีสานโดยใช้ฐานกฎและใช้พจนานุกรมสองภาษานั้นพบว่าระบบ การแปลภาษาสามารถวิเคราะห์คำพ้องเสียงเนื่องจากภาษาอีสานมักจะพบคำที่อ่านออกเสียงเหมือนกันแต่จะ เขียนต่างกัน โดยใช้หลักการเปรียบเทียบจากคำอ่านและใช้การจับคู่คำอ่านมาช่วยในการกรองข้อมูลเพื่อให้ได้ ข้อมูลที่มีความคล้ายคลึงหรือใกล้เคียงกับคำที่รับเข้ามามากที่สุดอย่างไรก็ตาม จากผลการทดลองการ แปลภาษาอีสาน-ภาษาไทยมีความผิดพลาดน้อยกว่าการแปล จากภาษาไทยเป็นภาษาอีสาน ซึ่งส่วนหนึ่ง เนื่องมาจากระบบได้มีการออกแบบเพื่อรองรับการสะกดผิดเนื่องจากภาษาอีสานเป็นภาษาพูดจึงยากต่อการ สะกดให้ถูกต้องตามพจนานุกรมได้ จึงทำให้ไม่สามารถแปลคำศัพท์นั้นได้ถูกต้อง ส่วนการแปลภาษาไทย-อีสาน ความผิดพลาดส่วนใหญ่เกิดจากขั้นตอนการตัดคำภาษาไทยอัตโนมัติยังคงให้ผลลัพธ์ที่ไม่ถูกต้อง เป็นผลให้ ขั้นตอนที่เป็นส่วนของการแปลไม่ถูกต้อง


รายงาน เรื่อง บทความทางภาษาศาสตร์ โดย นางสาวพานิดา ชื่นชม 1002 นางสาวนิรัติศัย โฮมแพน 1004 เสนอ อาจารย์หนึ่งฤทัย ม่วงเย็น รายงานนี้เป็นส่วนหนึ่งของรายวิชาภาษาศาสตร์สำหรับครูภาษาไทย สาขาวิชาภาษาไทย ภาคเรียนที่ 2 ปีการศึกษา 2565 มหาวิทยาลัยราชภัฏร้อยเอ็ด


คำนำ รายงานเล่มนี้จัดทำขึ้นเพื่อเป็นส่วนหนึ่งของวิชาภาษาศาสตร์สำหรับครูภาษาไทย เพื่อให้ได้ศึกษาหา ความรู้ในเรื่องบทความวิจัยทางภาษาศาสตร์ เรื่องการแปลภาษาไทย-อีสานโดยใช้ฐานกฎ และได้ศึกษาอย่าง เข้าใจเพื่อเป็นประโยชน์กับการเรียน ผู้จัดทำหวังว่า รายงานเล่มนี้จะเป็นประโยชน์กับผู้อ่าน หรือนักเรียน นักศึกษา ที่กำลังหาข้อมูลเรื่อง นี้อยู่ หากมีข้อแนะนำหรือข้อผิดพลาดประการใด ผู้จัดทำขอน้อมรับไว้และขออภัยมา ณ ที่นี้ด้วย คณะผู้จัดทำ


เอกสารอ้างอิง ทัศนวรรณ ศูนย์กลาง,สุนีย์ พงษ์พินิจภิญโญ และวีณาวดี ม่วงอ้น./(2558)./การแปลภาษาไทย-อีสานโดยใช้ ฐานกฎ./วารสารวิชาการคณะเทคโนโลยีอุตสาหกรรม มหาวิทยาลัยราชภัฏลำปาง,/ ปีที่ 8/(ฉบับที่ 2)/23- 33.//////// https://li01.tci-thaijo.org/index.php/Itech/article/view/49048


สารบัญ เรื่อง หน้า สรุปบทความการแปลภาษาไทย-อีสานโดยใช้ฐานกฎ 1 เอกสารอ้างอิง 4 ภาคผนวก 5


ภาคผนวก


Click to View FlipBook Version