7. ผลการศึกษา
7.1 การแบ่งกลุ่มสินค้าตามประเภทของสินค้าท่ีมีมูลค่าสูงโดยวิธี ABC Analysis โดยจาก
การรวบรวมข้อมูลการส่ังซ้ือวัสดุส้ินเปลืองประเภทกล่องบรรจุภัณฑ์ จานวน 8 รายการ ต้ังแต่
เดือน มกราคม - ธนั วาคม 2561 สามารถแบ่งกลุ่มสนิ ค้าได้ 3 ประเภท แสดงดังตารางท่ี 1 ซ่ึงใช้
เกณฑก์ ารแบ่ง ดงั น้ี
กลุ่ม A เป็นกลุ่มสนิ ค้าท่มี ีมูลค่าประมาณ 70-80% ของมูลค่าสนิ ค้าท้งั หมด
กลุ่ม B เป็นกลุ่มสนิ ค้าท่มี ีมูลค่าประมาณ 15-20% ของมูลค่าสนิ ค้าท้งั หมด
กลุ่ม C เป็นกลุ่มสนิ ค้าท่มี ีมูลค่าประมาณ 5-10% ของมูลค่าสนิ ค้าท้งั หมด
ตารางที่ 1 แสดงผลการแบ่งกลุ่มสนิ ค้าตามประเภทของสนิ ค้าท่มี ีมูลค่าสูงโดยวิธี ABC Analysis
ลาดบั ช่ือรายการ บาท/ จานวนหน่วยการ มูลค่าส่งั ซ้ือ %มูลค่า %มูลค่า กลุ่ม
หน่วย ส่งั ซ้ือต่อปี (กล่อง) ต่อปี (บาท) ส่งั ซ้ือต่อปี สะสม
1 Box S1 4.60 229,980 1,057,908 41.74 41.74 A
2 Box S3 12.50 80,850 1,006,250 39.70 81.45 A
3 Box SN7 41.59 3,000 124,770 4.92 86.37 B
4 Box 4 14.33 6,500 93,145 3.68 90.05 B
5 Box 8 16.79 5,500 92,345 3.64 93.69 B
6 Box 6 11.25 5,000 56,250 2.22 95.91 C
7 Box 11 17.36 3,000 52,080 2.05 97.96 C
8 Box S13 25.80 2,000 51,600 2.04 100.00 C
จากการแบ่งกลุ่มสินค้าตามประเภทของสินค้าท่ีมีมูลค่าสูงโดยวิธี ABC Analysis
พบว่า มี 2 รายการท่ีจัดอยู่ในกลุ่ม A คือ Box S1 และ Box S3 เป็ นกลุ่มวัสดุท่ีมีมูลค่าอยู่
ประมาณ 80% ของมูลค่าท้ังหมด ดังน้ัน ผู้ศึกษาจึงขอยกตัวอย่างวัสดุกลุ่ม A มาทาการแก้ไข
ปรับปรุง
7.2 การลงบันทึกการรับ-จ่าย วัสดุคงคลัง หรือ จานวนวัสดุคงคลังท่ีได้รับจากผู้ผลิต ของ
บรรจุภณั ฑร์ ายการ Box S1 และรายการ Box S3 เพ่ือท่จี ะสามารถประมาณจานวนการใช้งานและ
วัสดุคงคลังได้ โดยทาการบันทกึ ข้อมูลต้งั แต่ เดอื น ก.ค. - ธ.ค. 62 ดงั แสดงในตารางท่ี 2-3
749
ตารางที่ 2 แสดงปริมาณการใช้งานและวัสดุคงเหลือของบรรจุภณั ฑร์ ายการ Box S1
เดอื น ยกยอดมาจาก ยอดวัสดุรับเข้า รวมยอดรับเข้า ปริมาณวัสดุคง ปริมาณการใช้
เดือนท่แี ล้ว (กล่อง) ท้งั เดอื น คลัง ณ ส้นิ เดอื น งาน (กล่อง)
(กล่อง) (กล่อง) (กล่อง)
ก.ค.62 25,640 20,000 45,640 30,060 15,580
ส.ค.62 30,060 16,000 46,060 29,180 16,880
ก.ย.62 29,180 15,000 44,180 29,560 14,620
ต.ค.62 29,560 26,000 55,560 40,480 15,080
พ.ย.62 40,480 15,000 55,480 41,000 14,480
ธ.ค.62 41,000 10,000 51,000 38,300 12,700
34,763 14,890
เฉล่ีย
ตารางที่ 3 แสดงปริมาณการใช้งานและวัสดุคงเหลือของบรรจุภัณฑร์ ายการ Box S3
เดอื น ยกยอดมาจาก ยอดวัสดุรับเข้า รวมยอดรับเข้า ปริมาณวัสดุคง ปริมาณการใช้
เดือนท่แี ล้ว (กล่อง) ท้งั เดอื น คลัง ณ ส้นิ เดอื น งาน (กล่อง)
ก.ค.62 (กล่อง) (กล่อง)
ส.ค.62 12,730 13,000 25,730 (กล่อง) 8,250
ก.ย.62 17,480 0 17,480 17,480 7,930
ต.ค.62 20,000 29,550 9,550 8,810
พ.ย.62 9,550 10,000 31,370 21,370 7,010
ธ.ค.62 21,370 0 24,360 24,360 6,910
24,360 2,500 19,950 17,450 6,000
17,450 เฉล่ีย 13,980 7,380
17,365
จากข้อมูลในตารางท่ี 2-3 พบว่า ปริมาณวัสดุคงคลัง ณ ส้ินเดือนของ Box S1 โดย
เฉล่ีย เท่ากับ 34,763 กล่อง/เดือน และมีปริมาณการใช้เฉล่ีย เท่ากับ 14,890 กล่อง/เดือน
ปริมาณวัสดุคงคลัง ณ ส้ินเดือนของ Box S3 โดยเฉล่ีย เท่ากับ17,365 กล่อง/เดือน และมี
ปริมาณการใช้เฉล่ีย เทา่ กบั 7,380 กล่อง/เดือน ตามลาดบั
7.3 ตรวจสอบความเหมาะสมการใช้ทฤษฎีการหาปริมาณการส่งั ซ้ือท่ปี ระหยัด (EOQ) ด้วย
การหาค่าสัมประสิทธ์ิความแปรปรวน (Variability Coefficient) ซ่ึงถ้าค่าสัมประสิทธ์ิความ
750
แปรปรวน (Variability Coefficient) ท่ีคานวณได้มีค่าน้อยกว่า 0.25 แสดงว่า ข้อมูลความ
ต้องการสินค้ามีลักษณะคงท่สี ามารถใช้ EOQ ในการคานวณความต้องการหาปริมาณการส่งั ซ้ือท่ี
ประหยดั ได้ แต่ถ้าค่าท่คี านวณได้มีค่ามากกว่า 0.25 แสดงว่า ข้อมูลความต้องการสนิ ค้ามีลักษณะ
แปรปรวนให้ใช้วิธีอ่ืนๆในการหาคาตอบ จากผลการคานวณมีค่า VC มากกว่า 0.25 ซ่ึงมีความ
แปรปรวน การใช้ EOQ จึงอาจจะไม่เหมาะสม ดังแสดงในตารางท่ี 4
ตารางที่ 4 ตารางแสดงผลคานวณหาค่าสมั ประสทิ ธ์คิ วามแปรปรวน (Variability Coefficient)
ของวัสดุส้นิ เปลืองประเภทกล่องบรรจุภัณฑ์ Box S1 และ S3
ช่ือ อตั ราความต้องการ ̅2 ⅆ 2 ความ
รายการ สนิ ค้าโดยเฉล่ีย ̅ n VC
Box S1 (กล่อง) ต้องการ
Box S3 14,890
7,380 221,712,100 1,339,782,000 6 0.84 แปรปรวน
54,464,400 341,451,700 6 0.88 แปรปรวน
7.4 การหาจุดส่ังซ้ือใหม่ท่ีเหมาะสม (ROP) และการควบคุมปริมาณวัสดุคงคลัง ด้วยการ
คานวณหาค่าวัสดุคงคลังสูงสุด (Max) ซ่ึงการส่งั ซ้ือวัสดุสนิ ค้าในรอบถัดไป สามารถส่งั ซ้ือได้เม่ือ
ปริมาณวัสดุคงคลังเหลือเท่ากับจุดส่ังซ้ือ ซ่ึงเป็นจุดส่ังซ้ือใหม่ (ROP) ท่เี หมาะสมของ Box S1
และ Box S3 โดยจะเทา่ กบั 8,558 กล่อง และ 4,475 กล่อง ตามลาดับ ส่วนการควบคุมจานวน
วัสดุสินค้าคงคลัง ซ่ึงสามารถดูได้จากค่าวัสดุคงคลังสูงสดุ (Max) โดย Box S1 เทา่ กับ 17,165
กล่อง และ Box S3 เทา่ กบั 8,848 กล่อง ดงั แสดงในตารางท่ี 5
ตารางที่ 5 แสดงผลการคานวณหาปริมาณการส่งั ซ้ือใหม่ท่เี หมาะสม (Re order point) และการ
คานวณหาค่าวัสดุคงคลังสงู สุด (Max)
ช่ือ อตั ราความ รอบ ค่าระดบั ความเบ่ียงเบน จุดส่งั ซ้ือ วัสดุคงคลัง
รายการ ต้องการสนิ ค้า เวลา ความ มาตรฐานของอตั รา ใหม่ ROP สงู สดุ Max
โดยเฉล่ีย ̅ L เช่ือม่นั ความต้องการสนิ ค้า (กล่อง) (กล่อง)
(กล่อง) 95% Z
Box S1 14,890 0.47 1.65 1,379.09 8,558 17,165
Box S3 7,380 0.47 1.65 890.12 4,475 8,848
751
ดังน้ันเม่ือใช้ข้อมูลปริมาณวัสดุคงคลัง ณ ส้ินเดือน และใช้ข้อมูลวัสดุคงคลังสูงสุด
Max คานวณหามูลค่าวัสดุสินค้าคงคลัง จะเหน็ ว่า สามารถลดมูลค่าวัสดุคงคลังได้ ดังแสดงใน
ตารางท่ี 6
ตารางที่ 6 แสดงมูลค่าวัสดุสนิ ค้าคงคลัง
ช่ือ ราคา ปริมาณวัสดุคงคลัง ณ ส้นิ วัสดุคงคลังสงู สดุ Max
รายการ เดอื น
(บาท/หน่วย) (กล่อง) (บาท)
Box S1 4.60 (กล่อง) (บาท) 17,165 947,535
Box S3 12.50 34,763 1,918,936 8,848 1,327,306
17,365 2,604,750
8. สรุปผลการวิจยั
8.1 จากการคานวณหาค่าสัมประสิทธ์ิความแปรปรวน (Variability Coefficient) ของวัสดุ
ส้ินเปลืองประเภทกล่องบรรจุภัณฑ์ Box S1 และ S3 พบว่า มีค่าสัมประสิทธ์ิความแปรปรวน
มากกว่า 0.25 จะเห็นได้ว่า การกาหนดการส่ังซ้ือโดยใช้ทฤษฎีการหาปริมาณส่ังซ้ือท่ีประหยัด
(EOQ) อาจจะไม่เหมาะสม เน่ืองจากจะทาให้การส่งั ซ้ือวัสดุส้นิ เปลืองประเภทกล่องบรรจุภัณฑม์ ี
ปริมาณไม่เพียงพอ
8.2 สามารถกาหนดจุดส่งั ซ้ือสนิ ค้าใหม่ (ROP) ท่เี หมาะสมได้ เพ่ือใช้เป็นเกณฑ์ในการส่งั ซ้ือ
ของรอบถัดไป โดยจากเดิมท่ไี ม่เคยมีการกาหนดจุดส่ังซ้ือสนิ ค้าใหม่ จะได้เป็นจุดส่งั ซ้ือสนิ ค้าใหม่
(ROP) ของ Box S1 เทา่ กับ 8,558 กล่อง และจุดส่งั ซ้ือสินค้าใหม่ (ROP) ของ Box S3 เท่ากบั
4,475 กล่อง
8.3 สามารถควบคุมปริมาณวัสดุส้นิ เปลืองคงคลัง โดยใช้การคานวณหาวัสดุคงคลังสงู สุดเป็น
เกณฑ์ใหม่ในการควบคุม พบว่า สามารถลดปริมาณวัสดุส้ินเปลืองคงคลังของ Box S1 ได้จาก
34,763 กล่อง เป็น 17,165 กล่อง คดิ เป็นผลต่างจานวน 17,598 กล่อง หรือ ลดลง 50% และ
สามารถลดปริมาณวัสดุส้นิ เปลืองคงคลังของ Box S3 ได้ 17,365 กล่อง เป็น 8,848 กล่อง คิด
เป็นผลต่างจานวน 8,517 กล่อง หรือ ลดลง 49%
8.4 อีกท้งั ยังสามารถลดมูลค่าปริมาณวัสดุส้นิ เปลืองคงคลังของ Box S1 ได้จาก 1,918,936
บาท เป็น 947,535 บาท คิดเป็นผลต่างเท่ากับ 971,401 บาท หรือ ลดลง 50% และ สามารถ
ลดมูลค่าวัสดุส้นิ เปลืองคงคลังของ Box S3 ได้ 2,604,750 บาท เป็น 1,327,306 บาท คิดเป็น
ผลต่างเทา่ กบั 1,277,444 บาท หรือ ลดลง 49%
โดยกล่าวสรุป เม่ือผู้วิจัยได้ใช้วิธีการแบ่งกลุ่มความสาคัญสินค้าตามทฤษฎี ABC
Analysis พร้อมนาข้อมูลจากการลงบันทกึ วัสดุคงคลัง มาประยุกต์ใช้กบั ทฤษฎีจุดส่งั ซ้ือสนิ ค้าใหม่
752
(ROP) รวมท้ังการคานวณหาวัสดุคงคลังสูงสุด เพ่ือกาหนดปริมาณท่ีเหมาะสมของวัสดุคงคลัง
ในการปรับปรุงการจัดการวัสดุส้ินเปลืองคงคลังในคร้ังน้ี สามารถทาให้บริษัทลดปริมาณวัสดุ
ส้นิ เปลืองคงคลังได้ อกี ท้งั ยงั สามารถลดมูลค่าของวัสดุส้นิ เปลืองคงคลังได้เช่นกนั
บรรณานุกรม
ภาษาไทย
วัชรพล วงศ์จันทร์และเจตวัตร พลายพันธุ์.(2562). “การปรบั ปรุงพ้ืนทีก่ ารจดั เกบ็ ถงุ พลาสติก
เพือ่ ลดค่าใชจ้ า่ ยทีเ่ พ่ิมข้นึ ในการเปลยี่ นโหมดการขนส่งสินคา้ กรณีศึกษา บริษทั นิชชนิ
อิเลค็ ทริค จากดั ” มหาวิทยาลัยราชภัฏวไลยอลงกรณ์ ในพระบรมราชูปถมั ย.์
เนตรนภา เสยี งประเสริฐ.(2558). “การวเิ คราะหป์ ริมาณการสง่ั ซ้ือทีเ่ หมาะสมสาหรบั วตั ถดุ ิบ
ในประเทศ กรณีธรุ กิจผลติ ยางผสม” มหาวิทยาลัยบูรพา.
สนุ ายจีรวัฒน์ นภาสุขวีระมงค.(2558). “การบริหารวสั ดคุ งคลงั ประเภทวสั ดุสนบั สนุนการผลิต
โดยใชก้ ารจาลองสถานการณ์ : กรณีศึกษาโรงงานแปรรูปกระจก” มหาวิทยาลัย
ศิลปากร.
จารุวรรณ ชูใจ.(2559). “การปรบั ปรุงการจดั การวตั ถดุ ิบคงคลงั กรณีศึกษา โรงงานผลติ ตวั
ความตา้ นทานกระแสไฟฟ้ า” มหาวิทยาลัยธรรมศาสตร์.
ชมภนู ุช เหรียญปรีชา, ณภคั หงษ์จารัส, สรุ ศักด์ิ โสริวาน. (ม.ป.ป). “ศึกษาการกาหนดจดุ สง่ั ซ้ือ
ใหม่ (ROP) เพือ่ ลดปัญหาการซ่อมบารุงล่าชา้ กรณีศึกษา บริษทั อิทธิพร อิมปอรต์
จากดั ” มหาวิทยาลัยกรุงเทพธนบุรี.
กฤษณะ ส่งั การ.(2558). “การเพ่ิมประสิทธิภาพการจดั การสนิ คา้ คงคลงั ประเภทวสั ดหุ ีบห่อ
กรณีศึกษา บริษทั เค เค เค โกลบอล จากดั ” มหาวิทยาลัยบูรพา.
753
การรบั รูป้ ้ ายสาธารณะและการแปรภาษาไทย-จีน บนระบบแอนดรอยด
Public Signage Recognition and Thai-Chinese Translation Based on Android
Zhou Hongying1
ณรงค์เดช กรี ตพิ รานนท์2
บทคดั ยอ่
การรู้จาตัวอักษรภาษาไทยในป้ ายสาธารณะเป็นเร่ืองยากและท้าทายอันมีสาเหตุมาจาก
ปัญหาทางเทคนิคได้แก่ ความซับซ้อนความสว่างความเอียง ยังรวมถึงปัญหาความหลากหลายของ
ตัวอักษรภาษาไทยท่ใี ช้อยู่ในป้ ายสาธารณะ จากปัญหาดังท่กี ล่าวมาแล้วงานวิจัยน้ีจึงมีวัตถุประสงค์
เพ่ือพัฒนาแอพพลิเคช่ันAndroidสาหรับช่วยนักท่องเท่ยี วและคนต่างชาติใช้แปลตัวอักษรไทยในป้ าย
สาธารณะ โดยข้ันตอนของแอพพลิเคช่ันเร่ิมจากใช้ Leptonica C++ไลบราร่ีสาหรับการประมวลผล
ภาพ หลังจากน้ันใช้ Tesseract OCR ไลบราร่ีเพ่ือรู้จาตัวอักษรภาษาไทย สาเหตุท่ใี ช้ Tesseract OCR
engine เพราะเป็นไลบราร่ี open sourceท่ไี ด้รับความนิยมและเคยใช้รู้จาตัวอักษรไทยในงานวิจัยอ่ืน
มาแล้ว ต่อจากน้ันใช้บริการแปลภาษาของ Baiduทาการแปลภาษาไทยเป็ นภาษาอังกฤษและจีน
นอกจากน้ีในระหว่างการพัฒนาแอพพลิเคช่ันน้ีผู้วิจัยยังใช้เทคโนโลยีการพัฒนา SQLite JNI และ
HTTPเพ่ือทาการทดสอบและปรับปรุงการรู้จาตัวอักษรชนิดใหม่ๆหลายชนิด ผลการทดสอบแสดงให้
เหน็ ผลลัพธเ์ ป็นท่นี ่าพอใจ จากผลการทดลองป้ ายท่อี ยู่บนถนนจานวน 14 ป้ าย (207 ตวั อกั ษร) ซ่ึง
มีความถูกต้องเฉล่ีย 97%ซ่ึงในอนาคตอาจเพ่ิมชนิดตัวอกั ษรแบบอ่นื ในการเรียนรู้ต่อไป
คาสาคญั การรู้จารูปภาพ, ภมู ทิ ศั น์ธรรมชาติ, ป้ ายสาธารณะ, การแปลภาษาด้วยคอมพิวเตอร์, แอป
พลิเคชันแอนดรอยด
ABSTRACT
Recognition of Thai characters in natural scene is challenge. The reason why Thai
characters are difficult to recognize, is not only a technological problem, such as Thai characters
are complicated, illumination, inclination and other factors could reduce the effect of recognition,
but also a social problem, such as there are many kinds of fonts in Thailand public signage. The
1 นกั ศึกษาปริญญาโท หลกั สตู รวศิ วกรรมคอมพิวเตอร์ วิทยาลยั นวตั กรรมด้านเทคโนโลยีและวศิ วกรรมศาสตร์
มหาวทิ ยาลยั ธรุ กจิ บณั ฑติ ย์
2 อาจารยท์ ่ปี รึกษา
754
purpose of this paper is to provide a development of Image recognition Android application for
tourist or other foreigners in Thailand, which could use to recognize and translate Thai characters
in the pubic signage board in natural scene. In this paper, it is selected Android as a mobile
operating system, and Android Studio as development environment. The Leptonica C++ library
used for image processing. The Tesseract OCR Engine, which one of most popular open source
library of OCR, used to recognize Thai characters. After recognition, the BAIDU translation
service used to translate Thai language to English. What is more, the development technology of
SQLite, JNI, HTTP is used during developing application. In order to test and improve recognize
effect of the application, this paper tried to train a new kind of font of Thai-language public
signage. As a result of experiment, the application could recognize Thai-language public signage
satisfied .Consequently, this paper success to develop a new Image recognition application for
Thai-language public signage based on Android platform. In addition, it is improve effect of
recognition by training new kind of font. Future work might continue to increase types of training
font.
Keywords Image Recognition, Convolutional Neural Networks, Public Signage, Machine
Translation, Android Application
1.บทนา
ประเทศไทยมีศักยภาพและสามารถสร้างโอกาสทางการทอ่ งเท่ยี ว รวมถงึ ทาการค้าระหว่าง
ประเทศ ซ่ึงคนจีนนิยมมาทอ่ งเท่ยี วและทาการค้าขายกับประเทศไทย แต่ภาษาไทยกเ็ ป็นข้อจากดั ของ
ชาวต่างชาติท่เี ข้ามาทาธรุ กจิ หรือมาทอ่ งเท่ยี วในประเทศไทยท้งั การพูด อ่าน และเขยี น โดยเฉพาะชาว
จีน และถึงแม้ว่าจะมีเทคโนโลยีท่ีสามารถช่วยในการแปลภาษาเช่น Google Translate ท่คี นไทยนิยม
ใช้ แต่สาหรับท่ปี ระเทศจีนไม่สามารถใช้ google ได้ และคนจีนสว่ นใหญ่กไ็ ม่นิยมใช้ google translate
คนจีนชอบใช้ Baidu translate แต่ Baidu translate ยังไม่มีการรู้จาตัวอักษรภาษาไทย[8] อย่างไรก็
ตามมีเทคโนโลยีท่ีจะสามารถใช้ในการพัฒนาแอพพลิเคช่ันในการแปลภาษาท่ีรวดเร็วและแม่นยา
ได้แก่ซอฟต์แวร์การรู้จาตัวอักษร (Optical Character Recognition: OCR)[3]ซ่ึงเป็ นเทคโนโลยี
สาหรับการแปลงภาพเอกสาร ป้ าย[6] หรือรูปภาพให้กลายเป็ นข้อความท่ีสามารถนาไปแปลเป็ น
ภาษาจีนต่อไปได้ Abdurrahman (2012) ได้เสนอวิธกี าร OCR Tesseract คือการจับภาพบนสมาร์ท
โฟน ซ่ึงประยุกต์ใช้กับกล้องโทรศัพท์มือถือ ภาษาท่ีใช้ทดสอบในคร้ังน้ีมีสามภาษาคือ ซุนดา
อนิ โดนีเซีย และองั กฤษ ผลลัพธท์ ่ไี ด้มีความถูกต้องร้อยละ 70[2]
755
ดังน้ัน ผู้วิจัยจึงได้ดาเนินการพัฒนาโมบายแอพพลิเคช่ันสาหรับแปลภาษาไทยเป็ น
ภาษาจีน บนระบบปฏบิ ัตกิ ารแอนดรอยด์ เพ่ือให้นักทอ่ งเท่ยี วและนักธรุ กจิ ชาวจีนได้ใช้แอพพลิเคช่ัน
ดังกล่าวในการแปลภาษาไทยเป็นภาษาจีน ได้อย่างสะดวกสบาย เน่ืองจากเป็นอุปกรณ์พกพาขนาด
เลก็ ซ่ึงคาท่ีนามาพัฒนาในแอพพลิเคช่ันดังกล่าวเป็นคาท่ีใช้ในชีวิตประจาวัน เช่น ช่ือสถานท่ี ช่ือ
จังหวัด ห้องนา้ โรงแรม ร้านอาหาร เป็นต้น ซ่ึงสาเหตุท่เี ลือกพัฒนาแอพพลิเคช่ันดังกล่าวข้ึนเพราะ
ในปั จจุ บันเทคโนโลยีมีความเจริ ญก้ าวหน้ าคนส่วนใหญ่ ใช้ สมาร์ทโฟนในชีวิตประจาวันการพัฒนา
แอพพลิเคช่ันเพ่ือใช้ผ่านโมบายจะทาให้สะดวกและรวดเรว็ ต่อผู้ใช้ในปัจจุบัน
2.เอกสารและงานวิจยั ทีเ่ กยี่ วขอ้ ง
2.1 Tesseract OCR
Tesseract OCRเป็น Engine ท่ใี ช้สาหรับการรู้จาอกั ขระทางภาพ ซ่ึงมีกระบวนการหลัก 2
ข้นั ตอน [5] ได้แก่
ข้นั ตอนที่ 1 การวิเคราะหโ์ ครงร่างรูปภาพ
การวิเคราะห์โครงร่างรูปภาพเป็นข้ันตอนแรกท่ีระบบ OCR จดจารูปภาพ ความสาคัญก็
คือการเตรียมความพร้อมสาหรับการรับรู้ภาพโดยวิธีการเฉพาะดาเนินการวิเคราะห์รูปแบบ แยก
ระหว่างพ้ืนท่ขี ้อความและพ้ืนท่ที ่ไี ม่ใช่ข้อความเพ่ือกรองสว่ นท่ไี ม่ใช่ข้อความของภาพ วิธกี ารวิเคราะห์
ท่ใี ช้ Tesseract เป็นวิธีการวิเคราะห์เค้าโครงหน้าของ Hybrid tab-based detection[2] วิธีน้ีสามารถ
วิเคราะห์เลยเ์ อาตท์ ่ซี ับซ้อนมากข้นึ โดยไม่เพ่ิมจานวนการคานวณ
ข้นั ตอนที่ 2 การแยกและการรูจ้ าตวั อกั ษร
วัตถุประสงค์ของการออกแบบ Tesseract [3]คือการจดจาตัวอกั ษรอย่างถูกต้องเน่ืองจาก
Tesseract รู้จักอกั ขระแต่ละตัวทลี ะตัว ส่งิ น้ีต้องใช้อกั ขระในภาพเพ่ือแยกทลี ะตวั ข้นั ตอนของการแบ่ง
ส่วน Tesseract คอื การแบ่งข้อความให้คร่าวๆ เพราะการแบ่งคร่าวๆ ส่วนใหญ่แยกอกั ขระได้ จากน้ัน
ใช้การแบ่งส่วนแบบละเอียดและแก้ไขข้อผิดพลาด หลักการทางานคือข้ันแรกให้บลอ็ กอักขระใน
แนวต้ังเพ่ือให้มีช่องว่าง แบ่งอย่างหยาบๆ ตามขนาดของช่องว่าง แม้ว่าการแบ่งส่วนแบบคร่าวๆ
ส่วนใหญ่สามารถแยกอกั ขระได้ อย่างไรกต็ ามหลังจากการแบ่งส่วนแบบคร่าวๆ กจ็ ะมีอกั ขระท่ีติดกนั
หรืออักขระท่ีแบ่งกลุ่มไม่ถูกต้อง ในข้ันตอนน้ีการแบ่งส่วนแบบละเอียดถูกใช้การแบ่งส่วนแบบ
ละเอียดจะเปรียบเทียบอกั ขระกับไลบรารีอกั ขระเพ่ือตัดสนิ อักขระเดียวซ่ึงทาให้การจดจาข้อความมี
ความแม่นยามากข้นึ
756
2.2 Fast R-CNN
รูปท่ี 1 Fast R-CNN Architecture
2.2.1 กระบวนการการรูจ้ าป้ ายถนนของ Fast R-CNN
กระบวนการการรู้จาป้ ายถนนของ Fast R-CNN มกี ระบวนการหลัก 2 ข้นั ตอน [4]
ได้แก่
ข้นั ตอนที่ 1: ข้นั ตอนการฝึ กอบรม ข้นั ตอนการฝึกอบรมใช้ fonrt: DB-Bork
เพราะไลบรารีโอเพนซอร์ซของ Tesseract มีพารามิเตอร์เร่ิมต้นของ Convolutional Neural Networks
สามารถฝึกอบรมได้ ในท่สี ดุ จะได้การรู้จาของ Model
ข้นั ตอนที่ 2: ข้นั ตอนการรูจ้ า ได้การรู้จาของ Model และกป็ ้ อนตวั อกั ษรของป้ าย
ถนนเพ่ือให้ได้ผลการรู้จา
2.2.2 กระบวนการทางานของ Fast R-CNNมีประกอบดว้ ย 5 ขนั้ ตอนดงั ต่อไปน้ี:
ข้นั ตอนท่1ี ภาพนาเข้าท้งั ภาพ
ข้นั ตอนท่2ี Extract feature map ภาพนาเข้าท้งั ภาพไปผ่าน CNN กบั ROI Pooling
Layer จะได้ผล feature map
ข้นั ตอนที่3 Suggest region proposal ใช้ algorithm Selective Search เพ่ือ
mapping จะได้ region proposal ประมาณ 2,000 ภาพ[7]
ข้นั ตอนที่4 region proposal RegioNormalization region proposal ไปผ่าน ROI
Pooling Layer เพ่ือให้ได้ feature vector ท่มี ขี นาดคงท่ี
ข้นั ตอนที่5 algorithm softmax กบั Bounding-box feature vectorไปผ่าน Fully
connected layer จะได้เอาต์พุตสองรายการกค็ ืออลั กอริทมึ softmax กบั อลั กอริทมึ Bounding-
box ผลลัพธท์ ่อี ลั กอริทมึ softmax เพ่ือตรวจสอบว่าเป็นคลาสท่รี ะบุหรือไม่ (เช่นเป็นคลาสตวั อกั ษร
กหรือ ข ถ้าเป็นตัวอกั ษร ก จะไปหาคลาสตัวอกั ษร ก) ผลลัพธ์ท่อี ลั กอริธึม Bounding-box เพ่ือปรับ
ตาแหน่งของ region proposal และลบพ้ืนท่ที ่ที บั ซ้อนกนั (เช่นตาแหน่งของ region proposal ซ้อนกนั
จะลบส่วนท่ซี ้อนกนั ทาให้ region proposal ท่มี ีขนาดใหญ่และกป็ รับขนาดใหม่)
757
2.3 Baidu translation
รูปท่ี 2 กระบวนการการแปลภาษา
ผู้ใช้เปิ ดแอพพลิเคช่ัน Thai OCR ข้นึ มา จะปรากฎเมนูการแปลภาษาของ Thai OCR โดย
จะให้เลือการถ่ายภาพ หรือการพิมพ์ เม่ือถ่ายภาพหรือพิมพ์เสรจ็ แล้ว ต่ออนิ เทอร์เนต็ ไปขอ Baidu
translation API server โดย Baidu translation API server จะไป Translation terminal เพ่ือทาการ
แปล พอแปลเสรจ็ จะสง่ ผลให้ Baidu translation API server ให้แสดงผลออกมา
3.วิธีดาเนนิ การวิจยั
3.1 การออกแบบระบบแอพมอื ถอื
ระบบแอพมือถือประกอบด้วย 3 ส่วน ประกอบด้วย ส่วนท่ี 1 photograph ส่วนท่ี 2
Translate and internet และส่วนท่ี 3 Vocabulary โดยในส่วนท่ี 1 photograph หมายถึงภาพท่ถี ่ายจาก
กล้องโทรศัพทม์ ือถือหรือเลือกภาพท่ีมีข้อความเป้ าหมายจากอัลบ้ัมโทรศัพท์มือถือ การประมวลผล
ภาพหมายถึงการประมวลผลภาพเพ่ือเพ่ิมอัตราการรู้จาภาพตัวอย่างเช่นการกรองค่ามัธยฐาน การ
แปลงภาพระดับเทาให้เป็นภาพขาว-ดา เป็นต้น การรู้จาตัวอักษร หมายถึง การใช้เทคนิค OCR เพ่ือ
ระบุเป้ าหมายภาพและแยกข้อความออกมา ส่วนท่ี 2 การแปลและระบบเครือข่าย (Translate and
internet) หมายถึง การใช้เทคนิค OCRได้ตัวอักษรและส่งข้อความไปถึง Baidu เพ่ือแปลภาษาไทย
เป็นภาษาจีนหรือภาษาอังกฤษ และส่วนท่ี 3 Vocabulary หมายถึงการคงไว้และลบข้อความ จึงมี
ภาพรวมของ Mobile app structure ดังรูปท่ี 2
758
รูปท่ี 3 Mobile App Structure
3.2 ฟังกช์ นั การรูจ้ าภาพ
รูปท่ี 4 Training Workflow for Teaseract with jTesseditorbox
Tesseract OCRเป็นEngineท่ใี ช้สาหรับการรู้จาอกั ขระทางภาพซ่ึงข้ันตอนการฝึกอบรมคือ
ข้นั ตอนที่ 1 Start JAVA , run iTessBoxEditor.
ข้นั ตอนที่ 2 สรา้ งภาพการฝึ กอบรม(create training image)การแยกตัว
อกั ษรจากภาพป้ าย สร้าง font:DB-Bork.
759
ข้ันตอนที่3 สรา้ งไฟล์ Box Merge ภาพป้ ายและสร้างไฟล์ Box หลังจากการ
แยกตัวอักษรจากภาพป้ าย ข้ันตอนต่อไปคือ Merge ภาพป้ ายและสร้ างไฟล์ Box ซ่ึงมันจะมี
ข้อผิดพลาดในการรู้จา ในกระบวนการแก้ไขเราต้องแยกตัวอักษรให้ถูกต้องและป้ อนตัวอักษรท่ี
ถูกต้องในคอลัมน์ Char
ข้นั ตอนที่ 4 สรา้ งไฟล์ font properties ไฟล์ font properties ทาหน้าท่pี rovide
font style information รูปแบบของ font_properties คือ [DB-
Bork]><italic><bold><fixed><serif><fraktur>โดยท่ี <[DB-Bork]>เป็นเลือกท่ี Font ต่อไปน้ีห้า
พารามิเตอร์เป็นรูปแบบของการฝึกอบรมตัวอกั ษร(Font style) ใส่ normal 0 และ 1 เพ่ือระบุว่ามแี อ
ตทริบิวต์เหล่าน้ีอยู่หรือไม่ 1หมายถึงมแี อตทริบิวต์ 0 หมายถึงไม่มีแอตทริบิวต์
ข้นั ตอนที่ 5 สรา้ งไฟล์ Clustering การฝึ กอบรมไลบราร่ีต้องจัดกลุ่มหน้าการ
ฝึกอบรมเพ่ือสร้างต้นแบบ (Need to cluster training pages to create the prototypes)
1: การสร้างไฟล์ shapetable (ไฟล์ shapetable คอื shape table) ใช้คาส่งั : shapeclustering
-F font_properties -U unicharset [tha2].[DB-Bork].tr
2: การสร้ างต้นแบบรูปร่างไฟล์ inttemp (ไฟล์ inttempคือthe shape prototypes) กับ
จานวนของฟังก์ชันท่ีต้ องการต่อตัวอักษรไฟล์ pffmtable (ไฟล์ pffmtable คือ the number of
expected featuress for each character) ใช้คาส่ัง: mftraining -F font_properties -U unicharset -O
[tha2]. unicharset [tha2].[DB-Bork].tr
3: สร้างไฟล์ข้อมูล normproto (the character nomalization sensitivity prototypes) ใช้
คาส่งั : cntraining [DB-Bork].tr
ข้นั ตอนที่6 สรา้ ง traineddata ใหม่ ข้ันตอนก่อนหน้าได้รับ4ไฟล์กค็ ือ inttemp
normproto pffmtable shapetable แก้ inttemp normproto pffmtable shapetable เป็ น tha2.inttemp
tha2.normproto tha2.pffmtable tha2.shapetable และใช้คาส่ัง combine_tessdata tha2. เพ่ือสร้าง
traineddata ใหม
3.3 Baidu Translation วิธีใช้ baidu Translation API
รูปท่ี 5 Translation process
760
ฟังก์ช่ันการแปลจะดาเนินการผ่านทางอินเตอร์เฟซท่ี Badu แปล ในข้ันแรกใช้วิธีการคีย์
API เพ่ือรับส่วนต่อประสานข้อมูลแปลภาษาโดยต้องใช้ server จึงต้องเช่ือมต่อ network ซ่ึงการแปล
Baidu สามารถใช้วิธี get ของ HTTP เพ่ือทาการร้องขอการแปล Baidu ข้อมูลท่สี ่งกลับมาคือ แพค็ เกจ
json และสดุ ท้ายกจ็ ะสง่ ผลการแปลกลับมา
4 ผลและอภปิ รายผล
ตอนที่ 1 ผลการทดสอบของหนา้ จอเพอื่ ใหเ้ ป็ นทางานไดจ้ ริง
ThaiOCR App มี 3 ฟังก์ช่ันหลักคือการรู้จารูปภาพภาษาไทย การแปล save; การ
ออกแบบท่ีด้านล่างของอินเตอร์เฟซหลักของ app มี 3 ป่ ุม Tab ซ่ึงกค็ ือ vocabulary Translate และ
OCR ผู้ใช้สามารถคลิกเละข้ามไปท่ี UI Layer ของฟังกช์ ่ันท่เี ก่ยี วข้อง ดังรูปท่ี 6
(ก) vocabulary (ข) Translate (ค)OCR
ภาพท่ี 6 หน้าหลักของโปรแกรม
ตอนท่ี 2 ผลการทดสอบของการใช้งานโปรแกรม เพ่ือให้เป็นทางานได้จริง
(1)อนิ เทอร์เฟซ Vocabulary เป็นฟังกช์ ันบันทกึ และจัดเกบ็ ประวัติการแปล สามารถ
บันทกึ หรือลบเน้ือหาการแปลได้ ดังรูปท่ี 7
761
ภาพท่ี 7 แสดงการ Vocabulary
(2)อนิ เทอร์เฟซ Translate เป็นฟังกช์ ันการแปลโดยใช้คลาวด์ Baidu เพ่ือแปลภาษา
ปัจจุบันมีความสามารถแปลภาษาไทยเป็นภาษาองั กฤษกับภาษาจีน ดงั รูปท่ี 8
ภาพท่ี 8 แสดงภาษาไทยแปลเป็นภาษาองั กฤษกบั จีน
(3)อนิ เตอร์เฟซ OCRเป็นฟังกช์ ่ันการรู้จาภาษาไทย เม่อื คลิกท่ปี ่ ุม OCRตัวเลือกแหล่ง
รูปภาพสองตวั จะปรากฏข้นึ : Snapshot และ SelectFromAlbum หากเลือกฟังกช์ ่ันSnapshot จะใช้
ฟังกช์ ่ันกล้องของโทรศัพทเ์ พ่ือถ่ายป้ ายถนนท่รี ู้จา หากเลือกฟังกช์ ่ันSelectFromAlbum จะสามารถ
เลือกภาพท่มี อี ยู่ในโทรศัพทข์ องอลั บ้ัม หลังจากกล้องสแกนแล้วปรับขนาดของกรอบการรับรู้ด้วย
ตนเอง,เพ่ือปรับปรุงความเรว็ และความแม่นยาของการรู้จาภาพป้ าย , หลังจากเลือกช่วงการรับรู้ภาพ
762
แล้วแอพจะทาการรู้จาภาษาไทย หลังจากการรู้จาสาเรจ็ แล้วผลการรู้จาจะปรากฏในรูปแบบของ Text
มฉิ ะน้ันจะแสดงเป็น null ดงั รูปท่ี 9 กบั รูปท่ี 11
รูปท่ี 9 แสดงการถ่ายรูปจาก Snapshot
ภาพท่ี 10 แสดงการถ่ายรูปจาก SelectFromAlbum
763
ภาพท่ี 11 แสดงการตัดภาพ
ตอนท่ี 3 ป่ ายท่ใี ช้ในการทดสอบ
ป้ ายท่ใี ช้ในการทดสอบเป็นป้ ายท่ตี ิดต้ังไว้ตามถนน จานวน14ป้ าย (207 ตัวอกั ษร) เป็น
font:DB-Bork ต่อไปเป็นตวั อย่างของการทดสอบของป่ าย
รูปท่ี 12 Public Signage
120.00% 97% 93% 92% 98.50%
100.00% 71.50% 71% 71% 85%
80.00%
60.00%
40.00%
20.00%
0.00%
อตั ราความถกู ต้องก่อนเพิ่มความแม่นยา
อตั ราความถกู ต้องหลงั เพิ่มความแมน่ ยา
ตารางท่ี 1 Performance Improvements After Trainning
764
บางนา
ดาวคะนอง
(ก)ป้ ายด้งั เดมิ (ข)ป้ ายเอยี ง (ค)ป้ ายแสงน้อย (ง)ตวั พิมพ์
ในการทดสอบน้ี นอกจากจะให้ทดลองกับป้ ายแบบท่ีถ่ายมาต้ังแต่ต้นแล้ว ยังได้ทาการ
ปรับให้ภาพถ่ายเปล่ียนไป คือมกี ารทาให้ป้ ายเอยี งเพ่ิมข้ึน 10 องศา รวมท้งั ป้ ายแสงน้อยท่ลี ดปริมาณ
แสงลง นอกจากน้ียงั มกี ารพิมพ์คาตามป้ ายเรียกว่าป้ ายแบบตวั พิมพ์เพ่ิมเติม
การทดสอบก่อนการเพ่ิมความแม่นยาของข้อความท่พี ิมพ์อยู่ท่ี 85% หลังจากท่เี พ่ิมความ
แม่นยาแล้วเพ่ิมข้นึ เป็น 98.5% สว่ นป้ ายด้งั เดมิ กอ่ นการเพ่ิม
ความแม่นยาอยู่ท่ี 71.5% หลังจากท่ีเพ่ิมความแม่นยาแล้ว 97% สาหรับป้ ายแสงน้อย
พบว่าก่อนการเพ่ิมความแม่นยาอยู่ท่ี 71% หลังการเพ่ิมความแม่นยาแล้ว 92% นอกจากน้ีเม่ือนา
โปรแกรมไปทดสอบกับป้ ายท่ีมีลักษณะเอียงพบว่าก่อนเพ่ิมความแม่นยาอยู่ท่ี 71% และหลังเพ่ิม
ความแม่นยาอยู่ท่ี 93% ซ่ึงถือว่ามปี ระสิทธภิ าพสงู เพราะงว่า เม่อื ใช้เทคนิดการแปลงค่าสี RGB เป็น
Gray Scale , การกรองค่ามัธยฐาน,การแปลงภาพระดับเทาให้เป็ นภาพขาว-ดาฯท่ีนาเสนอมาใช้
ร่วมกนั กบั OCRสามารถเพ่ิมความถูกต้องของการรู้จาตัวอกั ขระด้วยแสงสูงข้นึ เม่อี ตวั อกั ษรย่ิงมีความ
ชัดเจน ตรง แสงปกติ สง่ ผลให้ผลลัพธท์ ่ไี ด้จากกระบบรู้จาตัวอกั ษรมีประสทิ ธภิ าพมากย่ิงข้ึน
5 อภปิ รายผล
งานวิจัยน้ีทาการรู้จาตัวอกั ษร กระบวนการทางานประกอบด้วยสามกระบวนการหลัก คือ
1. กระบวนการการออกแบบระบบแอพมือถือ 2. กระบวนการรู้จาภาพ 3. Baidu Translation โดย
ทาการทดสอบประสทิ ธิภาพของภาพป้ าย จากการทดสอบกบั ภาพป้ ายจริงจานวน 14 ภาพ พบว่าป้ าย
ด้ังเดิมมีอัตราความถูกต้องเท่ากับ 97% ป้ ายเอียงมีอัตราความถูกต้องเท่ากบั 93% ป้ ายแสงน้อยมี
อตั ราความถูกต้องเทา่ กบั 92% ข้อความพิมพ์มอี ตั ราความถูกต้องเทา่ กบั 98.5%
สรุปได้ ว่ าการร้ ูจาตัวอักษรภาษาไทยท่ีนาเสนอน้ันให้ ผลของการทดสอบมีความถูกต้ อง
แม่นยา สามารถนาไปประยุกต์ใช้งานได้จริง อย่างไรกต็ ามวิธีท่นี าเสนอยังมีข้อจากัดในเร่ืองของ
ภาพป้ าย เช่น(1) ฝึกการรู้จาภาพและ font จานวนน้อยส่งิ ท่ีต้องพัฒนาต่อคือ การเพ่ิมขอบเขตของ
จานวนภาพป้ ายและ การเพ่ิมจานวน font ท่นี ามาสร้าง Library (2) ถ้าภาพป้ ายมี 2 ภาษาข้ึนไป
และป้ ายเอยี ง ป้ ายแสงน้อยๆ ระบบสามารถรู้จาภาษาไทยได้เท่าน้ันจึงทาให้การอ่านตัวอกั ษรมีความ
765
ผิดพลาดเกดิ ข้ึน ส่งิ ท่ตี ้องพัฒนาต่อคือใช้วิธี Multithreading กบั ใช้ฟังกช์ ันการประมวลผลได้รับการ
ปรับปรุงเพ่ือเพ่ิมความแม่นยา
บรรณานุกรม
[1] Kaothanthong N, Theeramunkong T , Chun J . Improving Thai Optical Character
Recognition Using Circular-Scan Histogram[C] 2017 14th IAPR International
Conference on Document Analysis and Recognition (ICDAR). IEEE, 2018.
[2] Sahil Badla. Improving the efficiency of Tesseract OCR Engine. Master's Projects. San Jose
State University, 2014.
[3] Lei Yin. Character Recognition System Based on Android System [D]. Beijing University
of Posts and Telecommunications,2016.
[4] Girshick, Ross. Fast R-CNN[J]. Computer Science, 2015.
[5] Taolong Hong. Image Recognition and Voice Playing System Based on Android Platform
[D], Nanjing University of Posts and Telecommunications.
[6]Mengmeng Yang. Method for Traffic Sign Detection Based on Faster R-CNN[D]. Hubei
University of technology 2019.
[7]Selective Search for Object Recognition[J] . J. R. R. Uijlings,K. E. A. Sande,T. Gevers,A.
W. M. Smeulders. International Journal of Computer Vision . 2013 (2)
[8]He Z . Baidu Translate: Research and Products[C] . Proceedings of the Fourth Workshop on
Hybrid Approaches to Translation (HyTra). 2015.
766