The words you are searching are inside this book. To get more targeted content, please make full-text search by clicking here.
Discover the best professional documents and content resources in AnyFlip Document Base.
Search
Published by pasapitchchujai, 2022-08-30 10:18:57

07_บทที่ 3

07_บทที่ 3

บทที่ 3
การหากฎความสัมพันธ์ของขอ้ มูล

(Association Rules)

3.1 วัตถปุ ระสงค์

ในบทนเ้ี มื่อศึกษาจบแลว้ นักศึกษาสามารถทจ่ี ะ
1. อธบิ ายและหาค่าสนับสนนุ และความเชือ่ มน่ั ได้
2. อธบิ ายรูปแบบและลักษณะของงานการคน้ หาความสัมพันธข์ องข้อมูลดว้ ยกฎ

ความสมั พนั ธไ์ ด้
3. อธิบายขน้ั ตอนการหากฎความสมั พันธ์ด้วยอัลกอริทึม Apriori ได้
4. สามารถนาอัลกอริทึม Apriori ไปหาความสมั พันธร์ ะหว่างข้อมลู ได้

3.2 บทนา

กฎความสมั พันธ์ของขอ้ มูลเป็นเทคนคิ หน่ึงของการทาเหมืองขอ้ มลู ซึ่งเทคนคิ วิธีนจี้ ะเป็นการ
ค้นหาความสัมพันธ์ของข้อมูลจากข้อมลู ที่มีอยปู่ รมิ าณมากเพ่ือหารูปแบบทเี่ กิดขึ้นบ่อย (Frequent
Pattern) และใช้ในการวเิ คราะห์ความสมั พนั ธห์ รอื ทานายปรากฎการณ์ตา่ ง ๆ สาหรับขอ้ มูลท่นี ามาใช้
ในการทาเหมืองความสมั พันธ์ (Association Mining) น้ันจะเปน็ ข้อมูลท่ีอยู่ในฐานข้อมูลประเภท
รายการ (Transaction Data) ซงึ่ เปน็ ข้อมลู ท่ีพบได้ท่ัวไป เชน่ รายการซือ้ สินค้าของลูกค้าที่ข้อมลู 1
ระเบียน (Record) จะมีความสัมพันธข์ องตัวแปรเพยี ง 1 รปู แบบ ข้อมลู นั้นจะไม่มตี วั แปรเปา้ หมาย
(Class) และข้อมูลท่นี ามาใช้จะต้องไมเ่ ปน็ ตวั แปรทเี่ ปน็ ค่าต่อเนอื่ ง (Numeric) ถ้าตวั แปรข้อมลู เขา้
เปน็ คา่ ตอ่ เน่ืองจาเปน็ ต้องแปลงเป็นคา่ ไม่ตอ่ เนื่อง (Nominal หรือ Ordinal) ก่อน ผลลัพธท์ ี่ได้จากการ
หาความสมั พันธ์ของขอ้ มลู หรือสินค้าท่ีเกิดขึน้ พร้อมกันจะอย่ใู นรูปของกฎความสัมพันธ์ (Association
Rule) ซึ่งกฎเหลา่ นนั้ สามารถเขียนอยู่ในรูปของเซตรายการท่ีเป็นเหตไุ ปสู่เซตของรายการทเ่ี ปน็ ผล

ในปัจจุบันมีการนากฎความสัมพันธ์ไปประยุกต์ใช้ในงานหลายอยา่ ง เช่น การจัดวางสินค้า การ
จัดทาโปรโมชันสนิ คา้ การวิเคราะห์พฤติกรรมการซอ้ื สนิ ค้าของลูกคา้ ซง่ึ จะชว่ ยแนะนาการซื้อสนิ คา้
ใหแ้ กล่ กู คา้ ดังจะเห็นไดจ้ ากระบบแนะนาหนงั สอื ใหก้ ับลูกคา้ แบบอัตโนมตั ิของเวบ็ ไซต์ Amazon ที่
นาขอ้ มูลการซ้ือท้งั หมดมาหาความสมั พันธ์วา่ เม่อื ลูกค้าซื้อหนังสือเลม่ หน่ึงแลว้ มกั จะซ้ือหนงั สือเล่มใด
พรอ้ มกนั เสมอ ความสมั พนั ธ์ทไ่ี ดจ้ ากกระบวนการนีส้ ามารถนาไปใชเ้ พื่อคาดการณ์ว่าควรจะแนะนา
หนงั สอื เลม่ ใดเพิม่ เติมใหก้ บั ลูกค้า

บทที่ 3 การหากฎความสมั พันธ์ของข้อมูล

3.3 การหาความสมั พันธ์

การหาความสัมพันธ์ของข้อมูล (Association) เพ่ือวิเคราะห์พฤติกรรมการซื้อสินค้าและหา
ความสัมพันธ์ของสินค้าท่ีลูกค้ามักจะซื้อไปพร้อมกันนั้นมีรากฐานมาจากการวิเคราะห์ตะกร้าตลาด
(Market Basket Analysis) ดังรูปท่ี 3.1 ที่ลูกค้าจะมีพฤติกรรมการซ้ือท่ีแตกต่างกัน และผู้บริหาร
ต้องการวิเคราะห์ข้อมูลการซื้อหรือขายสินค้าท่ีเกิดขึ้นพร้อมกันหรือไม่พร้อมกัน ในการวิเคราะห์นั้น
ผู้บริหารต้องการทราบพฤติกรรมการซ้ือขายท่ีไม่เจาะจงกับลูกคา้ คนใดคนหนึ่ง ลกั ษณะสนิ ค้าที่ถูกซื้อ
และขายคู่กัน รวมถึงการซื้อขายท่ีแตกต่างกับสินค้าอื่น เพ่ือนาความสัมพันธ์ท่ีได้ไปช่วยในการจัดวาง
ผังสินค้าเพื่ออานวยความสะดวกในการหยิบสินค้าที่ลูกค้ามักจะซ้ือด้วยกัน เช่น ลูกค้าท่ีซื้อผ้าอ้อม
ส่วนใหญจ่ ะซอื้ เบียร์ดว้ ย ดงั นัน้ สนิ คา้ สองรายการนกี้ จ็ ะวางอยใู่ กลก้ ัน

รูปท่ี 3.1 การวเิ คราะห์ตะกร้าตลาด [2]

การวิเคราะห์ตะกร้าตลาดจะใช้เทคนิคกฎการทาเหมืองความสัมพันธ์ (Association Mining
Rule) เพื่อค้นหากฎและวิเคราะห์ความสัมพันธ์ระหว่างรายการ (Items) ซ่ึงอยู่ในรูปของเซตรายการ
สนิ ค้า

ดร. ภาสพิชญ์ ชใู จ 23

บทท่ี 3 การหากฎความสัมพนั ธ์ของข้อมลู

การทาเหมืองความสัมพนั ธ์ คือ การไดม้ าซ่ึงกฎความสัมพนั ธ์โดยเปน็ การหารูปแบบทเี่ กดิ ขึ้น
บอ่ ยคู่กัน เรยี กวา่ Frequent Pattern และความสมั พนั ธท์ ีเ่ กิดข้นึ เรียกวา่ Association ของกลุ่ม
รายการจากขอ้ มูลท่อี ยู่ในรูป Transaction

รปู แบบของกฎความสัมพันธ์ (Association Rule) ทีไ่ ด้จากความสมั พันธ์ของสนิ คา้ ทลี่ ูกคา้ ซอ้ื
คอื

item1 → item2
[support, confidence]

โดย item1 และ item2 คือรายการสนิ ค้าซึง่ อาจจะเปน็ สินค้ารายการเดียวหรอื มากกว่าหนึง่
รายการก็ได้

เช่น ผา้ อ้อม -> เบยี ร์ [50%, 100%] หมายความว่า 50% ของจานวนรายการท้ังหมดลูกคา้ จะ
ซอ้ื ผา้ อ้อมและเบยี ร์พรอ้ มกนั และความเป็นไปได้ทล่ี ูกซ้ือผ้าออ้ มจะซื้อเบยี รไ์ ปด้วยทุกคร้ังเป็น 100%

ประเภทรูปกฎการทาเหมืองความสัมพนั ธ์
 แบบ Single-dimensional association rules
เช่น computer → software [support = 1%, confidence = 50%]

 แบบ Multidimensional association rule
เชน่ Computer, Book → software [support = 5%, confidence = 80%]

ตัวอยา่ งของการเขียนกฎความสัมพนั ธ์
เช่น บรษิ ัทแหง่ หนึ่งมีบรกิ ารตรวจรับรถ ลา้ งอดั ฉีด ขายอุปกรณ์ตกแตง่ รถ เป็นตน้ จากการทา

เหมอื งกฎความสัมพันธ์ ได้กฎดงั ตอ่ ไปนี้ คือ
“ลูกค้าที่มาชอบรบั บริการตรวจรถและมกี ารซ้อื อุปกรณต์ กแต่งรถเท่ากับ 30%” สามารถ

เขียนกฎความสมั พันธไ์ ด้เปน็

รับบริการตรวจรถ → ซ้ืออุปกรณต์ กแตง่ รถ
[30%, confidence]

กฎซึ่งแสดงความสัมพันธ์ระหว่างรายการของการซื้อสินค้าของร้านค้าแห่งหน่ึงท่ีพบว่าลูกค้า
อายุ 20 ถึง 29 ปแี ละรายไดป้ ระมาณ 20,000 ถงึ 29,000 ชอบซื้อ CD player 2% สามารถเขยี นกฎ
ความสัมพนั ธ์ได้เป็น

ดร. ภาสพชิ ญ์ ชใู จ 24

บทที่ 3 การหากฎความสัมพันธข์ องข้อมูล

age(X, “20..29”) ∧ income (X, “20K..29K”) → buys (X, “CD player”)
[2%, confidence]

3.4 แนวคดิ พนื้ ฐานของกฎความสมั พันธ์

กาหนดให้ T เป็นเซตของรายการ (Transaction) และแตล่ ะรายการประกอบด้วยเซตของ
รายการสินค้า (Itemset) I จานวน m รายการ I = {i1,i2,…,im}

รูปแบบกฎความสมั พนั ธ์ → โดยท่ี ⊂ , ⊂ และ ∩ = ∅
นิยามศพั ท์ที่ใชใ้ นการหากฎความสัมพนั ธ์
Itemsets คอื เซตของรายการสินคา้
k-itemsets คือ เซตของรายการสนิ ค้าจานวน k รายการ
Frequent itemsets คือ เซตของรายการสนิ ค้าทม่ี ีค่าสนับสนนุ (Support) มากกว่าหรือ
เทา่ กับค่าสนับสนนุ ข้ันต่าที่กาหนด (Minimum Support Threshold: min_sup)

กฎความสมั พนั ธ์ที่ตอ้ งการคือ กฎความสัมพนั ธท์ ่ีมีค่าสนบั สนนุ มากกว่าหรือเท่ากบั ค่าสนับสนุน
ขน้ั ตา่ และมีความความเชื่อม่นั (Confidence) มากกว่าหรอื เท่ากับคา่ ความเชอื่ มั่นขั้นตา่ ท่กี าหนด
(Minimum Confidence Threshold : min_conf)

ค่าสนับสนุน คอื ความน่าจะเปน็ ของการซอื้ สิ่งหน่งึ (A) เม่อื เทยี บกับจานวน Transaction
ทัง้ หมด

( ) = จานวน ท่ีปรากฎรายการ
จานวน ท้งั หมด

คา่ ความเชื่อม่ัน คือ ตวั วัดประสทิ ธิภาพของกฎความสัมพันธ์ (Association rule) ที่บอกความ
นา่ จะเป็นเมื่อซื้อสงิ่ หนง่ึ (A) แลว้ จะซื้ออกี ส่ิงหนงึ่ (B) ด้วย

( → ) = ( ∩ ) = จานวน ที่ปรากฎรายการ และ
( ) จานวน ท่ปี รากฎรายการ

ขั้นตอนการหากฎความสัมพันธ์
มี 2 ขั้นตอน คือ
1. คน้ หารายการข้อมลู ที่เกดิ ขน้ึ บ่อยทง้ั หมดก่อน (Find all frequent itemsets)

ดร. ภาสพชิ ญ์ ชูใจ 25

บทท่ี 3 การหากฎความสมั พันธข์ องขอ้ มลู

2. สร้างกฎความสมั พนั ธท์ แี่ ขง็ แกรง่ จากรายการข้อมูลท่ีเกิดขึ้นบ่อย (Generate strong
association rules from the frequent itemsets) ท่ีได้จากข้อท่ี 1 โดยกฎท่ีได้นน้ั จะต้อง
ผ่านเกณฑ์ของค่าสนบั สนุนและค่าความเช่อื มนั่ ทกี่ าหนด

ตวั อยา่ ง 3.1 การหากฎความสัมพนั ธ์ของข้อมูลการซอ้ื สินค้าซึง่ มีรายละเอียดการซื้อดังตารางท่ี 3.1

ตารางท่ี 3.1 รายละเอียดขอ้ มลู การซ้ือสนิ ค้า

หมายเลข Transaction รายการสนิ คา้ ท่ซี ื้อ
10 Apple, Beer, Cereal, Diapers
20 Apple, Beer, Diapers, Eggs
30 Beer, Eggs

จานวนรายการซ้อื สินค้าจากตารางที่ 3.1 มที ้ังหมด 3 รายการ (Transaction) และมีสินค้าเพียง
5 ชนดิ เท่าน้ัน คือ Apple, Beer, Cereal, Diapers และ Eggs จากข้อมูลดังกล่าวสามารถแปลงขอ้ มลู
ใหอ้ ยใู่ นรูปตารางความถ่ขี องการซื้อสนิ ค้าพร้อมกันได้ดังตารางที่ 3.2 ซ่งึ ตารางนี้จะแสดงความถ่ีของ
การซอ้ื สินคา้ พร้อมกนั ได้สงู สุดเพยี ง 2 ชนิดเทา่ น้ัน โดยขอ้ มูลตัวเลขสแี ดงจะหมายถึง ความถข่ี องการ
ซอ้ื สนิ ค้าเพียงรายการเดียว เชน่ Apple มีความถเ่ี ทา่ กบั 2 เม่ือทาการตรวจสอบจากรายการ
Transaction ท้ังหมดจะพบว่า มีการซื้อสนิ คา้ ชนิดนที้ ี่ Transaction หมายเลข 10 และ 20 สาหรับ
ความถข่ี องการซื้อสนิ ค้าพร้อมกัน 2 ชนิด เช่น ซ้ือ Apple และ Beer จะปรากฎการซื้อสินค้าสองชนดิ
นี้พร้อมกนั ที่ Transaction หมายเลข 10 และ 20 ดงั น้นั ความถ่จี ะมีค่าเทา่ กับ 2

ตารางท่ี 3.2 ความถ่ขี องการเกิดข้อมูลจากรายการ Transaction

Product Apple Beer Cereal Diapers Eggs
2
Apple 2

Beer 2 3

Cereal 1 1 1

Diapers 2 2 1 2

Eggs 1 2 0 1

สาหรับข้ันตอนการหากฎความสัมพันธ์จะเริ่มต้นจากการค้นหารายการข้อมูลท่ีเกิดข้ึนบ่อย
ทัง้ หมดกอ่ น (Find all frequent itemsets) จากนนั้ นาข้อมูลท่ีผ่านเกณฑ์ของคา่ สนับสนนุ ขัน้ ต่าและ
คา่ ความเชอ่ื มนั่ ขนั้ ต่าทก่ี าหนดมาทาการสร้างกฎความสมั พันธ์ รายละเอยี ดข้นั ตอนการทางานมดี ังนี้

ดร. ภาสพิชญ์ ชใู จ 26

บทที่ 3 การหากฎความสมั พันธ์ของข้อมลู

1. ค้นหารายการข้อมูลทเ่ี กิดข้นึ บอ่ ยท้ังหมดก่อน
ในขนั้ ตอนนจ้ี ะทาการคน้ หารายการข้อมลู ท่ีเกดิ ข้ึนต้ังแต่ 1 รายการ (1-itemsets) ไปจนถงึ k-
itemsets ในทน่ี ีม้ ีสนิ ค้า 5 รายการ ดงั น้ัน k จะเปน็ 5 โดย itemsets เหลา่ นั้นจะต้องมคี า่ สนับสนุน
มากกว่าหรือเทา่ กับค่าสนับสนุนข้ันต่า (min_sup) สาหรบั ตวั อยา่ งนีจ้ ะกาหนดค่า min_sup ท่ี 2 หรอื
0.67
Generate 1-itemset

Apple มคี า่ support = 2 หรอื 2/3 = 0.67
Beer มีค่า support = 3 หรอื 3/3 = 1.00
Cereal มคี ่า support = 1 หรอื 1/3 = 0.33
Diapers มีค่า support = 2 หรือ 2/3 = 0.67
Eggs มคี ่า support = 2 หรือ 2/3 = 0.67

จากการคน้ หารายการข้อมูลที่เกิดขน้ึ ปรากฏว่า มีสินค้าที่มีค่าสนบั สนุนตา่ กวา่ คา่ สนับสนุนขนั้
ต่าเพยี งรายการเดียว คอื Cereal

Generate 2-itemset มีค่า support = 2 หรอื 2/3 = 0.67
มคี ่า support = 1 หรอื 1/3 = 0.33
{Apple,Beer} มีค่า support = 2 หรอื 2/3 = 0.67
{Apple,Cereal} มคี า่ support = 1 หรอื 1/3 = 0.33
{Apple,Diapers} มีค่า support = 1 หรอื 1/3 = 0.33
{Apple,Eggs} มีค่า support = 2 หรอื 2/3 = 0.67
{Beer,Cereal} มีค่า support = 2 หรอื 2/3 = 0.67
{Beer,Diapers} มคี ่า support = 1 หรือ 1/3 = 0.33
{Beer,Eggs} มีคา่ support = 0 หรอื 0/3 = 0.00
{Cereal,Diapers} มีคา่ support = 1 หรอื 1/3 = 0.33
{Cereal,Eggs}
{Diapers,Eggs}

จากการค้นหารายการขอ้ มลู เมอื่ ซ้ือสองรายการพรอ้ มกันปรากฎว่า มีสนิ คา้ ทซี่ ้ือพรอ้ มกัน
มากกว่าหนึง่ รายการที่มีค่าสนับสนุนต่ากวา่ ค่าสนบั สนุนขน้ั ต่า คือ {Apple,Cereal} {Apple,Eggs}
{Beer,Cereal} {Cereal,Diapers} {Cereal,Eggs} และ {Diapers,Eggs}

ดร. ภาสพิชญ์ ชูใจ 27

บทที่ 3 การหากฎความสมั พันธ์ของขอ้ มลู

Generate 3-itemset

{Apple,Beer,Cereal} มีคา่ support = 1 หรือ 1/3 = 0.33
{Apple,Beer,Diapers} มีค่า support = 2 หรอื 2/3 = 0.67
{Apple,Beer,Eggs} มคี า่ support = 1 หรอื 1/3 = 0.33
{Apple,Cereal,Diapers} มีคา่ support = 1 หรือ 1/3 = 0.33
{Apple,Cereal,Eggs} มีค่า support = 0 หรือ 0/3 = 0.00
{Apple,Diapers,Eggs} มคี า่ support = 1 หรือ 1/3 = 0.33
{Beer,Cereal,Diapers} มคี ่า support = 1 หรอื 1/3 = 0.33
{Beer,Cereal,Eggs} มคี า่ support = 0 หรือ 0/3 = 0.00
……
{Cereal,Diapers,Eggs} มีค่า support = 0 หรอื 0/3 = 0.00

จากการค้นหารายการข้อมลู เมอื่ ซื้อสามรายการพร้อมกนั ปรากฎว่า จานวนสนิ คา้ ที่ซือ้ พร้อมกัน
ไม่ผ่านเกณฑ์คา่ สนับสนนุ เพิม่ ขึน้ (รายการที่เนน้ ข้อความเป็นสแี ดง)

Generate 4-itemset หรือ 1/3 = 0.33
หรอื 0/3 = 0.00
{Apple,Beer,Cereal,Diapers} มีค่า support = 1 หรือ 0/3 = 0.00
{Apple,Beer,Cereal,Eggs} มีค่า support = 0
{Beer,Cereal,Diapers,Eggs} มคี ่า support = 0

จากการคน้ หารายการขอ้ มลู เมอ่ื ซื้อสรี่ ายการพร้อมกนั ปรากฎวา่ ไมม่ รี ายการสนิ ค้าที่ผา่ น
เกณฑ์ค่าสนบั สนนุ เพ่ิมข้ึน (รายการทมี่ ีสีแดง)

Generate 5-itemset
{Apple,Beer,Cereal,Diapers,Eggs} มีค่า support = 0 หรือ 0/3 = 0.00
จากการค้นหารายการขอ้ มูลเมือ่ ซ้ือหา้ รายการพร้อมกนั ปรากฎว่า ไมม่ ีรายการสนิ คา้ ทีผ่ ่าน

เกณฑ์ค่าสนับสนุนเพิ่มขนึ้ (รายการที่มสี แี ดง)

ดร. ภาสพชิ ญ์ ชูใจ 28

บทท่ี 3 การหากฎความสมั พันธ์ของข้อมลู

2. สรา้ งกฎความสัมพนั ธ์
สาหรบั ขัน้ ตอนนจี้ ะทาการสร้างกฎความสมั พนั ธ์ โดยพิจารณาข้อมูลจากขั้นตอนที่ 1 ทม่ี ีการซอื้
สนิ ค้าพรอ้ มกันตั้งแต่ 2-itemsets ไปจนถึง k-itemsets ดว้ ยการคดั เลือกเฉพาะรายการที่ผ่านเกณฑ์
ค่าสนบั สนุนข้นั ต่าเท่านนั้ และคัดเลอื กกฎท่ผี า่ นเกณฑ์ค่าความเชื่อมนั่ ขั้นต่า (ในที่นี้กาหนด min_conf
ท่ี 80%) ไปใชเ้ ท่าน้ัน
รายการ {Apple,Beer} ทมี่ คี ่าสนบั สนุนเปน็ 2 (0.67) นาข้อมูลน้มี าทาการสรา้ งกฎ
1. Apple -> Beer คา่ ความเชอื่ ม่ัน = 2/2 = 1 (100%) กฎนี้จะถูกคดั เลือกไปใช้
2. Beer -> Apple ค่าความเชื่อม่นั = 2/3 = 0.67 (67%) กฎน้ีจะตดั ทงิ้

รายการ {Apple,Beer,Diapers} ทีม่ คี ่าสนับสนุนเปน็ 2 (0.67) นาข้อมลู นม้ี าทาการสร้างกฎ
1. Apple -> {Beer, Diapers} คา่ ความเชื่อมั่น = 2/2 = 1 (100%) กฎนจี้ ะถูกคัดเลือก
2. Beer -> {Apple,Diapers} คา่ ความเชอื่ มั่น = 2/3 = 0.67 (67%) กฎนจ้ี ะตัดท้ิง
3. Diapers -> {Apple,Beer} ค่าความเชอ่ื ม่นั = 2/2 = 1 (100%) กฎนี้จะถูกคัดเลือก
4. {Apple,Beer} -> Diapers คา่ ความเชื่อม่ัน = 2/2 = 1 (100%) กฎนจี้ ะถกู คดั เลอื ก
5. {Apple,Diapers} -> Beer ค่าความเชื่อม่นั = 2/2 = 1 (100%) กฎนจี้ ะถูกคัดเลือก
6. {Beer,Diapers} -> Apple ค่าความเชือ่ มัน่ = 2/2 = 1 (100%) กฎนีจ้ ะถกู คัดเลอื ก

จากตวั อย่างจะพบวา่ กฎทผ่ี ่านเกณฑ์ค่าความเช่อื มั่นขน้ั ตา่ เท่านั้นที่ถูกคัดเลือกไปใช้ เชน่
{Apple, Beer} -> Diapers [support = 67%, confidence = 100%]
ซง่ึ หมายความวา่ 67% ของจานวนรายการทัง้ หมดลกู ค้าจะซื้อแอปเป้ิล เบยี ร์ และผา้ อ้อม
(Apple, Beer และ Diapers) พร้อมกนั และความเป็นไปได้ท่ลี กู ซื้อแอปเป้ลิ และเบียร์แล้วจะซอื้
ผ้าอ้อมไปด้วยทุกครง้ั เป็น 100%

3.5 การหากฎความสมั พันธด์ ว้ ยวิธี Apriori

ในปี ค.ศ. 1994 R. Agrawal และ R. Srikant ไดน้ าเสนออัลกอริทึม Apriori เพ่ือนาไปใช้ในการ
หาความถี่ของการเกดิ รายการ หรือรายการท่ีเกิดข้ึนบ่อย (Frequent Itemsets) ซ่ึงพื้นฐานของ
อลั กอริทมึ นม้ี าจากการนาความรู้ก่อนหน้า (Prior Knowledge) ของรายการทเี่ กิดข้นึ บอ่ ยมาใชเ้ พ่ือหา
รายการท่เี กิดขึน้ บ่อยในระดับถัดไป หรือใช้ข้อมลู ท่ี k-itemsets เพื่อหาขอ้ มลู ท่ี (k+1)-itemsets

อัลกอริทึม Apriori จะเร่ิมต้นจากการหา (Scan) ข้อมูลรายการสง่ิ ของ (Items) ที่เกดิ ขน้ึ จาก
ฐานขอ้ มูล โดยเร่ิมจากหนึ่งรายการ (1-itemsets) ดว้ ยการนับความถ่ีหรือจานวนของแตล่ ะรายการ
สง่ิ ของ เพ่อื หารายการส่งิ ของที่ผ่านเกณฑ์ค่าสนบั สนนุ ข้ันต่า (min_sup) ผลลัพธท์ ี่ได้จะอยใู่ นรปู ของ

ดร. ภาสพชิ ญ์ ชูใจ 29

บทที่ 3 การหากฎความสมั พันธข์ องข้อมลู

เซตส่ิงของ (Itemsets) สมมติเปน็ เซตของ L1 จากนัน้ นาข้อมลู ในเซต L1 ไปหาเซตของ L2 ซง่ึ เซตของ
L2 จะเป็น 2-Itemsets ท่ีผ่านเกณฑส์ นบั สนุนขั้นต่าเชน่ กนั จากนน้ั นาเซตของ L2 ไปหาเซตของ L3 ซง่ึ
เซตของ L3 จะเปน็ 3-Itemsets ทีผ่ ่านเกณฑ์สนบั สนุนขนั้ ต่าเช่นเดียวกัน และทาเชน่ นี้ไปจนกระทัง่ ไม่
สามารถหา Frequent k-Itemsets ได้

ในการหาแตล่ ะเซตของ Lk จาเป็นจะต้องอ่านข้อมลู ท้ังหมดจากฐานข้อมลู สง่ ผลให้เสียเวลา
เพ่ือปรับปรุงประสทิ ธภิ าพของการหา Frequent Itemsets (ขั้นตอนที่ 1) ก็จะนาอลั กอริทึม Apriori
เขา้ มาช่วยเพื่อชว่ ยลดจานวนครัง้ ในการค้นหาข้อมูลในแตล่ ะเซต

สาหรับการลดจานวนครง้ั ของการค้นหา Frequent Itemsets ของอลั กอริทึม Apriori นั้น จะ
มีการนา Apriori Property เข้ามาใช้ โดย Apriori Property จะถูกกลา่ วไว้ว่า สับเซต (Subset)
ทั้งหมดที่ไม่เป็นเซตว่างของ Frequent Itemsets จะต้องเป็น Frequent เชน่ ถ้า {X,Y} เป็น
Frequent Itemsets แล้ว {X} และ {Y} จะต้องเปน็ Frequent Itemsets ทัง้ คู่ แต่ถ้า {X} หรือ {Y}
ตัวใดตัวหน่งึ ไม่เป็น Frequent Itemsets แลว้ จะปรากฏวา่ {X,Y} ก็จะไมเ่ ป็น Frequent Itemsets
ด้วย

กระบวนการของการนา Apriori Property มาใชใ้ นอลั กอริทึม คือการใช้ Lk-1 (Frequent ของ
(k-1) Itemsets) เพือ่ หา Lk (Frequent ของ k- itemsets) เม่ือ k >= 2 ซง่ึ จะมีการทางานหลกั ๆ อยู่
2 ขนั้ ตอน คือ ขนั้ ตอนการเช่อื ม (Join) และข้ันตอนการตัด (Prune)

1. ขัน้ ตอนการ Join
ในการสร้างเซต Lk ซ่งึ เป็นเซตของค่แู ข่ง (Candidate) k-Itemsets หรือ Ck นนั้ จะพจิ ารณา
ขอ้ มูลของ Lk-1 ถา้ สมาชกิ k-2 ตัวแรกของ Lk-1 มีค่าเหมือนกนั จะนาสมาชิกในเซตของ Lk-1 มาเชือ่ มต่อ
กัน เช่น ถา้ k=3 จะสร้างเซตของ C3 ไดจ้ ากการนาข้อมลู ที่อยใู่ นเซต L3-1 หรือ L2 มาเช่ือมต่อกัน โดย
จะเชอ่ื มต่อกนั ได้กต็ ่อเมอ่ื มสี มาชกิ 3-2 ตัวแรก หรอื มี 1 รายการทเี่ หมือนกนั ถ้า k=4 จะสร้างเซตของ
C4 ได้จากการนาข้อมลู ท่ีอยู่ในเซต L4-1 หรือ L3 มาเชอ่ื มตอ่ กัน โดยจะเชื่อมต่อกนั ได้ก็ต่อเมื่อมีสมาชิก
4-2 ตัวแรก หรือมี 2 รายการแรกทเี่ หมือนกนั เป็นตน้
2. ขน้ั ตอนการ Prune
นับความถีข่ องสมาชกิ แต่ละตัวใน Ck ดว้ ยการอา่ นคา่ จากฐานขอ้ มลู เพื่อตรวจสอบวา่ เปน็
Frequent หรือไม่ ในกรณีจะเสยี เวลาในการอา่ นข้อมูลจากฐานขอ้ มลู มากถ้า Ck มขี นาดใหญ่ ดังนัน้
นา Apriori Property มาใชเ้ พอ่ื ลดขนาดของ Ck กอ่ นทจ่ี ะอา่ นค่าจากฐานข้อมลู โดยพิจารณาวา่ ถ้า
(k-1)-subset ใดของ Ck ทไ่ี ม่ไดอ้ ยู่ใน Lk-1 แล้ว k-itemsets ที่มี (k-1)-subset จะไม่เป็น Frequent
ด้วย สง่ ผลใหส้ มาชิกดังกล่าวถูกตัดออกจาก Ck เช่น ถา้ {X,Y} ไมเ่ ป็น Frequent แล้วจะสง่ ผลให้
{X,Y,Z} ไมเ่ ป็น Frequent ดว้ ย เพราะ {X,Y} เป็นสบั เซตของ {X,Y,Z} ซงึ่ การกระทาดังกล่าวจะชว่ ย
ลดขนาดของ Ck ส่งผลใหท้ างานไดเ้ ร็วข้ึน

ดร. ภาสพชิ ญ์ ชใู จ 30

บทที่ 3 การหากฎความสัมพันธ์ของขอ้ มลู

ตวั อย่างการคน้ หาเซตรายการท่ีเกดิ ข้นึ ดว้ ยอัลกอริทมึ Apriori แสดงดงั รูปที่ 3.2 โดยมีรายการ
3 รายการ คือ a, b และ c ซง่ึ กาหนดให้รายการ c มีคา่ สนบั สนนุ น้อยกวา่ คา่ สนบั สนุนขนั้ ตา่ ผล
สุดทา้ ยรายการอ่ืน ๆ ที่เกดิ ขึ้นพร้อมกนั กับรายการ c (ตง้ั แต่ 2-Itemsets ถึง k-Itemsets) กจ็ ะถูกตดั
ออก ไมน่ ามาพิจารณาไปโดยปรยิ าย

ก. รายการต้ังตน้ ตั้งแต่ 1-itemset ถงึ k- ข. กาหนดคา่ threshold ของ min_sup

itemset (k=3) และสมมติให้ c มีค่า support = 30%

ค. รายการ c ไมผ่ า่ นคา่ min_sup ง. รายการ b ทจี่ บั คกู่ ับรายการ c กจ็ ะไม่
ผ่านคา่ min_sup ด้วย

จ. รายการ a ทจี่ บั คูก่ บั รายการ c ก็จะไม่ ฉ. รายการ a และ b ทจี่ บั คู่กับรายการ c

ผา่ นค่า min_sup ด้วย ก็จะไมผ่ า่ นค่า min_sup ดว้ ย

รูปที่ 3.2 การคน้ หารายการท่ีเกิดขนึ้ บ่อยด้วยวธิ ี Apriori

จากรปู ที่ 3.2 จะปรากฏว่ารายการทผี่ ่านเกณฑ์ค่าสนับสนุนขนั้ ตา่ คือ รายการ a และ b และ
Frequent Itemsets ทไ่ี ด้จะเป็นระดบั 2-itemsets ซง่ึ มีเพียง 1 สมาชกิ เท่านน้ั คอื {ab}

ดร. ภาสพิชญ์ ชูใจ 31

บทที่ 3 การหากฎความสมั พนั ธข์ องขอ้ มลู

สาหรับการหากฎความสัมพันธ์ระหว่างข้อมูลด้วยอัลกอริทึม Apriori นั้นจะมีท้ังข้อดีและ
ขอ้ เสียดงั นี้

ขอ้ ดี
ช่วยให้ทราบพฤติกรรมของเป้าหมายได้ โดยอัลกอริทึมนี้จะเช่ือมความสัมพันธ์ของเหตุการณ์
แล้วคัดกรองและวิเคราะห์ข้อมูลตามความสัมพันธ์ของเป้าหมายได้อย่างน่าเชื่อถือและสามารถ
นาไปใช้ได้จรงิ
ข้อเสีย
ถ้าฐานข้อมูลมีการเปลี่ยนแปลงจะไม่สามารถนากฎความสัมพันธ์ของข้อมูลก่อนหน้าไปใช้
ประโยชน์ได้ ส่งผลให้เสียเวลาในการทางานเนื่องจากจาเป็นต้องนาข้อมูลทั้งหมดมารวมกันก่อนแล้ว
จงึ จะสามารถนาข้อมลู เหลา่ น้ันไปคน้ หากฎความสมั พันธใ์ หม่

3.6 ตวั อยา่ งการหากฎความสัมพันธ์ด้วยวิธี Apriori [3]

ตัวอยา่ ง 3.2 หากฎความสมั พันธ์ของรายการสินคา้ ที่กาหนดในตารางที่ 3.3 เมื่อกาหนดคา่ สนบั สนุน
ขนั้ ตา่ (min_sup) เปน็ 2 (50%) และคา่ ความเช่อื มั่นขน้ั ต่า (min_conf) เป็น 3 (75%)

ตารางท่ี 3.3 ตัวอย่างรายการสนิ คา้ ที่ลกู คา้ ซอ้ื
หมายเลข Transaction รายการสินคา้ ทีซ่ ้ือ
10 A, C, D
20 B, C, E

30 A, B, C, E
40 B, E

ขน้ั ตอนการหาความสัมพันธข์ องข้อมูลดว้ ยอัลกอริทึม Apriori มดี งั ต่อไปน้ี
ขนั้ ตอนที่ 1 ค้นหารายการข้อมลู ทเี่ กดิ ข้ึนบ่อยทั้งหมดก่อน (Find all frequent itemsets)

ในข้นั ตอนน้เี ปน็ การหาความถ่ขี องรายการสนิ ค้าที่เกิดขน้ึ บ่อยตัง้ แตร่ ายการเดยี วจนถึง k
รายการ รายละเอยี ดการทางานนี้มดี ังน้ี
1st Step ค้นหารายการซ้ือสินคา้ ท่เี กิดขึน้ บ่อยเพียงรายการเดียว (1-itemset)

ในขั้นตอนนีจ้ ะเรม่ิ ต้นจากค้นหารายการซอ้ื สินค้าทเี่ กดิ ข้ึนบ่อยเพยี งรายการเดียวก่อน (1-
Itemsets) หรือหา Frequent 1-itemsets ของ L1 โดยพิจารณาจากข้อมูลใน Candidate 1-
itemsets หรือข้อมลู ใน C1 ด้วยการอา่ นค่าจากฐานข้อมลู เพื่อนับความถ่ีของ 1-itemsets ใน C1

ดร. ภาสพิชญ์ ชูใจ 32

บทที่ 3 การหากฎความสัมพนั ธข์ องข้อมูล

จากนั้นนาค่าสนับสนุน (Support) ท่ีนบั ได้ใน 1-itemsets ไปเทียบกบั คา่ สนับสนนุ ข้ันต่าที่กาหนดไว้
ถา้ รายการใดใน 1-itemsets ผา่ นเกณฑ์ค่าสนบั สนุนขนั้ ตา่ จะเรยี กว่า Frequent 1-itemsets (L1) ดงั
รปู ที่ 3.3

รปู ท่ี 3.3 ข้อมลู Candidate 1-itemsets (C1) และ Frequent 1-itemsets (L1)

ขอ้ มูลในรปู 3.3 ตาราง C1 จะแสดง 1-itemsets และความถ่ีทีเ่ กิดขึน้ ในแต่ละรายการข้อมูล
เชน่ รายการ A จะปรากฏอยู่ท้งั หมด 2 ทรานแซคชัน คือ Tid ท่ี 10 และ 30 รายการ B จะปรากฏอยู่
ทัง้ หมด 3 ทรานแซคชนั คือ Tid ที่ 20 30 และ 40 จากนั้นนาความถข่ี องแต่ละรายการใน ตาราง C1
ไปเปรยี บเทยี บกับคา่ สนบั สนุนขน้ั ตา่ ทีก่ าหนดวา่ ผา่ นเกณฑ์หรอื ไม่ เพ่ือสรา้ งตาราง L1 จากตัวอยา่ ง
กาหนดคา่ สนับสนนุ ขน้ั ต่าเปน็ 2 ทรานแซคชันหรอื 0.5 (50%) ในขนั้ ตอนน้ีจะเกิดการตดั (Prune) ขึ้น
โดยรายการ D จะถูกตดั ออกจากฐานขอ้ มูล ส่วนรายการอ่ืน ๆ ทเ่ี หลือจะเป็น Frequent-1-itemsets
เนอ่ื งจากมคี ่าสนบั สนุนขนั้ ต่ามากกวา่ หรือเทา่ กับ 2

2nd Step ค้นหารายการซื้อสินค้าท่ีเกิดขนึ้ บ่อยสองรายการพรอ้ มกัน (2-itemset)
ในข้นั ตอนนจี้ ะค้นหารายการซ้อื สินคา้ ที่เกิดขน้ึ บ่อยสองรายการพร้อมกนั (2-Itemsets) หรือ

หา Frequent 2-itemsets ของ L2 โดยพิจารณาจากขอ้ มูลใน Candidate 2-itemsets หรือขอ้ มลู ใน
C2 ขอ้ มูลในตาราง C2 ถกู สร้างข้นึ มาจากการเชื่อม (Join) ข้อมลู ในตาราง L1 (จากข้ันตอนที่ 1) เมื่อได้
C2 แลว้ จะมีการอา่ นคา่ เพือ่ นับความถข่ี อง 2-Itemsets ใน C2 จากน้ันนาคา่ สนับสนนุ (Support) ที่
นบั ไดใ้ น 2-itemsets ไปเทียบกับคา่ สนบั สนนุ ข้ันต่าท่ีกาหนดไว้ ถ้ารายการใดใน 2-itemsets ผา่ น
เกณฑ์คา่ สนบั สนนุ ข้นั ต่าจะเรียกวา่ Frequent 2-itemsets (L2) ดังรูปท่ี 3.4

ดร. ภาสพิชญ์ ชใู จ 33

บทที่ 3 การหากฎความสัมพันธข์ องข้อมูล

รูปที่ 3.4 ข้อมูล Candidate 2-itemsets (C2) และ Frequent 2-itemsets (L2)

ข้อมลู ในรูป 3.4 ตาราง C2 จะแสดง 2-itemsets และความถ่ที เี่ กิดขึน้ ในแตล่ ะรายการข้อมลู
เชน่ รายการ A และ B ทเี่ กิดขนึ้ พร้อมกนั จะปรากฏเพยี ง 1 ทรานแซคชัน คือ Tid ที่ 30 ในขณะที่
รายการ A และ C ท่เี กิดขึน้ พรอ้ มกนั จะปรากฏ 2 ทรานแซคชัน คือ Tid ท่ี 10 และ 30 จากน้นั นา
ความถี่ของแตล่ ะรายการใน ตาราง C2 ไปเปรียบเทยี บกับค่าสนับสนุนขัน้ ตา่ ที่กาหนดว่าผา่ นเกณฑ์
หรือไม่ เพ่ือสร้างตาราง L2 ในขนั้ ตอนนจ้ี ะเกดิ การตัด (Prune) ขึ้น โดยรายการท่ีถูกตดั ออกจาก
ฐานข้อมูล คือ รายการ {A,B} และ {A,E} ส่วนรายการอน่ื ๆ ท่เี หลอื จะเป็น Frequent-2-itemsets
เน่อื งจากมีค่าสนับสนุนขนั้ ต่ามากกว่าหรือเท่ากับ 2

3rd Step ค้นหารายการซื้อสินค้าท่ีเกิดขึน้ บ่อยสามรายการพร้อมกัน (3-itemset)
ในข้ันตอนนจี้ ะค้นหารายการซือ้ สินคา้ ที่เกิดขน้ึ บ่อยสามรายการพร้อมกัน (3-Itemsets) หรอื

หา Frequent 3-itemsets ของ L3 โดยพจิ ารณาจากขอ้ มูลใน Candidate 3-itemsets หรอื ขอ้ มลู ใน
C3 ขอ้ มูลในตาราง C3 ถูกสร้างขึน้ มาจากการเช่ือม (Join) ขอ้ มลู ในตาราง L2 (จากข้ันตอนท่ี 2) โดย
2-itemsets ท่ีนามาเช่ือมกนั นนั้ จะพิจารณาจาก k-1 รายการแรกทม่ี คี า่ เหมือนกัน ดงั นั้นที่ k=2 จะ
หมายถึงนา Frequent 2-itemsets (L2) ทมี่ หี นงึ่ รายการท่เี หมือนกนั มาเช่ือมต่อกนั เช่น {B,C}
เชอ่ื มตอ่ กบั {B,E} ได้ {B,C,E}

เม่ือได้ C3 แล้วจะมีการอา่ นค่าเพ่ือนบั ความถี่ของ 3-Itemsets ใน C3 จากนนั้ นาคา่ สนับสนุน
(Support) ท่นี ับได้ใน 3-itemsets ไปเทยี บกบั ค่าสนบั สนนุ ขั้นตา่ ทก่ี าหนดไว้ ถ้ารายการใดใน 3-
itemsets ผา่ นเกณฑ์ค่าสนบั สนนุ ขน้ั ต่าจะเรียกว่า Frequent 3-itemsets (L3) ดังรปู ท่ี 3.5

ดร. ภาสพิชญ์ ชใู จ 34

บทท่ี 3 การหากฎความสมั พนั ธข์ องข้อมลู

รปู ที่ 3.5 ข้อมูล Candidate 3-itemsets (C3) และ Frequent 3-itemsets (L3)

ข้อมลู ในรปู 3.5 ตาราง C3 จะแสดง 3-itemsets และความถ่ที ีเ่ กิดข้นึ ในแตล่ ะรายการข้อมลู
เชน่ รายการ B C และ E ทีเ่ กิดข้ึนพรอ้ มกนั จะปรากฏเพียง 2 ทรานแซคชัน คือ Tid ท่ี 20 และ 30
ในขณะทร่ี ายการอนื่ จะเกิดข้ึนพรอ้ มกนั เพยี ง 1 ทรานแซคชันเท่าน้ัน จากน้นั นาความถีข่ องแตล่ ะ
รายการใน ตาราง C3 ไปเปรยี บเทียบกบั ค่าสนบั สนนุ ขั้นตา่ ท่ีกาหนดวา่ ผา่ นเกณฑ์หรือไม่ เพือ่ สร้าง
ตาราง L3 ในข้ันตอนน้ีจะเกดิ การตัด (Prune) ขึน้ โดยรายการทถี่ ูกตดั ออกจากฐานขอ้ มูล คอื รายการ
{A,B,C} และ {A,C,E} สว่ นรายการ {B,C,E} จะเปน็ Frequent-3-itemsets (L3) เน่ืองจากมคี า่
สนับสนุนขั้นต่ามากกว่าหรอื เทา่ กบั 2

ข้ันตอนท่ี 2 สร้างกฎความสัมพันธ์ท่แี ขง็ แกรง่ จากรายการข้อมูลที่เกดิ ขึน้ บ่อย (Generate strong
association rules from the frequent itemsets)

ในขัน้ ตอนน้จี ะนารายการข้อมูลที่เกิดขึน้ บอ่ ยจากข้นั ตอนที่ 1 มาทาการสร้างกฎ โดยกฎท่ีได้
นั้นจะตอ้ งผ่านเกณฑ์ของค่าสนบั สนุนและค่าความเชอื่ ม่นั ที่กาหนด ผวู้ เิ คราะห์ขอ้ มลู จะตอ้ งพิจารณา
ว่าต้องการสร้างความสัมพันธข์ องรายการสนิ คา้ ก่รี ายการ (ตั้งแต่ 2 รายการ จนถึง k รายการทไี่ ดจ้ าก
ขนั้ ตอนท่ี 1 ในทนี่ ้ี k ที่ไดค้ ือ 3 รายการ)

กรณีพจิ ารณาความสัมพันธ์ของ 2 รายการ เช่น {A, C} สามารถสรา้ งกฎความสัมพันธ์ได้เป็น
1. A -> C [50%, 100%]
2. C -> A [50%, 66.67%]
ค่าเปอร์เซน็ ตท์ ่ีปรากฏหลังกฎความสัมพันธ์ คือ คา่ สนับสนุนและคา่ ความเชอ่ื ม่ัน ซ่งึ คานวณ
จาก ( → ) = ( ∩ ) และ ( → ) = ( ∩
)/ ( ) เนอ่ื งจากกาหนดคา่ สนบั สนนุ ข้นั ตา่ เปน็ 2 (50%) และคา่ ความเชื่อมัน่ ขนั้ ต่าเป็น 3
(75%) ดงั นัน้ กฎความสัมพันธท์ ถี่ กู คดั เลอื กคือ A -> C [50%, 100%] หมายความว่า มีลูกคา้ ซื้อสินค้า
A และ C พรอ้ มกนั อยู่ 50% ของรายการสนิ ค้าท้ังหมด และถ้าลกู คา้ ซ้ือสนิ คา้ A แล้วโอกาสทล่ี กู ค้าจะ
ซือ้ สินคา้ C ไปดว้ ยทุกครงั้ มถี ึง 100%

ดร. ภาสพิชญ์ ชใู จ 35

บทท่ี 3 การหากฎความสมั พนั ธข์ องข้อมูล

กรณีพจิ ารณาความสัมพันธ์ของ 3 รายการ คือ {B, C, E} สามารถสร้างกฎความสัมพันธ์ได้เป็น
1. B -> C, E [50%, 66.67%]
2. C -> B, E [50%, 66.67%]
3. E -> B, C [50%, 66.67%]
4. B, C -> E [50%, 100%]
5. B, E -> C [50%, 66.67%]
6. C, E -> B [50%, 100%]
กฎความสัมพันธท์ ี่ถกู คัดเลอื กคอื B, C -> E [50%, 100%] ซง่ึ หมายความว่า มลี กู คา้ ซอ้ื สินค้า
B , C และ C พร้อมกันอยู่ 50% ของรายการสินค้าท้ังหมด และถา้ ลกู ค้าซื้อสนิ คา้ B และ C แล้วโอกาส
ทีล่ กู ค้าจะซื้อสินค้า E ไปด้วยทกุ ครั้งมีถึง 100% และ C, E -> B [50%, 100%] ซึ่งหมายความว่า มี
ลูกคา้ ซื้อสนิ คา้ B , C และ E พรอ้ มกันอยู่ 50% ของรายการสนิ ค้าทง้ั หมด และถ้าลูกค้าซื้อสนิ ค้า C
และ E แลว้ โอกาสท่ลี ูกค้าจะซ้ือสินคา้ B ไปดว้ ยทุกครงั้ มีถึง 100%

3.7 แบบฝึกหดั

1. จงอธิบายหลกั การของอัลกอริทมึ Apriori และการใช้หลกั การนเ้ี พื่อลดการทางานของการ
คน้ หา Frequent Itemsets จากข้อมลู ในฐานข้อมูล

2. จงอธบิ าย Support และ Confidence
3. จงใหเ้ หตุผลวา่ ทาไมเราต้องคัดเลอื กกฎความสมั พันธท์ มี่ ีค่า Support และ Confidence

ท่ีสูง
4. กาหนดรายการซ้ือสนิ คา้ ในตารางท่ี 3.4

ตารางที่ 3.4 ตัวอย่างรายการสินค้าท่ีลกู คา้ ซอ้ื
หมายเลข Transaction รายการสินคา้ ที่ซ้ือ
1 Apple Mac, HP Printer, External HD
2 CD Writer, Mouse
3 HP Printer, CD Writer, Keyboard, Laser Pointer
4 External HD, PC, CD Writer, Keyboard, Laser Pointer

จากตาราง 3.4 ให้นักศึกษา
4.1 กาหนดค่าสนับสนุนข้ันต่าและค่าความเช่ือมนั่ ทตี่ อ้ งการ
4.2 หา Frequent itemsets ท่เี กิดข้นึ ด้วยอลั กอริทึม Apriori

ดร. ภาสพชิ ญ์ ชูใจ 36

บทที่ 3 การหากฎความสมั พนั ธข์ องข้อมลู

4.3 จากข้อมูลท่ีไดใ้ นข้อ 1.2 ใหส้ รา้ งกฎความสมั พนั ธท์ ีผ่ า่ นเกณฑ์ค่าสนับสนุนขั้นตา่ และค่า
ความเช่ือมั่นขน้ั ต่าที่กาหนด

4.4 คดั เลอื กและอธบิ ายกฎที่ไดจ้ ากข้อ 4.3

3.8 รายการอ้างอิง

1. C. C. Aggarwal, “Data Mining: The Textbook,” Springer, 2015.
2. J. Han, J. Pei, M. Kamber, “Data Mining: Concepts and Techniques,” 2012.
3. https://www.programmersought.com/article/66344388383/

ดร. ภาสพชิ ญ์ ชใู จ 37


Click to View FlipBook Version