เทคนิคการทำ เหมืองข้อมูลทางธุรกิจ BDT2107 Prepared by : รหัสหันักนัศึกษา 65444401003 นางสาวสุนิสุสนิา ขัตขัรฤกษ์
การจัดจักลุ่มลุ่แบบสุ่มสุ่ (Random Clustering) คือกระบวนการที่ใช้วิช้ธีวิกธีารสุ่มสุ่ ในการแบ่งบ่ข้อข้มูลเป็นป็กลุ่มลุ่โดยไม่มีม่ โมีครงสร้าร้ง หรือรืแบบแผนที่กำ หนดล่วงหน้าน้ให้กัห้ กับกลุ่มลุ่ในขั้นขั้ตอนแรกของการจัดจักลุ่มลุ่แบบสุ่มสุ่ ข้อข้มูลจะถูกถูสุ่มสุ่ แบ่งบ่ลงในกลุ่มลุ่ต่าง ๆ โดยไม่มีม่กมีารพิจพิารณาความคล้ายคลึงหรือรื ความแตกต่างระหว่าว่งข้อข้มูล หลังจากที่ข้อข้มูลถูกถูสุ่มสุ่ ลงในกลุ่มลุ่แล้ว กลุ่มลุ่อาจถูกถู ปรับรั ปรุงรุหรือรืผลักดันดั ให้มีห้ โมีครงสร้าร้งที่ดีขึ้ดีขึ้นขึ้ โดยใช้วิช้ธีวิกธีารปรับรั ปรุงรุแบบต่าง ๆ เช่นช่ การลดความคลาดเคลื่อนภายในกลุ่มลุ่ (within-cluster variance) หรือรืการ เพิ่มพิ่ความคลาดเคลื่อนระหว่าว่งกลุ่มลุ่ (between-cluster variance) ตาม เงื่อนไขที่กำ หนดไว้ล่ว้ ล่วงหน้าน้หรือรืการปรับรั ปรุงรุแบบอัตโนมัติมั ติามค่าทางสถิติ การจัดจักลุ่มลุ่แบบสุ่มสุ่ มักมัถูกถูใช้ใช้นการทดลองและทดสอบอัลกอริทึริ ทึมการจัดจักลุ่มลุ่การ ศึกษาคุณคุลักษณะของข้อข้มูล หรือรืการเปรียรีบเทียบผลลัพธ์ขธ์องการจัดจักลุ่มลุ่กับวิธีวิ ธี การจัดจักลุ่มลุ่อื่น ๆ แต่ไม่ไม่ด้ใด้ช้ใช้นการวิเวิคราะห์ข้ห์อข้มูลจริงริในการธุรกิจหรือรืงานวิจัวิยจัที่มี ความหมายสูงสูสุดสุ
การจัดกลุ่มแบบดีบีสแกน (DBSCAN) เป็นป็อัลกอริทึริ ทึมการจัดจักลุ่มลุ่ที่ใช้ใช้นการค้นหากลุ่มลุ่ในชุดข้อข้มูลโดยใช้คช้วามห่าห่งระหว่าว่ง ข้อข้มูลเป็นป็ตัวกำ หนด อัลกอริทึริ ทึมนี้มี นี้ คมีวามสามารถในการจัดจักลุ่มลุ่ข้อข้มูลที่มีรูมีปรูแบบที่ซับซั ซ้อซ้น โดยที่ไม่ต้ม่ ต้องระบุจำ นวนกลุ่มลุ่ล่วงหน้าน้และสามารถจัดจัการกับข้อข้มูลที่มีคมีวาม กะทัดรัดรัหรือรืมีคมีวามคลุมลุเครือรืข่าข่ยที่สูงสูอัลกอริทึริ ทึมนี้ทำ นี้ ทำงานโดยการกำ หนดข้อข้มูลลงใน กลุ่มลุ่โดยอิงจากความห่าห่งระหว่าว่งข้อข้มูล โดยมีสมีองพารามิเมิตอร์หร์ลักคือ "epsilon" (ε) ซึ่งซึ่เป็นป็ระยะห่าห่งขั้นขั้ต่ำ ที่จำ เป็นป็สำ หรับรัการพิจพิารณาว่าว่ข้อข้มูลอยู่ใยู่กล้กัน และ "min_samples" ซึ่งซึ่เป็นป็จำ นวนขั้นขั้ต่ำ ของข้อข้มูลที่ต้องอยู่รยู่อบๆ จุดใดๆ เพื่อพื่ที่จะถือว่าว่ จุดนั้นนั้เป็นป็จุดในกลุ่มลุ่ (core point) DBSCAN จะเริ่มริ่ต้นด้วด้ยการเลือกจุดใด ๆ ในชุด ข้อข้มูลเป็นป็จุดเริ่มริ่ต้น และพยายามจะขยายกลุ่มลุ่โดยการเชื่อชื่มต่อกับจุดที่อยู่ใยู่กล้เคียงโดย ใช้คช้วามห่าห่งและจำ นวนจุดที่ต้องอยู่รยู่อบๆ จุดนั้นนั้เมื่อมื่ ไม่สม่ามารถขยายกลุ่มลุ่ได้อีด้ อีกต่อไป DBSCAN จะเริ่มริ่กลุ่มลุ่ใหม่ด้ม่วด้ยจุดที่ไม่เม่ชื่อชื่มต่อกับกลุ่มลุ่ใด ๆ และทำ ซ้ำ กระบวนการนี้ จนกว่าว่จะไม่มีม่จุมีจุดใด ๆ ที่เหลือสำ หรับรัการเพิ่มพิ่กลุ่มลุ่ใหม่ DBSCAN สามารถจัดจักลุ่มลุ่ข้อข้มูลในรูปรูแบบที่ซับซัซ้อซ้นและมีคมีวามยืดยืหยุ่นยุ่และมี ประสิทสิธิภธิาพในการจัดจักลุ่มลุ่ข้อข้มูลที่มีขมีนาดใหญ่ แต่ก็มีคมีวามยืดยืหยุ่นยุ่ ในการตั้งตั้ค่า พารามิเมิตอร์ที่ร์ ที่ สำ คัญอย่าย่ง epsilon และ min_samples ซึ่งซึ่อาจมีผมีลต่อผลลัพธ์ที่ธ์ ที่ได้