التعليم
التنقيب في البيانات «»Data mining
فــي أيامنــا هــذه تفــرض ظــروف الحيــاة العمليــة علينــا أن نواجــه كميــات هائلــة
مـن البيانـات ,وفـي ضـوء هـذا النمـو المتسـارع للبيانـات بتنـا أمـام ظاهـرة أشـبه
بالانفجــار الكبيــر إلا أنهــا انفجــار مــن نــوع آخــر يدعــى «انفجــار البيانــات».
فــي ظــل هــذا الكــم الهائــل مــن البيانــات ظهــرت الحاجــة إلــى وجــود آليــة معينــة
نسـتطيع مـن خلالهـا التعامـل مـع هـذه البيانـات الضخمـة .ومـن هنـا نشـأ مفهـوم
التنقيــب عــن البيانــات (المعلومــات) « »Data Miningليكــون الغواصــة التــي
نستكش ـف م ـن خلاله ـا أعم ـاق بح ـر البيان ـات الكبي ـر ,إذاً ف ـي أيامن ـا ه ـذه تف ـرض ظ ـروف الحي ـاة العملي ـة علين ـا أن نواج ـه كمي ـات هائل ـة م ـن
البيانــات .إذاً مــا هــي ال Data Mining
ما هو ال « »Data Miningتنقيب البيانات
هي مجموعة من التقنيات المستخدمة من أجل اكتشاف نماذج من البيانات (معارف مفيدة) في قاعدة بيانات ضخمة وذلك بفعالية وكفاءة
عالية .أو هي عملية بحث محوسب ويدوي عن معرفة من البيانات دون فرضيات مسبقة عما يمكن أن تكون هذه المعرفة.كما ويعرف
التنقيب في البيانات على أنه عملية تحليل كمية بيانات (عادة ما تكون كمية كبيرة) لإيجاد علاقة منطقية تلخص البيانات بطريقة جديدة
تكون مفهومة ومفيدة لصاحب البيانات .يطلق اسم «نماذج» modelsعلى العلاقات والبيانات الملخصة التي يتم الحصول عليها من
التنقيب في البيانات .يتعامل تنقيب البيانات عادة مع بيانات يكون قد تم الحصول عليها بغرض غير غرض التنقيب في البيانات (مثل ًا قاعدة
بيانات التعاملات في مصرف ما) مما يعني أن طريقة التنقيب في البيانات لاتؤثر مطلق ًا على طريقة تجميع البيانات ذاتها.
عنـد التعامـل مـع حجـم كبيـر مـن البيانـات تظهـر مسـائل جديـدة مثـل كيفيـة تحديـد النقـاط المميـزة فـي البيانـات ،وكيفيـة تحليـل البيانـات
فـي فتـرة زمنيـة معقولـة وكيفيـة قـرار مـا إذا كانـت أي علاقـة ظاهريـة تعكـس حقيقـة فـي طبيعـة البيانـات .عـادة يتـم التنقيـب فـي بيانـات
تكـون جـزءاً مـن كامـل البيانـات حيـث يكـون الغـرض عـادة تعميـم النتائـج علـى كامـل البيانـات (مثـ ًا تحليـل البيانـات الحاليـة لمسـتهلكي
منتـج مـا بغـرض توقـع طلبـات المسـتهلكين المسـتقبلية).
أنواع الـ « »Data Miningتنقيب البيانات
هناك نوعان أساسيان للتنقيب في البيانات هما:
.1التنقيـب الاستشـرافي ينتـج عنـه نمـوذج عـن النظـام الـذي تصفـه البيانـات المسـتخدمة
فـي التنقيـب.
.2التنقيـب الوصفـي فينتـج عنـه معلومـات جديـدة بنـاء علـى المعلومـات الموجـودة داخـل
البيانـات المسـتخدمة فـي عمليـة التنقيـب.
أهداف ال « »Data Miningتنقيب البيانات:
هناك ثلاثة أهداف للتنقيب في البيانات:
.1مـن اجـل إختـزال كميـة البيانـات الكبيـرة أو ضغطهـا بحيـث تع ّبـر بشـكل بسـيط عـن كامـل
البيانـات بـدون تعميـم.
.2من أجل تعليل بعض الظواهر المرئية.
.3مـن أجـل التثبـت مـن نظريـ ٍة مـا مثـل التثبـت مـن النظريـة التـي تقـول بـأن الأسـر الكبيـرة
تهتـم بالضمـان الصحـي أكثـر مـن الأسـر الأصغـر عـدداً.
.4من أجل تحليل البيانات للحصول على علاقات جديدة وغير متوقعة.
طبيعة نماذج البيانات التي تسعى الـ « »Data miningلإكتشافها
تتصف البيانات بالآتي :
.1صالحة ()Valid
.2مفيدة ()Useful
.3مفهومة ()Understandable
.4مبتكرة أو غير مألوفة ()Novel
إذاً وبالرغم من وجود البيانات بصورة ضخمة ومبعثرة وعشوائية أحيان ًا تستطيع الـ Data Miningتحليل هذه البيانات (الخام) وفق خوارزميات
محددة لإستخراج المعارف والمعلومات المفيدة .
6
وسائل الـ «»Data Mining
هنـاك عـدة وسـائل مختلفـة مـن أجـل التنقيـب فـي البيانـات .اختيـار الوسـيلة المناسـبة يعتمـد علـى طبيعـة البيانـات تحـت الدراسـة وعلـى
حجمهـا .يمكـن اجـراء عمليـة التنقيـب فـي البيانـات بالمقارنـة مـع سـوق البيانـات ومخـزن البيانـات.
بعض من هذه الوسائل هي:
-الاسـتدلال المبنـي علـى حـالات سـابقة :Case-Based reasoningالتفكيـر واسـتخلاص النتائـج والقوانيـن مـن أمثلـة حيـة و قضايـا تـم حلهـا
سـابقا.
-الكشف عن قانون :Rule Discoveryالبحث عن منوال معين أو علاقة معينة في جزئية كبيرة من البيانات.
-معالجة الإشارات :Signal Processingايجاد الظواهر المتشابه مع بعضها البعض.
-شـبكات عصبونيـة :Neural Netsتطويـر نمـاذج قابلـة لتنبـؤ النتائـج .هـذه النمـاذج تـم تطويرهـا بنـاء علـى أسـس تـم اسـتنباطها مـن عقـل
الإنسان.
-منحنيات غير ثابتة :Fractalsتصغير البيانات الكبيرة من دون ضياع المعلومات.
الآليات التي تستخدمها الـ «»Data Mining
تعتمـد عمليـة التنقيـب عـن المعلومـات عـن علـى اسـتراتيجيات وطـرق مختلفـة (مهـام
مختلفـة ) مثـل التصنيـف والعنقـدة والتنبـؤ والاحتمـالات وتحليـل الارتباطـات بيـن البيانـات
بالإضافـة إلـى عمليـات البحـث ,وسـنكتفي بذكـر هـذه الطـرق في هـذا المقـال ,لكـن إن أردتم
معرفـة المزيـد عنهـا ترقبونـا فـي المقـالات القادمـة .
تطبيقات الـ «»Data Mining
وسائل التنقيب في البيانات ُتستعمل وبنجاح في الكثير من التطبيقات الحقيقة حول
العالم .التطبيقات التالية تشمل بعضا من الأمثلة:
-تحليل الاستعمال :Usage Analysis -كتابة تقرير مختصر عن فئة معينة
ايجاد منوال معين لاستعمال الخدمات :Profiling Populationsتطوير وإنشاء تقارير
والسلع. موجزة عن الزبائن المهمين وعن بطاقات
-فعالية الحملة Campaign الائتمان.
:Effectivenessمقارنة استراتيجيات
الحملات مع بعضها البعض من أجل ايجاد -تحليل النزعة التجارية Analysis of
:Business Trendايجاد الأسواق ذات قدرات
أكثرها فعالية وتأثيرا.
-جاذبية السلعة :ايجاد السلع التي تباع النمو القوية أو الضعيفة.
-التسويق لفئة معينة :Target Marketing
مع بعضها البعض. ايجاد الزبائن من أجل منح التخفيضات لهم
لسبب معين.
تطبيقات التنقيب في البيانات بدأت تنمو بصورة كبيرة للأسباب التالية:
.1كميــة البيانــات الموجــودة فــي مخــزن البيانــات وســوق البيانــات تنمــو بصــورة أســية
( )exponentialومـن أجـل ذلـك ،فـإن المسـتخدم يحتـاج إلـى أدوات متطـورة مثـل التنقيـب
فــي البيانــات مــن أجــل إســتخلاص الفائــدة والمعرفــة مــن هــذه البيانــات.
.2الكثيــر مــن أدوات التنقيــب عــن البيانــات بــدأت تظهــر مؤخــرا ،وكل أداة أفضــل مــن
الأخــرى.
.3المنافسـة الشـديدة الموجـودة فـي السـوق تدفـع الشـركات إلـى الاسـتفادة القصـوى مـن
البيانـات التـي بيدهـا ,وعمليـات التنقيـب فـي البيانـات تفعـل ذلـك تمامـ ًا.
الـ « »Data Miningفي حياتنا
مــن منــا لا يعــرف الفيســبوك!! هــل تتخيلــون حجــم البيانــات الهائــل الــذي يحملــه موقــع
التواصــل الاجتماعــي هــذا؟
هل تتصورون كم هي كبيرة البيانات الموجودة على محرك البحث العملاق غوغل!
فـي الحقيقـة أصبحـت ال Data Miningحاجـة ضروريـة لكثيـر مـن المواقـع والشـركات والمؤسسـات والمنظمـات وغيرهـا مـن الجهـات التـي
تتعامـل مـع كميـات هائلـة مـن البيانـات.
بكلمة أخيرة إن عملية التنقيب عن المعلومات باتت وسيلتنا الأساسية للتعامل مع هذا العالم الكبير الذي يعج بالبيانات .
وسل صالح الباش 7