نيات وتطبيقات تنقيب البيانات (DATA MINING TECHNIQUES AND APPLICATIONS)


تقنيات وتطبيقات تنقيب البيانات

أن عملية التنقيب عن البيانات هي عملية مفيدة من حيث يمكن استخراج  انماط كثيرة من البيانات. ان تطور المعلومات ادى الى ظهور كميات كبيرة من البيانات الضخمة وبتطور الوقت ظهرت تقنيات لتخزينهذه البيانات الضخمة ومن ثم معالجتها لاتخاذ القرارات المناسبة لها والحصول على المزيد من القرارات .يمكن ان نسمي عملية تنقيب البيانات هي عملية استخراج المعلومات المفيدة من البيانات الضخمة. ويمكن ان نسميها ايضآ بأنها عملية اكتشاف المعلومات ، أو التنقيب عن المعرفة من البيانات ، أو استخراج المعرفة أو تحليل البيانات .

أن عملية التنقيب عن البيانات هي عملية منطقية تقوم على استخدام البحث في بيانات كبيرة لغرض الحصول على معلومات مفيدة وبمجرد الحصول على هذه المعلومات يتم اتخاذ قراراتمبنية وفقآ لهذه المعلومات المستخرجة للاستفادة منها في تطوير العمل . تتضمن عملية تنقيب البيانات ثلاث مراحل (الاستكشاف- تحديد نمط المعلومة- النشر او اتخاذ القرار) وهذه المراحل سنتعرف على كل واحد منها بأختصار .

الاستكشاف : تمثل هذه العملية البحث في البيانات الكبيرة ثم استخراج المعلومة المفيدة بناءآ على نوع المشكلة المطلوبة

تحديد النمط: بمجرد استكشاف البيانات وصقلها وتعريفها للمتغيرات المحددة ، وهي تشكيل تحديد النمط. تحديد واختيار الأنماط التي تقدم أفضل تنبؤ.

النشر: يتم نشر الأنماط للخارج المطلوب

  تطبيقات التنقيب عن البيانات

ان الخوارزميات والتقنيات المستخدمة في تنقيب البيانات هي التصنيف والتجميع والانحدار والذكاء الاصطناعي والشبكات العصبية وقواعد الارتباط وأشجار القرار والخوارزمية الجينية وطريقة الجار الأقرب وما إلى ذلك ، لاكتشاف المعرفة من قواعد البيانات. لنتعرف على هذه الخوارزميات  التصنيف هو أكثر تقنيات التنقيب عن البيانات شيوعًا . ويستخدم هذا النهج في كثير من الأحيان شجرة القرار أو خوارزميات التصنيف القائمة على الشبكة العصبية. تستخدم بيانات اختبار التصنيف لتقدير دقة قواعد التصنيف. إذا كانت الدقة مقبولة ، يمكن تطبيق القواعد على مجموعات البيانات الجديدة.

  التجميع هو تحديد لفئات متشابهة من الكائنات يمكننا تحديد المناطق الكثيفة والمتفرقة في مساحة الكائن ويمكننا اكتشاف نمط التوزيع العام والارتباطات بين سمات البيانات. على سبيل المثال ، لتكوين مجموعة من العملاء بناءً على أنماط الشراء ، لتصنيف الجينات بوظائف مماثلة

الانحدار  يمكن استخدام تحليل الانحدار لنمذجة العلاقة بين واحد أو أكثر من المتغيرات المستقلة والمتغيرات التابعة. المتغيرات المستقلة في التنقيب عن البيانات هي سمات معروفة بالفعل ومتغيرات الاستجابة هي ما نريد التنبؤ به. وإن العديد من مشاكل العالم الحقيقي ليست مجرد تنبؤ. على سبيل المثال ، من الصعب للغاية التنبؤ بحجم المبيعات وأسعار الأسهم ومعدلات فشل المنتج لأنها قد تعتمد على التفاعلات المعقدة لمتغيرات توقع متعددة. لذلك ، قد تكون التقنيات الأكثر تعقيدًا ضرورية للتنبؤ بالقيم المستقبلية. غالبًا ما يمكن استخدام أنواع النماذج نفسها لكل من الانحدار والتصنيف. على سبيل المثال ، يمكن استخدام خوارزمية شجرة قرار  (التصنيف وأشجار الانحدار) لبناء كل من أشجار التصنيف (لتصنيف متغيرات الاستجابة الفئوية) وأشجار الانحدار (للتنبؤ بمتغيرات الاستجابة المستمرة). يمكن للشبكات العصبية أيضًا إنشاء نموذج التصنيف والانحدار

     الشبكة العصبية هي مجموعة من وحدات الإدخال / الإخراج المتصلة ولكل اتصال وزن موجود معها. خلال مرحلة التعلم ، تتعلم الشبكة عن طريق تعديل الأوزان لتتمكن من التنبؤ بتسميات الفئات الصحيحة لمجموعات الإدخال. تتمتع الشبكات العصبية بقدرة ملحوظة على استخلاص المعنى من البيانات المعقدة أو غير الدقيقة ويمكن استخدامها لاستخراج الأنماط واكتشاف الاتجاهات المعقدة للغاية بحيث لا يمكن ملاحظتها من قبل البشر أو تقنيات الكمبيوتر الأخرى. هذه مناسبة تمامًا للمدخلات والمخرجات ذات القيمة المستمرة. على سبيل المثال ، إعادة تنظيم الأحرف المكتوبة بخط اليد ، لتدريب الكمبيوتر على نطق النص الإنجليزي والعديد من مشاكل العمل في العالم الحقيقي ، وقد تم بالفعل تطبيقها بنجاح في العديد من الصناعات. الشبكات العصبية هي الأفضل في تحديد الأنماط أو الاتجاهات في البيانات وهي مناسبة تمامًا لاحتياجات التنبؤ

قاعدة الارتباط هو العثور على نتائج متكررة لمجموعة العناصر بين مجموعات البيانات الكبيرة. يساعد هذا النوع من الاكتشاف الشركات على اتخاذ قرارات معينة ، مثل تصميم الكتالوج والتسويق المتقاطع وتحليل سلوك تسوق العملاء. يجب أن تكون خوارزميات قاعدة الاقتران قادرة على إنشاء قواعد ذات قيم ثقة أقل من واحدة. ومع ذلك ، فإن عدد قواعد الارتباط الممكنة لمجموعة بيانات معينة كبير جدًا بشكل عام ، وعادة ما تكون نسبة عالية من القواعد قليلة القيمة

تطبيقات التنقيب عن البيانات

يعد التنقيب عن البيانات تقنية جديدة نسبيًا لم تنضج بشكل كامل. على الرغم من ذلك ، هناك عدد من الصناعات التي تستخدمه بالفعل بشكل منتظم. تشمل بعض هذه المنظمات متاجر البيع بالتجزئة والمستشفيات والبنوك وشركات التأمين. تجمع العديد من هذه المؤسسات بين التنقيب عن البيانات وأشياء مثل الإحصائيات والتعرف على الأنماط وأدوات مهمة أخرى. يمكن استخدام التنقيب في البيانات للعثور على الأنماط والوصلات التي يصعب العثور عليها بخلاف ذلك.

الخلاصة التنقيب في البيانات له أهمية فيما يتعلق بالعثور على الأنماط والتنبؤ واكتشاف المعرفة وما إلى ذلك ، في مجالات الأعمال المختلفة. تساعد تقنيات وخوارزميات استخراج البيانات مثل التصنيف والتجميع وما إلى ذلك في العثور على الأنماط لاتخاذ قرار بشأن الاتجاهات المستقبلية في الأعمال التجارية للنمو. يحتوي استخراج البيانات على نطاق تطبيق واسع تقريبًا في كل صناعة يتم فيها إنشاء البيانات ، ولهذا السبب يعتبر التنقيب عن البيانات أحد أهم الحدود في أنظمة قواعد البيانات والمعلومات وواحد من أكثر التطورات الواعدة متعددة التخصصات في تكنولوجيا المعلومات .

0.00 avg. rating (0% score) - 0 votes
0 نظرات

No Comment.