تقنيات تعدين النص لالتقاط الحقائق لاعتماد الحوسبة السحابية ومعالجة البيانات الضخمة(Text mining techniques to capture facts for cloud computing adoption and big data processing)

في الدراسات البحثية التقليدية ، يبحث المستخدم عن المفاهيم المحددة بالفعل والمصطلحات ذات الصلة. تكمن المشكلة في أن النتائج المسترجعة في معظم الأحيان لا تكون وفقًا للمتطلبات المحددة

التنقيب عن النص هو عملية نستخرج فيها مجموعة متنوعة من الأنماط ونكتشف حقائق مفيدة من مصادر نصية. يغطي التنقيب عن البيانات جميع أنواع التقنيات الخاصة بتعدين البيانات ، على سبيل المثال تقنيات معالجة بيانات الصوت والفيديو. يتم استخدامه لمعالجة السجلات الكبيرة المخزنة في قواعد بيانات مختلفة للكشف عن المفاهيم الهامة والعلاقات بين البيانات.

هناك عدة تقنيات لاستعادة المعلومات النصية ، والفهرسة هي واحدة منها. يتم استخدامه للتعامل مع المستندات بتنسيق غير منظم.

يركز هذا البحث على تطبيق الحوسبة السحابية تجاه البيانات الضخمة واتجاهات اعتماد السحابة باستخدام تقنيات التنقيب عن النصوص في الأوراق البحثية المنشورة في هذه المجالات.

يجري العمل البحثي في مجال استخراج المعلومات باستخدام العديد من التقنيات.

الهدف الرئيسي من إجراء هذا البحث هو العثور على التقنيات التي أثبتت فائدتها في استخراج البيانات المنظمة من مجموعة النصوص.

يهدف التنقيب عن النص إلى الحصول على معلومات لم تكن متوفرة من قبل من مصادر نصية مختلفة. يمكن استخدام التنقيب في البيانات للتعامل مع البيانات المنظمة بينما يمكن استخدام التنقيب عن النص للتعامل مع البيانات شبه المنظمة وغير المنظمة.

هناك أنواع مختلفة من تقنيات التنقيب عن النص والتي تشمل التجميع والتصنيف ونمذجة الموضوع والتلخيص. الغرض الرئيسي من هذه التقنيات هو استخراج المعرفة من النص.

تمر عملية التنقيب عن النص بعدة خطوات. في الخطوة الأولى ، يتم جمع المستند من مصادر مختلفة بدلاً من الخطوة التالية ، يتم التحقق من تنسيق المستند ثم يمر بمرحلة التحليل. تتضمن مرحلة التحليل التحليل الدلالي وتقنيات أخرى لمعالجة البيانات وفقًا للمتطلبات. يمكن تخزين نتيجة هذه المرحلة في نظام إدارة قاعدة البيانات لمزيد من المعالجة.

من المفترض أن يكون التنقيب عن النص واستخراج البيانات من الأساليب المتشابهة ، ولكن في الواقع ، تختلف هذه الأساليب لأن التنقيب في البيانات يحتاج إلى بيانات منظمة ، ولكن في حالة التنقيب عن النص ، نتعامل مع بيانات غير منظمة تحتاج إلى خطوات معالجة مسبقة بالإضافة إلى أنها تتضمن التفاعل مع البرمجة اللغوية العصبية. تجري الكثير من الأبحاث في البرمجة اللغوية العصبية. إنه ينطوي على التفاعل والعلاقة بين الكميات الكبيرة من التنسيق النصي للبيانات.

يتكون المستند المكتوب بلغة عادية من معلومات لا يمكن استخدامها لاستخراج البيانات. لكي يكون استخراج المعلومات ناجحًا ، يجب اختيار المقالات المناسبة بشرط أن يكون لهذه المستندات بعض الارتباط .

تم اقتراح التقنية التي تستخدم الحقول العشوائية الشرطية لاستخراج الحقول المشتركة المختلفة من العنوان والاقتباس من الأوراق البحثية.

تم اقتراح تقنية قائمة على التنقيب عن الرسم البياني تستخدم لاستكشاف محتوى الوثيقة.

المواد والأساليب

اختيار الأدب

إجراءات تعدين النصوص ونمذجة الموضوعات

السحابة

تحليل التشابه

التحليل العنقودي

تم اقتراح التقنية التي تستخدم الحقول العشوائية الشرطية لاستخراج الحقول المشتركة المختلفة من العنوان والاقتباس من الأوراق البحثية

المزايا

تحدد هذه الدراسة المجالات العشرة الرئيسية للبيانات الضخمة باستخدام الحوسبة السحابية ، وأربعة عشر عاملاً نحو اعتماد السحابة ، والعقبات في التبني.

يمكننا استخدام تقنيات التنقيب عن البيانات لإخفاء المفاهيم المهمة والمعرفة من الأدبيات العلمية.

يتم استخدامه لمعالجة السجلات الكبيرة المخزنة في قواعد بيانات مختلفة للكشف عن المفاهيم الهامة والعلاقات بين البيانات.

يتم تطبيق تقنيات التنقيب عن النصوص في عدة مجالات ، تشمل الأوساط الأكاديمية وتطبيقات الويب والإنترنت والصناعة وغيرها من التخصصات.

مفهوم تقنية الحوسبة السحابية التي تحول مهمة معالجة البيانات الضخمة واستخراج البيانات إلى حقيقة واقعة

توفر منصة الحوسبة السحابية خدمات أفضل للمستخدم مقارنة بخدمات تكنولوجيا المعلومات التقليدية

تمنح الحوسبة السحابية الفرصة للمؤسسات لتلبية متطلبات الحوسبة الخاصة بهم بشكل فعال

السلبيات

يتطلب استقراء مفهوم البيانات الضخمة مزيدًا من المتطلبات فيما يتعلق بمعالجة البيانات في الوقت الفعلي ، وبالتالي لا يمكن لتقنية تكنولوجيا المعلومات التقليدية أن تلبي هذه المتطلبات بالكامل.

تجلب الحوسبة السحابية بعض المشاكل الأمنية بالإضافة إلى ذلك. في السنوات القليلة الماضية ، كان اهتمام المؤسسة باعتماد الحوسبة السحابية متعدد الجوانب

0.00 avg. rating (0% score) - 0 votes
0 نظرات

No Comment.