عرض مشاركة واحدة
منتديات طلاب وطالبات جامعة الملك عبد العزيز منتديات طلاب وطالبات جامعة الملك عبد العزيز
  #1  
قديم 02-04-2010, 04:33 PM
الصورة الرمزية روبي4

روبي4 روبي4 غير متواجد حالياً

دلوعة

 
تاريخ التسجيل: Nov 2008
التخصص: نظم معلومات
نوع الدراسة: إنتظام
المستوى: السادس
الجنس: أنثى
المشاركات: 122
افتراضي مفاجاءة شرح جزء شابتر خمسة بالعربي لمادة 220


قبل ما تفكروا أنكم تحفظوا أول افهموا عن إيش قاعد يتكلم هذاالشابتر
أنا قرأت موضوع جدا رائع من منتدى وهو يشرح شابتر خمسة
الآن اقرأ واستمتع ثم احفظ المقررر اللي عليك .
أتمنى دعوة في ظهر الغيب .
سمات الانتشار الواسع لتكنولوجيا المعلومات تضخم حجم المعلومات بصورة كبيرة
بحيث أصبح عنصراً هاماً في جوانب عديدة من المجتمع
ومن جهة أخرى برز تحدي جديد في كيفية تحويل قواعد البيانات من قواعد تخزين وبحث عن المعلومة إلى مخازن للمعلومات تستنتج المعرفة وتساعد في اتخاذ القرار .
لذلك دعت الحاجة لظهور تقنيات استخراج المعلومات Data Mining
أو مجازا يسمى التنقيب في أعماق منجم المعلومات
وما يتفرع عنها من استخراج المعلومات من النصوص t e x t Mining
مع استخدام
مخازن المعلومات Data Warehousing
والأمل في استخدام هذه التقنيات
على شبكة الانترنيت فيما يسمى Web Mining
----------------------------------------------

مخازن البيانات Data Warehousing


مخازن البيانات أنظمة تستعمل تقنيات جديدة في تخزين كميات كبيرة من المعلومات
الغير متشابهة Heterogeneous
برزت الحاجة الملحة إلى مخازن البيانات في الشركات الكبرى
حيث أن كل قسم من هذه الشركات يدير قواعد بيانات مستقلة خاصة به (تسويق، مالي، ...)
والتي تتضمن كثيراً من البيانات المشتركة وتتطلب حاجة الشركة إيجاد
كامل البيانات المتعلقة بموضوع محدد كالزبائن مثلاً من خلال بحث في قاعدة واحدة
بدلاً من البحث في القواعد المختلفة .
لذا برزت الحاجة إلى تجميع البيانات في قاعدة واحدة تسمى مخزن البيانات
مع الاحتفاظ بالقواعد الخاصة على أن يصار إلى تغذية المخازن دورياً
في حال حصل تعديل أو تبديل في القواعد وتصنف البيانات بحسب الموضوع
وذلك باستخدام برامج خاصة تسمى Middleware
تستعمل بيانات دمج خاصة في كل موضوع
أما طريقة معالجة البيانات فتختلف بين قواعد البيانات ومخازن البيانات

ففي قواعد البيانات تستعمل
Online Transaction Processing (OLTP )
حيث أنه يمكن تعديل ، زيادة أو بحث عن بيانات بسرعة
مع الاحتفاظ بتكامل قاعدة البيانات Database Integrity

أما في مخازن البيانات فتستخدم طريقة تحليل البيانات
Online analytical processing (OLAP)
من خلال معالجة كميات ضخمة وتحليلها وإخراجها بشكل معرفة تسمح باستنتاجات
وتحديد اتجاهات جديدة بدون أية إمكانية لتعديل البيانات.

إن تخزين البيانات تتم بطريقة متعددة الاتجاهات Multidimensional
أو ما يعرف مكعب البيانات Data Cub تسمح بالتحليل حسب اتجاهات محددة

صناعة مخازن البيانات :

أما كيفية صناعة مخازن البيانات فتتم عبر :
- توحيد البيانات الواردة من مصادر متنوعة وغير متشابهة (قواعد البيانات)
- توزيع البيانات بحسب المواضيع والاهتمام (أقسام الشركة مثلاً) .
- الاهتمام بالبعد الزمني(التاريخ)
- حفظ كامل البيانات من الأقدم حتى الأحدث Historique .

عرض النتائج :

أما في عرض نتائج البحث فتستخدم طريقتين لتحليل البيانات ،
فالطريقة الحسابية تستعمل تحليل البيانات Analyze data
من أجل إظهار النتيجة بطريقة حسابية إحصائية (الجمع، المعدل،...)
أو استخراج البيانات Data Mining وإظهار البيانات بشكل Diagram
تحوي كل واحدة منها معلومات في مجال محدد (شؤون الموظفين، التسويق،..)
تستعمل في تحديد نطاق البحث واستعمال أنظمة التحليل على هذه المخازن
لاتخاذ القرار في نطاق محدود .

---------------------------------

استخراج البيانات : Data Mining



يمكن تعريف تقنيات استخراج البيانات بأنها
عملية الاستحصال على المعرفة المهمة والجديدة والمفيدة
من خلال كميات كبيرة من البيانات حسب نماذج حسابية أو إحصائية أو منطقية ،
فاستخراج البيانات منهجية جديدة تجمع بين نتائج الأبحاث في الذكاء الاصطناعي ،
الفهم الآلي ، التعرف على الأشكال ، قواعد المعلومات، الرياضيات الإحصائية،
واجهات الاستعمال واللغة .
وبحسب مراكز الأبحاث يمكن الفصل بين نوعين من استخراج المعلومات فتسمية
Knowledge discovery in databases (KDD)
وهي عملية اكتشاف المعرفة في قواعد البيانات
تستعمل عند الباحثين في الذكاء الاصطناعي والفهم الآلي
وتسمية Data Mining
تستعمل عند الباحثين في الرياضيات الإحصائية أو خبراء المعلومات .
تستعمل تقنيات استخراج البيانات قواعد المعرفة كما في الأنظمة الخبيرة
إلا أن تغذية بنوك المعرفة تتم من خلال المعرفة المستخرجة مباشرة وآلياً من مخازن البيانات .
إن Data Mining (تعدين البيانات)
تستعمل لاستخراج المعلومات من قواعد أو مخازن المعلومات
حيث أن المعلومات في هذه الحالة منتظمة ضمن جداول وملفات Structured Data

أما أهم الخطوات المتبعة لاستخراج المعرفة فهي:

تتضمن عدد من المراحل تبدأ من جمع البيانات الخام الى مرحلة الحصول على المعرفة الجديدة ،
وفيما يأتي عرض لهذه المراحل :
تنقية البيانات Data Cleaning :
وهي مرحلة عزل البيانات التي تحتوي على تشويش او شوائب Noise من مجموعة البيانات
كإلغاء المعلومات المتكررة ، التصحيح الشكلي ، معالجة البيانات الناقصة .
- توحيد البياناتData Integration
هذه المرحلة غالبا ما تكون مصادر معالجة البيانات متغيرة العناصر
وربما تكون مجتمعة في مصدر شائع .
- اختيار البيانات Data Selection :
في هذه المرحلة ، يتم تحديد واسترجاع البيانات الملائمة من مجموعة البيانات .
- نقل البيانات Data Transformation :
وهي عملية نقل البيانات التي تم اختيارها الى شكل ملائم لإجراءات البحث والاسترجاع.
- استخراج البيانات Data Mining :
في هذه المرحلة سيتم تطبيق اسلوب ذكي لاستخراج نماذج مفيدة قدر الإمكان .
- التصنيف Classification:
إيجاد مجموعات من المعلومات بناءً على خصائص مشتركة كتصنيف المناطق بناء على الإنتاج الزراعي أو تصنيف السيارات بناء على الوقود المستعمل ،
تستعمل في هذه الحالة الطرق المستخدمة في الرياضيات الإحصائية أو الذكاء الاصطناعي
مثل شجرة القرار أو الشبكات العصبية ،أو القواعد البايزية.
- الربط والتسلسل Association & Sequencing
استخراج العلاقة السببية بين البيانات كشراء طابعة يعني في نفس الوقت شراء ورق للطباعة ،
أو العلاقة التسلسلية ففي حال شراء كمبيوتر فهنالك احتمال كبير لشراء طابعة في المستقبل
مع إمكانية إعطاء نسبة مئوية للاحتمالات بناء على البيانات المتراكمة في المخازن .
- تقييم النموذج Pattern Evaluation :
بعد استخراج النماذج المهمة والتي تمثل المعرفة يتم تقييمها استنادا الى مقاييس محددة .
- تمثيل المعرفة Knowledge Representation :
وهي المرحلة الاخيرة من مراحل اكتشاف المعرفة في قواعد البيانات
وهي المرحلة التي يراها المستفيد ، هذه المرحلة الاساسية تستخدم الاسلوب المرئي
لمساعدة المستفيد في فهم و وتفسير نتائج استخراج البيانات .


----------------------------
خاتمة :
لقد بدأت شركات المعلوماتية تعرض برامج تملك إمكانية استعمال التقنيات الجديدة
(IBM, Server, MS SQL, Oracle, BD2,…)
وبدأت قطاعات البيع والاتصالات والبنوك باستعمالها ويتوقع تعميمها على معظم القطاعات ،
فكما انتشرت قواعد المعلومات والمعلوماتية الإنتاجية حتى الآن فإن المعلوماتية التقريرية
سوف تلعب الدور الأهم في المستقبل القريب ومن جهة أخرى وللوصول إلى Web Mining
يلعب WWW consortium (W3C)
دوراً كبيراً في توحيد نصوص الانترنيت لمعالجتها آلياً باستخدام لغة XML
والتي يتوقع أن تكون لغة الانترنيت في المستقبل
----------
أخيرا تم تجميع البيانات السابقة من
المراجع :
مجلة المعلوماتية
النادي العربيData Mining
جريدة الرياض
--------
تقبلوا تحياتي
ولي لقاء معكم آخر زيادة في هذا الموضوع

رد مع اقتباس