مقارنة بين الخوارزمية الجينية MWCD والشبكة العصبية متعددة الطبقات الارجاعية (الارتدادية ) لتحديد المؤشرات المسببة لتلوث المياه

مقارنة بين الخوارزمية الجينية MWCD والشبكة العصبية متعددة الطبقات الارجاعية (الارتدادية ) لتحديد المؤشرات المسببة لتلوث المياه

[vc_row][vc_column][vc_column_text]الملخص

تستعمل الطرق اللامعلمية في البيانات التي تحتوي على قيم شاذة ،الاهمية الاساسية في استعمال الطرق اللامعلمية هو تحديد موقع الوسيط ،ففي انموذج الانحدار متعدد المتغيرات يكون من الصعوبة تحديد موقع الوسيط لوجود اكثر من بعد وتشتت القيم وزيادة بيانات الظاهرة المدروسة .فقد تم تطبيق الخوارزمية الجينية Minimum Weighted Covariance Determinant Estimator  وتكتب باختصار (MWCD) ومقارنتها مع الشبكة العصبية متعددة الطبقات الارجاعية (الارتدادية)(Back Propagation Algorithm ) Multilayer Network في ايجاد التقدير لموقع الوسيط بالاعتماد على مسافة مهلنوبس  Mahalanobis Distance(MD) واصغر محدد لمصفوفة التباين المشترك Minimum Covariance Determinant (MCD)  كواحدة من الطرق اللامعلمية الحصينة. وقد طبقت الدراسة على الاحصاءات البيئية لتلوث مياه الشرب لسنة 2013 شملت محافظات العراق كافة عدا اقليم كردستان ،مقسمة الى 10 اشهر وقد استخدمت 9 انواع من المؤشرات الكيمائية والفيزيائية المسببة لتلوث مياه الشرب عند تجاوز الحد الاعلى للقياس. ولتحديد المؤشرات المسببة للتلوث تم استخدام شرائح التمهيد Smoothing Spline في تقدير معاملات انموذج الانحدار متعدد المتغيرات للمعالم المتغيرة زمنيا وقد قدرت المعالم الممهدة بطريقة تثبيت التقاطع  Cross Validation (CV). اثبتت نتائج المقارنة بفاعلية الشبكة العصبية متعددة الطبقات الارجاعية.

فاطمة عبد الحميد جواد * a    ،    صباح منفي b

جامعة بغداد /كلية الادارة والاقتصاد/  قسم الاحصاء

A comparison between the genetic algorithm MWCD and the Multi-Layered (Back Propagation Algorithm network to identify  the indicators causing water pollution)

Fatimah Abdul Hmeed Jawad *a        ,      Sabah manfi redha b

University of Baghdad/college of Economics &Administration/department of statistics.

Abstract                                

Nonparametric methods are used in the data that contain outliers values. The main importance in using Nonparametric methods is to locate the median in the multivariate regression model . It is difficult to locate the median due to the presence of more than one dimension and the dispersion of values and the increase of the studied phenomenon data .The genetic algorithms  Minimum Weighted Covariance Determinant Estimator (MWCD), was applied and compared with the multilayer neural network Back propagation to find the estimate of the median location based on the minimum distance (Mahalanobis Distance) and smallest specified for the variance matrix . Joint Minimum Covariance Determinant (MCD) as one of the most nonparametric methods robust .The study has been applied on environmental pollution statistics of drinking water for the year (2013) including  all the Iraqi provinces except  Kurdistan region , divided into (10) months .To determine the contaminating indicators ,Smoothing Spline slides were used to estimate the multivariate regression model parameters for the time – variable parameters . The parameters smoothed by the cross validation (CV ) method were estimated the results of the comparison proved the effectiveness of the retrospective Multi – Layer neural network.

Key words: genetic algorithm , neural network , mahalanobis ,smoothing spline , multiLayer networks.

………. تحميل الملف ………[/vc_column_text][/vc_column][/vc_row]