Anomaly Detection in Wireless Sensor Networks (WSNs) by using Machine Learning Techniques

Abstract
Anomaly Detection in Wireless Sensor Networks (WSNs) by using Machine Learning Techniques
Alaa Ahmad Lasasmeh
Mutah University, 2015

In this thesis, we generated two main datasets, the first being based on tree topology and the second on star topology. The datasets were evaluated by three Machine Learning (ML) algorithms: Bayesian Network, Random Forest and Multilayer Perceptron (MLP). Each topology was classified into normal and abnormal (attack) network traffic.

The data were generated in the following phases: perform networks for two topologies, data collection, data preprocessing and classification.

The dataset used in our work contained simulated data from network simulation 2 (NS2). In each database the Bayesian network (BayesNet) classifier achieved the highest accuracy level among other classifiers, of 95.46% and 98.87% respectively, with the minimum time for building the model. The MLP classified achieved the lowest accuracy level among other classifiers, of 90.98% for tree topology and 92.55% for star topology. Random Forest achieved the middles accuracy level among other classifiers, 93.72% for tree topology and 95.7004 % for star topology.

الملخص
الكشف عن الشذوذ في شبكات الاستشعار اللاسلكية باستخدام تقنيات التعلم الآلي
ألاء احمد اللصاصمة
جامعة مؤتة، 2015

في هذه الاطروحه قمنا بانشاء قاعدتين من قواعد البيانات الاساسيه: الاولى على اساس نموذج الشجره, والثانيه على اساس نموذج النجمه. وتم تقييمها من خلال ثلاث خوارزميات تعلم الاله: Bayesian Network, Random Forest, MLP. قمنا بتصنيف قاعدتي البيانات المنشئه الى مصنفيين رئيسيين هما (Normal and Attack Classes)

لكلا قاعدتي البيانات. تم انشاء قاعدتي البيانات من خلال المراحل التاليه: تنفيذ الشبكه على اساس النموذجين, جمع البيانات, معالجة البيانات وتصنيفها. تحتوي قاعدتي البيانات التي تم انشائها على بيانات غير حقيقيه من خلال اداة محاكاه تدعى Network Simulation 2 (NS2)

في كلا قاعدتي البيانات حققت خوارزمية Bayesian Network (BayesNet) اعلى مستوى دقه بين المصنفات الاخرى بنتيجة: 95.46% و 98.87% على التوالي. بالاضافه انها استغرقت اقل وقت بين المصنفات الاخرى لبناء نموذج التدريب لكلا قاعدتي البيانات. حققت MLP اقل مستوى دقه بين المصنفات الاخرى بنتيجة: 90.98% tree topology و 92.55 star topology. حققت Random Forest القيمه الوسطيه بالنسبه للدقه بين المصنفات الاخرى بنتيجة: 93.72%tree topology و 95.7004% star topology.