علوم البيانات وهندسة البيانات الضخمة

التعلم غير الخاضع للإشراف: خوارزمية K-Means لتجميع العملاء (Clustering) عندما لا نملك متغيراً هدفياً واضحاً، يصبح التعلم غير الخاضع للإشراف أداة مركزية لاكتشاف البنية الخفية داخل البيانات. ومن أشهر تقنياته خوارزمية K-Means التي تستخدم بكثرة في تجميع العملاء وفقاً لأنماط الشراء والسلوك والقيمة التجارية. الفكرة الجوهرية بسيطة ظاهرياً: تقسيم العملاء إلى مجموعات متشابهة داخلياً ومختلفة…

خوارزمية KNN (أقرب الجيران): تصنيف البيانات بناءً على التشابه تُعد خوارزمية KNN أو K-Nearest Neighbors من أبسط وأوضح خوارزميات تعلم الآلة (Machine Learning) الخاضع للإشراف. ورغم بساطتها النظرية، فإن فعاليتها العملية كبيرة جداً عندما تكون البيانات نظيفة، والميزات معبّرة، والمسافات محسوبة بطريقة صحيحة. الفكرة الجوهرية فيها هي أن العينة الجديدة تُصنَّف بناءً على أقرب العينات…

الغابات العشوائية: لماذا تتفوق على الشجرة الواحدة؟ تُعد خوارزمية Random Forest من أقوى نماذج Machine Learning الكلاسيكية عندما نحتاج إلى موازنة ممتازة بين الدقة، والمرونة، والقدرة على العمل مع بيانات واقعية مليئة بالضوضاء. الفكرة الأساسية بسيطة ظاهرياً: بدلاً من الاعتماد على شجرة قرار واحدة، نقوم ببناء مئات الأشجار الصغيرة ثم ندمج قراراتها للوصول إلى توقع…

شجرة القرارات: كيف يتخذ الذكاء الاصطناعي قراراته بخطوات منطقية؟ تُعد خوارزمية Decision Trees من أكثر نماذج Machine Learning سهولة في الفهم والتفسير، لأنها تحاكي أسلوب اتخاذ القرار البشري عبر سلسلة من الأسئلة المنطقية المتتابعة. بدلاً من بناء معادلة رياضية معقدة، تقوم الشجرة بتقسيم البيانات تدريجياً إلى فروع حتى تصل إلى قرار نهائي مثل تصنيف عميل،…

الانحدار اللوجستي (Logistic Regression): التنبؤ بالنتائج الثنائية (مثل: مريض/سليم) يُعد Logistic Regression من أهم خوارزميات التصنيف في مجال مقدمة في تعلم الآلة (Machine Learning): الفرق بين التعلم الخاضع وغير الخاضع للإشراف. وعلى الرغم من اسمه، فهو لا يُستخدم لتوقع قيم مستمرة مثل Linear Regression، بل لتقدير احتمال انتماء السجل إلى فئة ثنائية مثل مريض/سليم، احتيالي/سليم،…

التصنيف: علوم البيانات وهندسة البيانات الضخمة

التعلم غير الخاضع للإشراف: خوارزمية K-Means لتجميع العملاء (Clustering)

خوارزمية KNN (أقرب الجيران): تصنيف البيانات بناءً على التشابه

الغابات العشوائية (Random Forest): دمج مئات الأشجار لرفع دقة التوقعات

شجرة القرارات (Decision Trees): كيف يتخذ الذكاء الاصطناعي قراراته بخطوات منطقية؟

الانحدار اللوجستي (Logistic Regression): التنبؤ بالنتائج الثنائية (مثل: مريض/سليم)