علوم البيانات وهندسة البيانات الضخمة (Data Science & Big Data Engineering)
🚀 مسار الدروس
- 1مدخل إلى علوم البيانات: كيف تحول الأرقام العشوائية إلى قرارات استراتيجية؟
- 2إعداد مختبر البيانات: تثبيت بيئة Jupyter Notebook ومكتبات التحليل الأساسية
- 3مكتبة NumPy: القوة الضاربة في معالجة المصفوفات والعمليات الرياضية المعقدة
- 4مكتبة Pandas (1): قراءة واستدعاء البيانات من ملفات CSV و Excel برمجياً
- 5مكتبة Pandas (2): استكشاف هيكل البيانات وفهم DataFrame و Series
- 6تنظيف البيانات (Data Cleaning): اكتشاف ومعالجة القيم المفقودة (Missing Values)
- 7معالجة البيانات المكررة والمشوهة (Duplicates & Outliers) باستخدام بايثون
- 8دمج وتوحيد الجداول (Merge, Join, Concat) لبناء قاعدة بيانات تحليلية شاملة
- 9الفلترة المتقدمة (Filtering & Sorting): استخراج رؤى دقيقة من ملايين السجلات
- 10التجميع والتلخيص (Groupby & Aggregation): إنشاء تقارير إحصائية برمجية
- 11مشروع مصغر: تنظيف وتحليل ملف يحتوي على 10,000 سجل مبيعات وتلخيص الأرباح
- 12مكتبة Matplotlib: أساسيات تصوير البيانات ورسم المخططات البيانية (الخطية والعمودية)
- 13مكتبة Seaborn: إنشاء رسوم بيانية إحصائية متقدمة ومريحة للعين بسطر كود واحد
- 14المخططات التفاعلية: استخدام Plotly لبناء رسوم بيانية يمكن للمستخدم التفاعل معها
- 15هندسة الميزات (Feature Engineering): كيف تستخرج بيانات جديدة من البيانات الحالية؟
- 16التعامل مع البيانات النصية (Text Data): استخراج الكلمات المفتاحية وتحويل النصوص لتصنيفات
- 17التعامل مع التواريخ والوقت (Datetime): تحليل التوجهات الزمنية (Time Series)
- 18مشروع مصغر: بناء لوحة معلومات (Dashboard) بسيطة باستخدام بايثون لبيانات طقس
- 19الإحصاء الوصفي والاستدلالي: مفاهيم لا غنى عنها لكل عالم بيانات
- 20الارتباط (Correlation): كيف تكتشف العلاقة الخفية بين المتغيرات (مثل السعر والطلب)؟
- 21مقدمة في تعلم الآلة (Machine Learning): الفرق بين التعلم الخاضع وغير الخاضع للإشراف
- 22إعداد البيانات للتدريب (Data Preprocessing): تحجيم البيانات (Scaling & Normalization)
- 23تقسيم البيانات (Train/Test Split): لماذا يجب أن نختبر النموذج على بيانات لم يرها من قبل؟
- 24خوارزمية الانحدار الخطي (Linear Regression): بناء نموذج لتوقع أسعار المنازل
- 25تقييم نماذج الانحدار (MSE, RMSE, R2): كيف تعرف أن توقعات الذكاء الاصطناعي دقيقة؟
- 26الانحدار اللوجستي (Logistic Regression): التنبؤ بالنتائج الثنائية (مثل: مريض/سليم)
- 27شجرة القرارات (Decision Trees): كيف يتخذ الذكاء الاصطناعي قراراته بخطوات منطقية؟
- 28الغابات العشوائية (Random Forest): دمج مئات الأشجار لرفع دقة التوقعات
- 29خوارزمية KNN (أقرب الجيران): تصنيف البيانات بناءً على التشابه
- 30التعلم غير الخاضع للإشراف: خوارزمية K-Means لتجميع العملاء (Clustering)
- 31تقليل الأبعاد (PCA): كيف تحلل بيانات تحتوي على 100 متغير في رسم بياني ثنائي الأبعاد؟
- 32مشروع مصغر: بناء نموذج ذكاء اصطناعي يتنبأ باحتمالية إلغاء العملاء لاشتراكاتهم (Churn)