علوم البيانات وهندسة البيانات الضخمة

مقدمة يُعد عدم توازن البيانات من أكثر التحديات شيوعاً في مشاريع التصنيف الواقعية، لأن النموذج قد يحقق دقة ظاهرية مرتفعة بينما يفشل عملياً في اكتشاف الفئة الأهم. يحدث ذلك عندما تكون إحدى الفئات ممثلة بعدد ضخم من السجلات، مقابل فئة نادرة تمثل الحالات الحرجة مثل الاحتيال، الأمراض، أو انسحاب العملاء. في هذا السياق، لا يكفي…

بناء نظام توصية متقدم يعتمد على تفاعل المستخدمين (Collaborative Filtering) يُعد نظام التوصية المعتمد على Collaborative Filtering من أكثر الأساليب فعالية في المنصات التي تمتلك سجلاً كثيفاً من تفاعلات المستخدمين مع المنتجات أو الأفلام أو المحتوى. الفكرة الجوهرية لا تعتمد على وصف العنصر نفسه، بل على الأنماط السلوكية المتكررة بين المستخدمين: من شاهد هذا، ماذا…

مقدمة يُعد بناء نظام توصية أفلام قائم على تشابه المحتوى من أكثر التطبيقات التعليمية فائدة لفهم كيف تتحول البيانات الوصفية إلى قرارات ذكية قابلة للتنفيذ. هذا النوع من الأنظمة لا يعتمد على سلوك المستخدمين الآخرين، بل يركّز على خصائص العنصر نفسه مثل النوع، الكلمات المفتاحية، الملخص، المخرج، أو طاقم التمثيل، ثم يقيس مدى قرب فيلم…

أنظمة التوصية (Recommendation Systems): كيف يقترح نتفليكس أو أمازون المنتجات؟ عندما تشاهد اقتراح فيلم جديد في نتفليكس، أو ترى في أمازون عبارة “قد يعجبك أيضاً”، فأنت أمام أحد أكثر تطبيقات Machine Learning ربحية وتأثيراً. أنظمة التوصية لا تعتمد على الحدس، بل على تحليل سلوك ملايين المستخدمين، وربط التفاعلات بالمنتجات، ثم بناء نماذج قادرة على التنبؤ…

تطبيق عملي: سحب تغريدات/تعليقات حول منتج معين وتحليلها هل هي إيجابية أم سلبية؟ يُعد تحليل آراء المستخدمين حول المنتجات من أكثر تطبيقات Data Science قيمةً للشركات، لأنه يحوّل النصوص المبعثرة إلى مؤشرات قابلة للقياس تساعد فرق التسويق والدعم وتطوير المنتج على اتخاذ قرارات دقيقة. وإذا كنت قد قرأت سابقاً مدخل إلى علوم البيانات: كيف تحول…

التصنيف: علوم البيانات وهندسة البيانات الضخمة

كيفية التعامل مع عدم توازن البيانات (Imbalanced Data) في نماذج التصنيف

بناء نظام توصية متقدم يعتمد على تفاعل المستخدمين (Collaborative Filtering)

بناء نظام توصية أفلام بسيط يعتمد على تشابه المحتوى (Content-Based Filtering)

أنظمة التوصية (Recommendation Systems): كيف يقترح نتفليكس أو أمازون المنتجات؟