توزيع بواسون: دليل شامل لفهم وحساب التوزيعات الاحتمالية
مقدمة في التوزيعات الاحتمالية وأهميتها
تلعب التوزيعات الاحتمالية دورًا حيويًا في حياتنا اليومية، حيث نستخدمها بشكل شائع لتلخيص البيانات المختلفة واستخلاص الرؤى منها. ولهذا السبب، تُعد هذه التوزيعات موضوعًا بالغ الأهمية في مجالات مثل الرياضيات، وعلوم الحاسوب، والإحصاء، وعلم البيانات.
يمكن تصنيف البيانات بشكل عام إلى نوعين رئيسيين:
- البيانات الرقمية (
Numerical): مثل الأعداد الصحيحة (integers) والأعداد العشرية (floats). - البيانات الفئوية (
Categorical): مثل سلاسل النصوص (strings).
تنقسم البيانات الرقمية بدورها إلى شكلين:
-
البيانات المنفصلة (
Discrete): يمكن لهذا النوع من البيانات أن يأخذ عددًا محدودًا من القيم (مثل عدد قطع الملابس التي نمتلكها). من البيانات المنفصلة، يمكننا استنتاج دوال كتلة الاحتمال (Probability Mass Functions - PMF). -
البيانات المتصلة (
Continuous): تُستخدم البيانات المتصلة لوصف مفاهيم أكثر تجريدًا مثل الوزن أو المسافة، والتي يمكن أن تأخذ أي قيمة كسرية أو حقيقية. من البيانات المتصلة، يمكننا استنتاج دوال كثافة الاحتمال (Probability Density Functions - PDF).
تُعطينا دوال كتلة الاحتمال (PMF) احتمال أن يكون المتغير مساويًا لقيمة معينة. من ناحية أخرى، لا تمثل قيم دوال كثافة الاحتمال (PDF) الاحتمالات بحد ذاتها، بل تحتاج أولاً إلى التكامل (ضمن النطاق المحدد) للحصول على الاحتمال.
ما هو توزيع بواسون (Poisson Distribution)؟
يُستخدم توزيع بواسون (Poisson Distribution) عادةً لغرضين رئيسيين:
-
التنبؤ بعدد مرات حدوث حدث ما: يُستخدم للتنبؤ بعدد المرات التي سيقع فيها حدث معين خلال فترة زمنية مختارة. يمكن تطبيق هذه التقنية في تطبيقات تحليل المخاطر المختلفة، مثل تقدير أسعار التأمين على المنازل.
-
تقدير احتمال وقوع حدث: يُستخدم لتقدير احتمال وقوع حدث معين بناءً على عدد مرات حدوثه في الماضي (على سبيل المثال، مدى احتمالية حدوث انقطاع للتيار الكهربائي في الشهرين المقبلين).
يمنحنا توزيع بواسون ثقة في معرفة متوسط الوقت بين وقوع الأحداث المختلفة. ومع ذلك، لا يمكنه إخبارنا باللحظة الدقيقة التي قد يقع فيها حدث ما (نظرًا لأن العمليات عادةً ما تكون ذات سلوك عشوائي أو stochastic).
الأنظمة الخطية مقابل الأنظمة غير الخطية (العشوائية)
يمكن تقسيم الأنظمة الطبيعية في الواقع إلى فئتين رئيسيتين: خطية وغير خطية (عشوائية). في الأنظمة الخطية، تسبق الأسباب دائمًا تأثيراتها، مما يخلق تأثيرًا قويًا للأسبقية الزمنية. لكن هذا لا ينطبق على الأنظمة غير الخطية، حيث يمكن أن تؤدي التغييرات الصغيرة في الظروف الأولية للنظام إلى نتائج غير متوقعة.
بالنظر إلى مدى تعقيد وفوضى عالمنا الحقيقي، فإن معظم العمليات توصف بشكل أفضل باستخدام الأنظمة غير الخطية، على الرغم من أن التقريبات الخطية ممكنة في بعض الأحيان.
صيغة توزيع بواسون وخصائصه
يمكن نمذجة توزيع بواسون باستخدام التعبير الموضح في الشكل أدناه، حيث يُمثل الرمز λ (لامدا) العدد المتوقع للأحداث التي يمكن أن تحدث في الفترة الزمنية المحددة.

الخصائص الرئيسية التي تصف عمليات بواسون هي:
- لا يمكن أن يقع حدثان في نفس الوقت.
- متوسط المعدل بين وقوع الأحداث ثابت بشكل عام.
- الأحداث مستقلة عن بعضها البعض (إذا حدث أحدهما، فلا يؤثر ذلك على احتمال وقوع حدث آخر).
- يمكن أن تقع الأحداث أي عدد من المرات (ضمن الفترة الزمنية المحددة).
مثال عملي على توزيع بواسون: محاكاة باستخدام بايثون
في الشكل أدناه، يمكنك أن ترى كيف يمكن أن يؤدي تغيير العدد المتوقع للأحداث (λ) التي يمكن أن تحدث في فترة ما إلى تغيير توزيع بواسون. تم إجراء المحاكاة أدناه باستخدام كود بايثون التالي:
import numpy as np
import matplotlib.pyplot as plt
import scipy.stats as stats
# n = number of events, lambd = expected number of events
# which can take place in a period
for lambd in range(2, 12, 2):
n = np.arange(0, 9)
poisson = stats.poisson.pmf(n, lambd)
plt.plot(n, poisson, '-o', label="λ = {:f}".format(lambd))
plt.xlabel('Number of Events', fontsize=12)
plt.ylabel('Probability', fontsize=12)
plt.title("Poisson Distribution varying λ")
plt.legend()
plt.savefig('name.png')
بإلقاء نظرة فاحصة على هذه المحاكاة، يمكننا اكتشاف الأنماط التالية:
- في كل حالة من الحالات المختلفة، يتوافق الرقم المخصص لـ
λمع ذروة التوزيع، والذي يتلاشى بعد ذلك كلما ابتعدنا عن الذروة. - كلما زاد عدد الأحداث المتوقعة خلال المحاكاة، زادت المساحة المتوقعة تحت منحنى التوزيع.

يمكن استخدام هذا النوع من المحاكاة، على سبيل المثال، لمحاولة تقليل وقت الانتظار عند التسوق في سوبر ماركت. يمكن للمالك إنشاء سجل لعدد العملاء الذين يزورون المتجر في أوقات مختلفة وأيام مختلفة من الأسبوع، ثم مطابقة هذه البيانات مع توزيع بواسون. بهذه الطريقة، سيكون من الأسهل بكثير تحديد عدد أمناء الصندوق الذين يجب أن يعملوا في أوقات مختلفة من اليوم/الأسبوع لتعزيز تجربة العملاء.
الخلاصة التقنية
يُعد توزيع بواسون أداة إحصائية لا غنى عنها في تحليل الأحداث النادرة والمتكررة عشوائيًا ضمن فترة زمنية أو مساحة محددة. قدرته على نمذجة الظواهر التي تتبع العمليات العشوائية (stochastic processes)، مثل عدد المكالمات الواردة إلى مركز خدمة العملاء أو عدد الأخطاء في صفحة مطبوعة، يجعله حجر الزاوية في مجالات مثل إدارة المخاطر، وتحسين العمليات، والتنبؤ. فهم المعلمة λ (متوسط معدل الحدوث) وكيفية تأثيرها على شكل التوزيع أمر بالغ الأهمية لتطبيق هذا النموذج بفعالية واستخلاص رؤى قابلة للتنفيذ.