كيفية حساب المتوسط الحسابي لقائمة بيانات: شرح تفصيلي للإحصاء ودالة `mean` في بايثون

دقائق القراءة: 6

مقدمة في عالم الأرقام والبرمجة

تتداخل الرياضيات والبرمجة بشكل وثيق، فإذا كنت مبرمجًا، فستحتاج حتمًا إلى استخدام المفاهيم الرياضية في مرحلة ما. تُبنى مجالات مثل علم البيانات، والتعلم الآلي، والذكاء الاصطناعي، والعملات المشفرة، على مبادئ رياضية معقدة. ومع ذلك، لا يجب أن يكون استخدام الدوال الرياضية معقدًا! تعمل لغة بايثون على تجريد هذه التعقيدات، فبمجرد فهمك للمفاهيم الأساسية، لن تحتاج إلى الخوض في تفاصيل التنفيذ الكاملة.

الرياضيات ليست مخيفة كما تبدو!

ستصادف العديد من الدوال الرياضية في مسيرتك. إذا كنت تعمل مع البيانات أو التحليلات، فمن الأهمية بمكان أن تفهم بعض المبادئ والدوال الرياضية الأساسية. إحدى هذه الدوال التي يجب عليك فهمها هي mean function (دالة المتوسط). لا تدع الاسم يخدعك – لا يوجد شيء ‘متوسط’ (بالمعنى السلبي) حول دالة mean في بايثون.

هذا المقال شامل بذاته، ولكني أتوقع أن لديك بعض الخبرة في العمل مع بايثون وأنك تعرف ما هي قائمة بايثون (Python list). إذا لم يكن الأمر كذلك، فمن المستحسن مراجعة المقالات الأساسية حول قوائم بايثون قبل المتابعة. بمجرد الانتهاء، عد وانضم إلينا في استكشاف عميق لدالة mean.

فهم الإحصاء: الأساس لدالة `mean`

إذًا، أنت ترغب في تعلم المزيد عن دالة mean. هذا رائع! ولكن قبل أن نلقي نظرة على هذه الدالة، من المهم أن ننظر إلى المجال الذي تنبع منه: الإحصاء.

رسم بياني إحصائي يوضح العلاقة بين متغيرين

في الصورة أعلاه، نرى رسمًا بيانيًا. الرسم البياني هو تمثيل تصويري يوضح العلاقة بين متغير وآخر. الرسوم البيانية مفيدة لأنها تسمح لنا بتنظيم البيانات بحيث يمكننا رؤية الاتجاهات والعلاقات بين البيانات بسرعة. الرسم البياني هو مجرد أداة واحدة يمكننا استخدامها لتصور البيانات وتحليلها.

الإحصاء هو فرع من فروع الرياضيات يزودنا بطريقة منهجية لتصنيف البيانات وتحليلها وتفسيرها. هذا مهم لأنه من خلال الإحصاء، لدينا مجموعة من الأدوات الجاهزة للقيام بكل هذه الأمور. تخيل لو كنت بحاجة إلى إعادة اختراع المنشار في كل مرة تحتاج فيها إلى قطع قطعة من الخشب. سيكون لدينا الكثير من الناس يسمون المناشير بأسماء مختلفة، على الرغم من أنها تفعل نفس الشيء. لتجنب هذه المشكلة، أعطينا المنشار اسمًا يمكن للجميع الإشارة إليه. يحدث نفس الشيء في الإحصاء – لدينا أدوات معروفة جيدًا ومألوفة للجميع. إحدى هذه الأدوات هي المتوسط الحسابي (mean).

المنوال والوسيط والمتوسط الحسابي: ثلاثية القياسات المركزية

على الرغم من أن المتوسط الحسابي (mean) قادر تمامًا على الوقوف بمفرده، إلا أنه عادة ما يتم تدريسه كجزء من ثلاثي، والذي يتضمن المنوال (mode)، والوسيط (median)، والمتوسط الحسابي (mean). دعنا نلقي نظرة على مجموعة من الأرقام حتى تفهم ما يحدث هنا. تخيل أن لديك الأرقام التالية:

  • 1, 2, 3, 3, 4, 6, 9

لنفترض أننا أردنا التعبير عن الرقم الذي يتكرر أكثر من غيره. سيكون الرقم 3، والاسم الذي نطلقه على هذه الخاصية هو المنوال (mode). المنوال هو الرقم الأكثر تكرارًا في المجموعة التي نفحصها.

الرقم الذي يقع في منتصف مجموعة مرتبة يسمى الوسيط (median). لإيجاد وسيط مجموعة عددية، قم بترتيب الأرقام من الأصغر إلى الأكبر ثم انظر إلى الرقم في المنتصف. مجموعة الأرقام أعلاه مرتبة بالفعل من الأصغر إلى الأكبر، لذا فإن الرقم الوسيط هو أيضًا 3.

أخيرًا، المتوسط الحسابي (mean) هو طريقة أخرى للإشارة إلى متوسط المجموعة. لإيجاد المتوسط الحسابي، ما عليك سوى جمع جميع الأرقام معًا وقسمتها على العدد الإجمالي للعناصر في المجموعة. في حالة الأرقام أعلاه، إذا جمعناها كلها معًا، نحصل على 28. العدد الإجمالي للعناصر في المجموعة هو 7، لذا فإن متوسطنا الحسابي هو 4.

لماذا نحتاج إلى المتوسط الحسابي؟

في هذه المرحلة، قد تتساءل لماذا نحتاج إلى إيجاد المتوسط الحسابي للرقم على الإطلاق. الحقيقة هي أن الإحصاء نفسه ينقسم إلى عدة مجموعات. تمامًا كما لديك أدوات تستخدم للعمل مع الخشب وأخرى للعمل مع المعادن، يتم تجميع بعض الأدوات في الإحصاء في فئات لأنها تستخدم لغرض مماثل. إحدى هذه المجموعات في الإحصاء تسمى الإحصاءات الوصفية (summary statistics).

أحد الأشياء التي يستخدم الإحصاء من أجلها هو وصف البيانات، والإحصاءات الوصفية هي مجموعة من الأدوات المستخدمة لهذا الغرض. أحد العناصر في هذه الفئة من الأدوات هو المتوسط الحسابي.

المتوسط الحسابي مهم لأنه يساعدنا في تحليل ما يعرف باسم التوزيع (distribution). في الإحصاء، التوزيع هو طريقة نستخدمها للنظر إلى متغير نريد معلومات عنه. باستخدام التوزيع، سننظر إلى قيم هذا المتغير وعدد مرات حدوثه. إذا جمعنا البيانات، فإن النوع الشائع من التوزيع الذي نراه هو التوزيع الطبيعي (normal distribution) الذي يأخذ شكل منحنى الجرس:

رسم بياني يوضح منحنى الجرس للتوزيع الطبيعي

هذا يعني أن المتغير سيكون له قيمة شائعة يميل إليها، بالإضافة إلى نقطة بداية ونقطة نهاية. ما يفعله المتوسط الحسابي هو أنه يسمح لنا بأخذ توزيع كهذا والنظر إلى النزعة المركزية (central tendency) للمتغير، وهي النقطة التي تميل عندها قيم المتغير إلى التجمع. وبالتالي يمكننا القول إن المتوسط الحسابي يصف النزعة المركزية للتوزيع.

حساب المتوسط الحسابي في بايثون

يمكننا حساب المتوسط الحسابي يدويًا إذا كان لدينا مجموعة بيانات رقمية صغيرة تحتوي على عدد قليل من القيم للعمل معها. ومع ذلك، عندما يكون لدينا مئات أو آلاف القيم في مجموعة بيانات، يصبح من المستحيل حسابها يدويًا. نظرًا لأن بايثون هي لغة ‘تأتي مع كل شيء’ (batteries included)، فإن الطريقة التي يمكننا بها القيام بذلك هي استخدام دالة mean من الوحدة النمطية statistics داخل بايثون.

دعنا نستخدم دالة mean لحساب المتوسط الحسابي لمجموعة البيانات الرقمية التي كانت لدينا سابقًا في المقال:

 # 1. import the statistics module
 import statistics

 # 2. list containing our numerical data set
 numerical_data_set = [1, 2, 3, 3, 4, 6, 9]

 # 3. calculate the mean
 calc_mean = statistics.mean(numerical_data_set)

 # 4. print our calculated mean
 print("Mean is: ", calc_mean)

يتكون الكود الخاص بنا من تسلسل من 4 خطوات يمكننا استخدامه لحساب المتوسط الحسابي:

  1. نقوم باستيراد الوحدة النمطية statistics التي تحتوي على دالة mean الخاصة بنا.
  2. نقوم بإنشاء قائمة بايثون (Python list) تحتوي على مجموعة البيانات الرقمية التي نرغب في حساب المتوسط الحسابي لها.
  3. نقوم بحساب المتوسط الحسابي وتخزين النتيجة في متغير، calc_mean.
  4. نقوم بإخراج المتوسط الحسابي المحسوب لدينا حتى نتمكن من الحصول على ملاحظات مرئية.

عندما نقوم بتشغيل الكود، سنحصل على الإخراج التالي:

مخرجات الكود البرمجي تظهر قيمة المتوسط الحسابي

يخرج البرنامج نفس القيمة التي حصلنا عليها من حساباتنا اليدوية. عندما نعمل مع مجموعات بيانات كبيرة، ستكون هذه الدالة قادرة على التوسع للتعامل مع أي حجم من البيانات.

الخلاصة التقنية

في هذا المقال، استعرضنا دالة mean في بايثون. بدأنا بمناقشة الإحصاء ككل، ثم تعمقنا في مفهوم المتوسط الحسابي (mean) وكيف يختلف عن المنوال (mode) والوسيط (median). لقد فهمنا أهمية المتوسط الحسابي كأداة وصفية للبيانات، ودوره الحيوي في تحديد النزعة المركزية للتوزيعات الإحصائية، لا سيما التوزيع الطبيعي. أخيرًا، طبقنا هذه المعرفة عمليًا باستخدام وحدة statistics في بايثون، مما أظهر كفاءة وسهولة استخدام الدالة في التعامل مع مجموعات البيانات الكبيرة. إن إتقان هذه الدالة يمثل خطوة أساسية لأي مطور أو عالم بيانات يسعى لتحليل البيانات بفعالية ودقة.

اترك تعليقاً

لن يتم نشر عنوان بريدك الإلكتروني. الحقول الإلزامية مشار إليها بـ *