הבדל בין נטייה מרכזית לפיזור

הבדל בין נטייה מרכזית לפיזור
הבדל בין נטייה מרכזית לפיזור

וִידֵאוֹ: הבדל בין נטייה מרכזית לפיזור

וִידֵאוֹ: הבדל בין נטייה מרכזית לפיזור
וִידֵאוֹ: מי יותר חזק אתה או המזל? - עם הרב אהרן לוי 2024, יולי
Anonim

נטייה מרכזית לעומת פיזור

בסטטיסטיקה תיאורית ומסקנתית, מספר מדדים משמשים לתיאור מערך נתונים התואם לנטייה המרכזית, לפיזורו ולנטייה שלו: שלושת המאפיינים החשובים ביותר הקובעים את הצורה היחסית של ההתפלגות של מערך נתונים.

מהי נטייה מרכזית?

נטייה מרכזית מתייחסת ומאתרת את מרכז התפלגות הערכים. ממוצע, מצב וחציון הם המדדים הנפוצים ביותר בתיאור הנטייה המרכזית של מערך נתונים. אם מערך נתונים סימטרי, אז גם החציון וגם הממוצע של מערך הנתונים תואמים זה לזה.

בהינתן מערך נתונים, הממוצע מחושב על ידי לקיחת הסכום של כל ערכי הנתונים ולאחר מכן לחלק אותו במספר הנתונים. לדוגמה, משקלם של 10 אנשים (בקילוגרמים) נמדדים להיות 70, 62, 65, 72, 80, 70, 63, 72, 77 ו-79. אז המשקל הממוצע של עשרת האנשים (בקילוגרמים) יכול להיות מחושב כדלקמן. סכום המשקולות הוא 70 + 62 + 65 + 72 + 80 + 70 + 63 + 72 + 77 + 79=710. ממוצע=(סכום) / (מספר נתונים)=710 / 10=71 (בקילוגרמים). מובן שחריגים (נקודות נתונים החורגות מהמגמה הרגילה) נוטים להשפיע על הממוצע. לפיכך, בנוכחות חריגים הממוצע לבדו לא ייתן תמונה נכונה לגבי מרכז מערך הנתונים.

החציון הוא נקודת הנתונים שנמצאת באמצע המדויק של מערך הנתונים. אחת הדרכים לחשב את החציון היא לסדר את נקודות הנתונים בסדר עולה, ולאחר מכן לאתר את נקודת הנתונים באמצע. לדוגמה, אם פעם אחת הוזמן, מערך הנתונים הקודם נראה כמו, 62, 63, 65, 70, 70, 72, 72, 77, 79, 80.לכן, (70+72)/2=71 נמצא באמצע. מכאן, ניתן לראות שהחציון אינו חייב להיות במערך הנתונים. החציון אינו מושפע מנוכחות החריגים. לפיכך, החציון ישמש מדד טוב יותר לנטייה מרכזית בנוכחות חריגים.

המצב הוא הערך השכיח ביותר בקבוצת הנתונים. בדוגמה הקודמת, הערך 70 ו-72 מתרחשים שניהם פעמיים ולכן, שניהם מצבים. זה מראה כי בהפצות מסוימות, יש יותר מערך מודאלי אחד. אם יש רק מצב אחד, מערך הנתונים הוא לא-מודאלי, במקרה זה, מערך הנתונים הוא דו-מודאלי.

מה זה פיזור?

פיזור הוא כמות התפשטות הנתונים על מרכז ההפצה. טווח וסטיית תקן הם המדדים הנפוצים ביותר לפיזור.

הטווח הוא פשוט הערך הגבוה ביותר פחות הערך הנמוך ביותר. בדוגמה הקודמת, הערך הגבוה ביותר הוא 80 והערך הנמוך ביותר הוא 62, כך שהטווח הוא 80-62=18. אבל הטווח אינו מספק תמונה מספקת לגבי הפיזור.

כדי לחשב את סטיית התקן, תחילה מחושבות את הסטיות של ערכי הנתונים מהממוצע. ממוצע ריבוע השורש של סטיות נקרא סטיית התקן. בדוגמה הקודמת, הסטיות המתאימות מהממוצע הן (70 - 71)=-1, (62 - 71)=-9, (65 - 71)=-6, (72 - 71)=1, (80 - 71)=9, (70 - 71)=-1, (63 - 71)=-8, (72 - 71)=1, (77 - 71)=6 ו- (79 - 71)=8. הסכום של ריבועי הסטייה הם (-1)2 + (-9)2 + (-6)2+ 12 + 92 + (-1)2 + (-8) 2 + 12 + 62 + 82=366 סטיית התקן היא √(366/10)=6.05 (בקילוגרמים). אלא אם מערך הנתונים מוטה מאוד, מכאן ניתן להסיק שרוב הנתונים נמצאים במרווח 71±6.05, וזה אכן כך בדוגמה הספציפית הזו.

מה ההבדל בין נטייה מרכזית לפיזור?

• נטייה מרכזית מתייחסת ומאתרת את מרכז התפלגות הערכים

• פיזור הוא כמות התפשטות הנתונים על מרכז מערך הנתונים.

מוּמלָץ: