שונות לעומת שיתופיות
שונות ושונות הם שני מדדים המשמשים בסטטיסטיקה. שונות היא מדד לפיזור הנתונים, ושונות מציינת את מידת השינוי של שני משתנים אקראיים יחד. שונות היא מושג אינטואיטיבי, אבל שונות מוגדרת מתמטית בהתחלה לא כל כך אינטואיטיבית.
עוד על Variance
שונות היא מדד לפיזור הנתונים מהערך הממוצע של ההתפלגות. זה אומר כמה רחוקות נקודות הנתונים מממוצע ההתפלגות. זהו אחד המתארים העיקריים של התפלגות ההסתברות ואחד מרגעי ההתפלגות.כמו כן, השונות היא פרמטר של האוכלוסייה, והשונות של מדגם מהאוכלוסייה משמשת כאומד לשונות של האוכלוסייה. מנקודת מבט אחת, הוא מוגדר כריבוע של סטיית התקן.
בשפה פשוטה, ניתן לתאר אותו כממוצע הריבועים של המרחק בין כל נקודת נתונים לממוצע ההתפלגות. הנוסחה הבאה משמשת לחישוב השונות.
Var(X)=E[(X-µ)2] עבור אוכלוסייה, ו
Var(X)=E[(X-‾x)2] עבור דוגמה
ניתן לפשט עוד יותר לתת Var(X)=E[X2]-(E[X])2.
Variance יש כמה מאפייני חתימה, והיא משמשת לעתים קרובות בסטטיסטיקה כדי להפוך את השימוש לפשוט יותר. השונות אינה שלילית כי היא הריבוע של המרחקים. עם זאת, טווח השונות אינו מוגבל ותלוי בהתפלגות המסוימת. השונות של משתנה אקראי קבוע היא אפס, והשונות לא משתנה ביחס לפרמטר מיקום.
עוד על Covariance
בתאוריה סטטיסטית, שונות משתנים היא מדד לכמה שני משתנים אקראיים משתנים יחד. במילים אחרות, שיתופיות היא מדד לעוצמת המתאם בין שני משתנים אקראיים. כמו כן, זה יכול להיחשב כהכללה של מושג השונות של שני משתנים אקראיים.
שונות של שני משתנים אקראיים X ו-Y, המחולקים יחד עם מומנטום שני סופי, ידועה כ-σXY=E[(X-E[X])(Y-E[י])]. מכאן, ניתן לראות בשונות מקרה מיוחד של שיתופיות, כאשר שני משתנים זהים. Cov(X, X)=Var(X)
על ידי נרמול השונות, ניתן לקבל את מקדם המתאם הליניארי או את מקדם המתאם של פירסון, המוגדר כ-ρ=E[(X-E[X])(Y-E[Y])]/(σ X σY)=(Cov(X, Y))/(σX σY )
מבחינה גרפית, ניתן לראות בשונות בין זוג נקודות נתונים כשטח של המלבן עם נקודות הנתונים בקודקודים מנוגדים.זה יכול להתפרש כמדד לגודל ההפרדה בין שתי נקודות הנתונים. בהתחשב במלבנים עבור כלל האוכלוסייה, ניתן להתייחס לחפיפת המלבנים התואמים לכל נקודות הנתונים כחוזק ההפרדה; שונות של שני המשתנים. השונות היא בשני מימדים, בגלל שני משתנים, אבל הפישוט שלה למשתנה אחד נותן את השונות של יחיד בתור ההפרדה בממד אחד.
מה ההבדל בין שונות ל-Covariance?
• שונות היא המדד של התפשטות/פיזור באוכלוסיה בעוד ששונות שותפות נחשבת כמדד לשונות של שני משתנים אקראיים או עוצמת המתאם.
• שונות יכולה להיחשב כמקרה מיוחד של שונות.
• שונות ושונות תלויות בגודל ערכי הנתונים, ולא ניתן להשוות אותן; לכן, הם מנורמלים. השונות מנורמלת למקדם המתאם (מחלקים במכפלת סטיות התקן של שני המשתנים האקראיים) והשונות מנורמלת לסטיית התקן (על ידי נטילת השורש הריבועי)