רגרסיה לעומת מתאם
בסטטיסטיקה, קביעת הקשר בין שני משתנים אקראיים חשובה. זה נותן את היכולת לבצע תחזיות לגבי משתנה אחד ביחס לאחרים. ניתוח רגרסיה ומתאם מיושמים בתחזיות מזג אוויר, התנהגות בשוק הפיננסי, יצירת קשרים פיזיים על ידי ניסויים, ובתרחישים הרבה יותר בעולם האמיתי.
מהי רגרסיה?
רגרסיה היא שיטה סטטיסטית המשמשת לציור היחס בין שני משתנים. לעתים קרובות כאשר נתונים נאספים עשויים להיות משתנים התלויים באחרים.ניתן לקבוע את הקשר המדויק בין אותם משתנים רק על ידי שיטות הרגרסיה. קביעת קשר זה עוזרת להבין ולחזות את ההתנהגות של משתנה אחד למשנהו.
היישום הנפוץ ביותר של ניתוח הרגרסיה הוא להעריך את הערך של המשתנה התלוי עבור ערך נתון או טווח ערכים של המשתנים הבלתי תלויים. לדוגמה, באמצעות רגרסיה נוכל לקבוע את הקשר בין מחיר הסחורה לצריכה, בהתבסס על הנתונים שנאספו ממדגם אקראי. ניתוח רגרסיה מייצר את פונקציית הרגרסיה של מערך נתונים, שהוא מודל מתמטי המתאים ביותר לנתונים הזמינים. זה יכול להיות מיוצג בקלות על ידי עלילת פיזור. מבחינה גרפית, רגרסיה שווה ערך למציאת עקומת ההתאמה הטובה ביותר עבור מערך הנתונים. הפונקציה של העקומה היא פונקציית הרגרסיה. באמצעות המודל המתמטי, ניתן לחזות את הביקוש של סחורה עבור מחיר נתון.
לכן, ניתוח הרגרסיה נמצא בשימוש נרחב בחיזוי וחיזוי.הוא משמש גם לביסוס קשרים בנתונים ניסיוניים, בתחומי הפיזיקה, הכימיה ודיסציפלינות רבות של מדעי הטבע והנדסה. אם הקשר או פונקציית הרגרסיה הם פונקציה לינארית, אז התהליך ידוע בתור רגרסיה ליניארית. בעלילת הפיזור ניתן לייצג אותו כקו ישר. אם הפונקציה אינה שילוב ליניארי של הפרמטרים, הרגרסיה היא לא ליניארית.
מה זה מתאם?
קורלציה היא מדד לחוזק הקשר בין שני משתנים. מקדם המתאם מכמת את מידת השינוי במשתנה אחד בהתבסס על השינוי במשתנה השני. בסטטיסטיקה מתאם קשור למושג התלות שהוא הקשר הסטטיסטי בין שני משתנים.
מקדם המתאם של הפירסונס או רק מקדם המתאם r הוא ערך בין -1 ל-1 (-1≤r≤+1). זהו מקדם המתאם הנפוץ ביותר ותקף רק עבור קשר ליניארי בין המשתנים.אם r=0, לא קיים קשר, ואם r≥0, הקשר הוא פרופורציונלי; כלומר ערכו של משתנה אחד עולה עם עלייתו של השני. אם r≤0, הקשר הוא פרופורציונלי הפוך; כלומר, משתנה אחד פוחת ככל שהשני גדל.
בגלל תנאי הליניאריות, ניתן להשתמש במקדם המתאם r גם כדי לקבוע נוכחות של קשר ליניארי בין המשתנים.
מה ההבדל בין רגרסיה לקורלציה?
רגרסיה נותנת את צורת הקשר בין שני משתנים אקראיים, והמתאם נותן את מידת החוזק של הקשר.
ניתוח רגרסיה מייצר פונקציית רגרסיה, שעוזרת להפקיר ולחזות תוצאות בעוד שמתאם עשוי לספק מידע רק באיזה כיוון הוא עשוי להשתנות.
מודלים של רגרסיה לינארית מדויקים יותר ניתנים על ידי הניתוח, אם מקדם המתאם גבוה יותר. (|r|≥0.8)