רגרסיה לינארית לעומת לוגיסטית
בניתוח סטטיסטי, חשוב לזהות את הקשרים בין המשתנים הנוגעים למחקר. לפעמים זה עשוי להיות המטרה היחידה של הניתוח עצמו. כלי חזק אחד שנעשה בו שימוש כדי לבסס את קיומו של קשר ולזהות את הקשר הוא ניתוח רגרסיה.
הצורה הפשוטה ביותר של ניתוח רגרסיה היא רגרסיה לינארית, כאשר היחס בין המשתנים הוא קשר ליניארי. במונחים סטטיסטיים, הוא מביא את הקשר בין המשתנה המסביר למשתנה התגובה. לדוגמה, באמצעות רגרסיה נוכל לקבוע את הקשר בין מחיר הסחורה לצריכה בהתבסס על נתונים שנאספו ממדגם אקראי.ניתוח רגרסיה ייצור פונקציית רגרסיה של מערך הנתונים, שהוא מודל מתמטי המתאים ביותר לנתונים הזמינים. זה יכול להיות מיוצג בקלות על ידי עלילת פיזור. מבחינה גרפית רגרסיה שווה למציאת עקומת ההתאמה הטובה ביותר עבור מערך הנתונים הנתון. הפונקציה של העקומה היא פונקציית הרגרסיה. באמצעות המודל המתמטי ניתן לחזות את השימוש בסחורה עבור מחיר נתון.
לכן, ניתוח הרגרסיה נמצא בשימוש נרחב בחיזוי וחיזוי. הוא משמש גם לביסוס היחסים בנתונים ניסיוניים, בתחומי הפיזיקה, הכימיה, ובדיסציפלינות רבות של מדעי הטבע וההנדסה. אם הקשר או פונקציית הרגרסיה הם פונקציה לינארית, אז התהליך ידוע בתור רגרסיה ליניארית. בעלילת הפיזור ניתן לייצג אותו כקו ישר. אם הפונקציה אינה שילוב ליניארי של הפרמטרים, הרגרסיה היא לא ליניארית.
רגרסיה לוגיסטית דומה לרגרסיה רב-משתנית, והיא יוצרת מודל להסבר ההשפעה של מספר מנבאים על משתנה תגובה.עם זאת, ברגרסיה לוגיסטית, משתנה התוצאה הסופית צריך להיות קטגורי (בדרך כלל מחולק; כלומר, צמד תוצאות ברות השגה, כמו מוות או הישרדות, אם כי טכניקות מיוחדות מאפשרות מודלים של מידע מסווג יותר). ניתן להפוך משתנה תוצאה מתמשך למשתנה קטגורי, שישמש לרגרסיה לוגיסטית; עם זאת, קריסת משתנים רציפים באופן זה מופחתת בעיקר מכיוון שהיא מפחיתה את הדיוק.
בניגוד ברגרסיה הליניארית, לכיוון הממוצע, המשתנים המנבאים ברגרסיה לוגיסטית אינם חייבים להיות מאולצים להיות מחוברים ליניאריים, מפוזרים בדרך כלל, או להיות בעלי שונות שווה בתוך כל אשכול. כתוצאה מכך, היחס בין המנבא למשתני התוצאה לא צפוי להיות פונקציה לינארית.
מה ההבדל בין רגרסיה לוגיסטית ללינארית?
• ברגרסיה ליניארית, מניחים קשר ליניארי בין המשתנה ההסברתי למשתנה התגובה, ומוצאים פרמטרים העונים על המודל על ידי ניתוח, כדי לתת את הקשר המדויק.
• רגרסיה לינארית מתבצעת עבור משתנים כמותיים, והפונקציה המתקבלת היא כמותית.
• ברגרסיה הלוגיסטית, הנתונים שבהם נעשה שימוש יכולים להיות קטגוריים או כמותיים, אבל התוצאה היא תמיד קטגורית.