הבדל מפתח – למידה מפוקחת לעומת ללא פיקוח
למידה בפיקוח ולמידה ללא פיקוח הם שני מושגי ליבה של למידת מכונה. למידה מפוקחת היא משימת למידת מכונה של לימוד פונקציה הממפה קלט לפלט בהתבסס על צמדי קלט-פלט לדוגמה. למידה ללא פיקוח היא משימת למידת מכונה של הסקת פונקציה לתיאור מבנה נסתר מנתונים לא מסומנים. ההבדל העיקרי בין למידת מכונה מפוקחת ללא פיקוח הוא שלמידה מפוקחת משתמשת בנתונים מסומנים בעוד שלמידה לא מפוקחת משתמשת בנתונים ללא תווית.
Machine Learning הוא תחום במדעי המחשב שנותן את היכולת למערכת מחשוב ללמוד מנתונים מבלי שתוכנתה במפורש.הוא מאפשר לנתח את הנתונים ולחזות דפוסים בהם. ישנם יישומים רבים של למידת מכונה. חלקם הם זיהוי פנים, זיהוי מחוות וזיהוי דיבור. ישנם אלגוריתמים שונים הקשורים ללמידת מכונה. חלקם הם רגרסיה, סיווג והתקבצות. שפות התכנות הנפוצות ביותר לפיתוח יישומים מבוססי למידת מכונה הן R ו-Python. ניתן להשתמש גם בשפות אחרות כגון Java, C++ ו-Matlab.
מה זה למידה בפיקוח?
במערכות מבוססות למידת מכונה, המודל עובד לפי אלגוריתם. בלמידה מפוקחת, המודל מפוקח. ראשית, נדרש להכשיר את המודל. עם הידע שנצבר, הוא יכול לחזות תשובות למקרים העתידיים. המודל מאומן באמצעות מערך נתונים מסומן. כאשר נתונים מחוץ לדגימה ניתנים למערכת, היא יכולה לחזות את התוצאה. להלן תמצית קטנה ממערך הנתונים הפופולרי של IRIS.
לפי הטבלה לעיל, אורך גביע, רוחב גביע, אורך פאטל, רוחב פאטל ומינים נקראים התכונות. העמודות ידועות כתכונות. שורה אחת מכילה נתונים עבור כל התכונות. לכן, שורה אחת נקראת תצפית. הנתונים יכולים להיות מספריים או קטגוריים. המודל מקבל את התצפיות עם שם המין המתאים כקלט. כאשר ניתנת תצפית חדשה, המודל צריך לחזות את סוג המין שאליו הוא שייך.
בלמידה מפוקחת, ישנם אלגוריתמים לסיווג ורגרסיה. סיווג הוא תהליך סיווג הנתונים המסומנים. המודל יצר גבולות שהפרידו בין קטגוריות הנתונים. כאשר נתונים חדשים מסופקים למודל, הוא יכול לסווג על סמך היכן הנקודה קיימת.ה-K-Nearest Neighbors (KNN) הוא מודל סיווג. בהתאם לערך k, הקטגוריה נקבעת. לדוגמה, כאשר k הוא 5, אם נקודת נתונים מסוימת קרובה לשמונה נקודות נתונים בקטגוריה A ושש נקודות נתונים בקטגוריה B, אזי נקודת הנתונים תסווג כ-A.
הרגרסיה היא תהליך של חיזוי המגמה של הנתונים הקודמים כדי לחזות את התוצאה של הנתונים החדשים. ברגרסיה, הפלט יכול להיות מורכב ממשתן רציף אחד או יותר. חיזוי נעשה באמצעות קו המכסה את רוב נקודות הנתונים. מודל הרגרסיה הפשוט ביותר הוא רגרסיה לינארית. זה מהיר ואינו דורש פרמטרים של כוונון כמו ב-KNN. אם הנתונים מראים מגמה פרבולית, אז מודל הרגרסיה הליניארית אינו מתאים.
אלה הן כמה דוגמאות של אלגוריתמי למידה בפיקוח. בדרך כלל, התוצאות המופקות משיטות למידה מפוקחות מדויקות ואמינות יותר מכיוון שנתוני הקלט ידועים ומסומנים היטב. לכן, המכונה צריכה לנתח רק את הדפוסים הנסתרים.
מה זה למידה ללא פיקוח?
בלמידה ללא פיקוח, המודל אינו מפוקח. המודל עובד בעצמו, כדי לחזות את התוצאות. הוא משתמש באלגוריתמים של למידת מכונה כדי להגיע למסקנות על נתונים לא מסומנים. בדרך כלל, אלגוריתמי הלמידה הבלתי מפוקחים קשים יותר מאלגוריתמי הלמידה המפוקחים מכיוון שיש מעט מידע. אשכולות הם סוג של למידה ללא פיקוח. ניתן להשתמש בו כדי לקבץ את הנתונים הלא ידועים באמצעות אלגוריתמים. ממוצע ה-k והצפיפות המבוסס על צפיפות הם שני אלגוריתמים של אשכולות.
אלגוריתם k-mean, מציב k centroid באופן אקראי עבור כל אשכול. אז כל נקודת נתונים מוקצית למרכז הקרוב ביותר. מרחק אוקלידי משמש לחישוב המרחק מנקודת הנתונים למרכז. נקודות הנתונים מסווגות לקבוצות. המיקומים עבור k centroids מחושבים שוב. מיקום המרכז החדש נקבע לפי הממוצע של כל הנקודות בקבוצה. שוב כל נקודת נתונים מוקצית למרכז הקרוב ביותר.תהליך זה חוזר על עצמו עד שהצנטרואידים אינם משתנים עוד. k-mean הוא אלגוריתם מקבץ מהיר, אך אין אתחול מוגדר של נקודות מקבץ. כמו כן, קיימת וריאציה גבוהה של דגמי אשכול המבוססים על אתחול של נקודות אשכול.
אלגוריתם אשכול נוסף הוא אשכול מבוסס צפיפות. זה ידוע גם בשם יישומי אשכולות מרחביים מבוססי צפיפות עם רעש. זה עובד על ידי הגדרת אשכול כקבוצה המקסימלית של נקודות מחוברות בצפיפות. הם שני פרמטרים המשמשים לאשכול מבוסס צפיפות. הם Ɛ (אפסילון) ונקודות מינימום. ה-Ɛ הוא הרדיוס המרבי של השכונה. הנקודות המינימליות הן המספר המינימלי של נקודות בשכונה Ɛ להגדרת אשכול. אלו הן כמה דוגמאות לאשכולות הנופלת ללמידה ללא פיקוח.
בדרך כלל, התוצאות המופקות מאלגוריתמי למידה ללא פיקוח אינן מדויקות ואמינות במיוחד מכיוון שהמכונה צריכה להגדיר ולתייג את נתוני הקלט לפני קביעת התבניות והפונקציות המוסתרות.
מהו הדמיון בין למידת מכונה בפיקוח ללא פיקוח?
למידה בפיקוח וגם ללא פיקוח הם סוגים של למידת מכונה
מה ההבדל בין למידת מכונה בפיקוח ללא פיקוח?
למידת מכונה בפיקוח לעומת ללא פיקוח |
|
למידה מפוקחת היא המשימה של למידת מכונה של לימוד פונקציה שממפה קלט לפלט בהתבסס על זוגות קלט-פלט לדוגמה. | למידה ללא פיקוח היא משימת הלמידה המכונה של הסקת פונקציה לתיאור מבנה נסתר מנתונים ללא תווית. |
פונקציונליות עיקרית | |
בלמידה מפוקחת, המודל חוזה את התוצאה על סמך נתוני הקלט המסומנים. | בלמידה ללא פיקוח, המודל חוזה את התוצאה ללא נתונים מסומנים על ידי זיהוי הדפוסים בעצמו. |
דיוק התוצאות | |
התוצאות שנוצרו משיטות למידה מפוקחות מדויקות ואמינות יותר. | התוצאות שנוצרו משיטות למידה ללא פיקוח אינן מדויקות ואמינות במיוחד. |
אלגוריתמים עיקריים | |
יש אלגוריתמים לרגרסיה וסיווג בלמידה מפוקחת. | ישנם אלגוריתמים לאשכולות בלמידה ללא פיקוח. |
סיכום – למידת מכונה בפיקוח לעומת ללא פיקוח
למידה מפוקחת ולמידה ללא פיקוח הם שני סוגים של למידת מכונה.למידה מפוקחת היא משימת למידת מכונה של לימוד פונקציה הממפה קלט לפלט בהתבסס על זוגות קלט-פלט לדוגמה. למידה ללא פיקוח היא משימת למידת מכונה של הסקת פונקציה לתיאור מבנה נסתר מנתונים ללא תווית. ההבדל בין למידת מכונה מפוקחת ללא פיקוח הוא שלמידה מפוקחת משתמשת בנתונים מסומנים בעוד שהישענות ללא פיקוח משתמשת בנתונים ללא תווית.