הבדל בין כריית נתונים לאחסון נתונים

הבדל בין כריית נתונים לאחסון נתונים
הבדל בין כריית נתונים לאחסון נתונים

וִידֵאוֹ: הבדל בין כריית נתונים לאחסון נתונים

וִידֵאוֹ: הבדל בין כריית נתונים לאחסון נתונים
וִידֵאוֹ: Фен профессиональный! Как держать фен! Как выбрать фен для волос! 2024, יולי
Anonim

כריית נתונים לעומת אחסון נתונים

כריית נתונים ואחסון נתונים הן טכניקות חזקות מאוד ופופולריות לניתוח נתונים. משתמשים הנוטים לסטטיסטיקה משתמשים ב-Data Mining. הם משתמשים במודלים סטטיסטיים כדי לחפש דפוסים נסתרים בנתונים. כורי נתונים מעוניינים למצוא קשרים שימושיים בין מרכיבי נתונים שונים, מה שבסופו של דבר רווחי לעסקים. אבל מצד שני, מומחי נתונים שיכולים לנתח מימדים של העסק ישירות נוטים להשתמש במחסני נתונים.

כריית נתונים ידועה גם בשם Knowledge Discovery in data (KDD). כאמור, זהו תחום של מדעי המחשב, העוסק בחילוץ מידע לא ידוע ומעניין עד כה מנתונים גולמיים.בשל הגידול האקספוננציאלי של נתונים, במיוחד בתחומים כמו עסקים, כריית נתונים הפכה לכלי חשוב מאוד להמרת עושר גדול זה של נתונים לבינה עסקית, שכן חילוץ ידני של דפוסים הפך לכאורה לבלתי אפשרי בעשורים האחרונים. לדוגמה, הוא משמש כיום עבור יישומים שונים כגון ניתוח רשתות חברתיות, גילוי הונאה ושיווק. כריית נתונים עוסקת בדרך כלל בארבע המשימות הבאות: אשכולות, סיווג, רגרסיה ושיוך. אשכול הוא זיהוי קבוצות דומות מנתונים לא מובנים. סיווג הוא כללי למידה שניתן ליישם על נתונים חדשים ובדרך כלל יכלול את השלבים הבאים: עיבוד מקדים של נתונים, עיצוב מודלים, למידה/בחירת תכונות והערכה/אימות. רגרסיה היא מציאת פונקציות עם מינימום שגיאות למודל נתונים. והאסוציאציה מחפשת קשרים בין משתנים. כריית נתונים משמשת בדרך כלל כדי לענות על שאלות כמו מהם המוצרים העיקריים שעשויים לעזור להשיג רווח גבוה בשנה הבאה בוול-מארט?

כפי שצוין לעיל, מחסני נתונים משמשים גם לניתוח נתונים, אבל על ידי קבוצות שונות של משתמשים ומטרה מעט שונה בראש. לדוגמה, כשמדובר במגזר הקמעונאי, משתמשי מחסני נתונים מודאגים יותר מאילו סוגי רכישות פופולריים בקרב לקוחות, כך שתוצאות הניתוח יכולות לעזור ללקוח על ידי שיפור חווית הלקוח. אבל כורי נתונים משערים תחילה השערה כגון אילו לקוחות קונים סוג מסוים של מוצר ומנתחים את הנתונים כדי לבדוק את ההשערה. אחסון נתונים יכול להתבצע על ידי קמעונאי גדול שבהתחלה מחזיק בחנויות שלו באותם גדלים של מוצרים כדי לגלות מאוחר יותר שחנויות בניו יורק מוכרות מלאי בגדלים קטנים הרבה יותר מהר מאשר בחנויות שיקגו. לכן, על ידי התבוננות בתוצאה זו, הקמעונאי יכול למלא את החנות בניו יורק בגדלים קטנים יותר בהשוואה לחנויות בשיקגו.

אז, כפי שאתה יכול לראות בבירור, שני סוגי הניתוח הללו נראים בעלי אופי זהה בעין בלתי מזוינת.שניהם חוששים מהגדלת הרווחים על סמך הנתונים ההיסטוריים. אבל כמובן, יש הבדלים עיקריים. במילים פשוטות, כריית נתונים ומחסני נתונים מוקדשים לספק סוגים שונים של ניתוח, אבל בהחלט עבור סוגים שונים של משתמשים. במילים אחרות, כריית נתונים מחפשת מתאמים, דפוסים לתמיכה בהשערה סטטיסטית. אבל, מחסני נתונים עונה על שאלה רחבה יותר באופן יחסי, והוא חותך וחותך נתונים משם והלאה כדי לזהות דרכים לשיפור בעתיד.

מוּמלָץ: