הבדל בין RDBMS ל-Hadoop

תוכן עניינים:

הבדל בין RDBMS ל-Hadoop
הבדל בין RDBMS ל-Hadoop

וִידֵאוֹ: הבדל בין RDBMS ל-Hadoop

וִידֵאוֹ: הבדל בין RDBMS ל-Hadoop
וִידֵאוֹ: MySQL vs MongoDB 2024, נוֹבֶמבֶּר
Anonim

ההבדל העיקרי בין RDBMS ל-Hadoop הוא שה-RDBMS מאחסן נתונים מובנים בעוד שה-Hadoop מאחסן נתונים מובנים, חצי-מובנים ולא מובנים.

The RDBMS היא מערכת ניהול מסד נתונים המבוססת על המודל ההתייחסותי. ה-Hadoop היא תוכנה לאחסון נתונים והפעלת יישומים על אשכולות של חומרה סחורות.

תמונה
תמונה

מה זה RDBMS?

RDBMS ראשי תיבות של Relational Database Management System המבוסס על המודל ההתייחסותי.ב-RDBMS, טבלאות משמשות לאחסון נתונים, ומפתחות ואינדקסים עוזרים לחבר את הטבלאות. טבלה היא אוסף של רכיבי נתונים, והם הישויות. הוא מכיל שורות ועמודות. השורות מייצגות ערך בודד בטבלה. העמודות מייצגות את התכונות.

לדוגמה, מסד הנתונים של המכירות יכול לכלול ישויות של לקוחות ושל מוצר. ללקוח יכולים להיות מאפיינים כגון מזהה_לקוח, שם, כתובת, מספר_טלפון. לפריט יכולים להיות מאפיינים כגון product_id, name וכו'. המפתח הראשי של טבלת הלקוח הוא customer_id בעוד המפתח הראשי של טבלת המוצר הוא product_id. מיקום ה-product_id בטבלת הלקוח כמפתח זר מחבר בין שתי הישויות הללו. כמו כן, גם הטבלאות קשורות זו לזו. הם מספקים שלמות נתונים, נורמליזציה ועוד רבים אחרים. מעטים מה-RDBMS הנפוצים הם MySQL, MSSQL ו-Oracle. הם משתמשים ב-SQL עבור שאילתות.

מה זה Hadoop?

The Hadoop היא מסגרת קוד פתוח של Apache שנכתבה ב-Java.זה עוזר לאחסן ולעבד כמות גדולה של נתונים על פני אשכולות מחשבים באמצעות מודלים פשוטים של תכנות. המטרה העיקרית של Hadoop היא לאחסן ולעבד Big Data, המתייחס לכמות גדולה של נתונים מורכבים. התפוקה של Hadoop, שהיא היכולת לעבד נפח נתונים בתוך פרק זמן מסוים, היא גבוהה.

ההבדל בין RDBMS ו- Hadoop
ההבדל בין RDBMS ו- Hadoop

יש ארבעה מודולים בארכיטקטורת Hadoop. הם Hadoop common, YARN, Hadoop Distributed File System (HDFS) ו-Hadoop MapReduce. המודול המשותף מכיל את ספריות ותוכניות השירות של Java. יש לו גם את הקבצים להפעלת Hadoop. Hadoop YARN מבצעת את תזמון העבודה וניהול משאבי האשכולות.

יתר על כן, מערכת הקבצים המבוזרת של Hadoop (HDFS) היא מערכת האחסון של Hadoop. הוא משתמש בארכיטקטורת מאסטר-עבד.הצומת הראשי הוא ה-NameNode, והוא מנהל את המטא נתונים של מערכת הקבצים. מחשבים אחרים הם צמתים עבדים או DataNodes. הם מאחסנים את הנתונים בפועל. מצד שני, Hadoop MapReduce עושה את החישוב המבוזר. יש לו את האלגוריתמים לעבד את הנתונים. ב-HDFS, לצומת המאסטר יש מעקב אחר עבודה. הוא מריץ משרות הפחתת מפות בצמתי העבדים. יש מעקב אחר משימות לכל צומת עבד כדי להשלים את עיבוד הנתונים ולשלוח את התוצאה חזרה לצומת הראשי. בסך הכל, ה-Hadoop מספק אחסון מאסיבי של נתונים עם כוח עיבוד גבוה.

מה ההבדל בין RDBMS ל-Hadoop?

RDBMS לעומת Hadoop

RDBMS היא תוכנת מערכת ליצירה וניהול של מסדי נתונים המבוססים על המודל היחסי. Hadoop הוא אוסף של תוכנות קוד פתוח שמחברים מחשבים רבים כדי לפתור בעיות הכרוכות בכמות גדולה של נתונים וחישוב.
מגוון נתונים
RDBMS מאחסן נתונים מובנים. Hadoop מאחסנת נתונים מובנים, חצי מובנים ולא מובנים.
אחסון נתונים
RDBMS מאחסן כמות נתונים ממוצעת. Hadoop מאחסנת כמות גדולה של נתונים מאשר RDBMS.
Speed
ב-RDBMS, הקריאה מהירה. ב-Hadoop, הקריאה והכתיבה מהירה.
סקלביליות
ל-RDBMS יש מדרגיות אנכית. ל-Hadoop יש מדרגיות אופקית.
Hardware
RDBMS משתמשים בשרתים מתקדמים. Hadoop משתמשת בחומרה סחורה.
תפוקה
RDBMS התפוקה גבוהה יותר. תפוקת Hadoop נמוכה יותר.

סיכום – RDBMS לעומת Hadoop

מאמר זה דן בהבדל בין RDBMS ל-Hadoop. ההבדל העיקרי בין RDBMS ל-Hadoop הוא שה-RDBMS מאחסן נתונים מובנים בעוד שה-Hadoop מאחסן נתונים מובנים, חצי מובנים ולא מובנים.

מוּמלָץ: