מאמרים

מה הם בסיסי נתונים ואיך מנהלים אותם?

מסד נתונים או בשמו האחר בסיס נתונים הוא מאגר מידע, המנקז אליו נתונים מאינספור מקורות. נתונים אלו יכולים להיות פנים ארגוניים כמו רשימות, טבלאות, מעקב אחר נושאים שונים או חוץ ארגוניים כמו ניתוח מידע מפורטלים אינטרנטיים, ניתוח מידע על מתחרים, מעקב אחר לידים ברשתות החברתיות ובקמפיינים השיווקיים וכן הלאה. באמצעות מערכות בסיסי הנתונים הארגון מפיק דוחות בנושאים הנוגעים לניהול השוטף, כך למשל הארגון יכול לעקוב אחר מצבת המלאי של פריטים מסוימים, ניצול שעות עבודה, היקף מכירות, מעקב אחר תקציב, ריכוז וניתוח מידע אודות הלקוחות וכן הלאה. על מנת להבטיח את אמינות הנתונים נדרש להסתייע במערכות בסיסי נתונים.  

מההיבט הטכנולוגי מסד הנתונים מבוסס על תוכנה, המאחסנת את המידע, מנהלת אותו ומאפשרת את שליפתו לצורך ניתוח מידע, הפקת דוחות, תרשימים, טבלאות. ארגונים קטנים מסתפקים בקבצי אקסל או אקסס, ובהם ניתן להציג את המידע במגוון דרכים, לנתח אותו ולבצע עליו חישובים. לעומתם ארגונים גדולים נדרשים למערכות בסיסי נתונים במטרה להתמודד עם היקפי מסדי המידע, המשמשים אותם ולממש יכולות מתקדמות, ביניהן התממשקות אל מערכות בסיסי נתונים אחרות בארגון, סינון ומיון של מידע, ניתוח מידע מובנה והצגתו בלוח מחוונים (דשבורד) ייעודי, המשמש לקבלת החלטות. 

הנה שתי דוגמאות לשימושים במסדי נתונים: הדוגמה הראשונה עוסקת בגורם חוץ ארגוני, המעוניין לקבל ניתוח מידע בנוגע לפריט מסוים. כך למשל לקוח קבוע בעל הסכם מסגרת, המעוניין לבצע הזמנת רכש לארגון שלו דרך פורטל מכירות, יוכל לצפות ברשימה מובנית של פריטים ומחירים התואמים את החוזה, שחתם עם המוכר. מאחורי הקלעים של תצוגה זו פועל מסד נתונים, אשר אוסף את הנתונים התואמים את שאילתת החיפוש של הרוכש באופן אוטומטי.

דוגמה אחרת עוסקת בשימוש של ניתוח מידע לצרכים פנים ארגוניים, כך למשל מנהל המחסן מעוניין לעקוב אחר לוטים, שתוקפם עתיד לפוג בחודש הקרוב. לצורך כך הוא מריץ שאילתה בלוח המחוונים (דשבורד) במערכת ה-BI. במקביל מסד הנתונים מושך את רשימת הפריטים בהתאם לפריטי השאילתה: סוג הפריט, המחסן ומועד התוקף.

אילו מודלים של בסיסי נתונים קיימים

בסיסי הנתונים מסווגים לשתי קטגוריות: מסד נתונים רלציוני (Relational  database) ומסד נתונים שאינו רלציוני (Non-relational database) . שני מסדי הנתונים נבדלים זה מזה בשני מאפיינים:

  1. באופן בו הם מסווגים את המידע – מסדי נתונים רלציונים מסווגים מידע בטבלאות ובסכמות ומושכים אותו באמצעות קוד, לעומתם מסכי נתונים לא-רלציונים מסווגים מידע בצורת מסמך, כ”משפחה” או ערכי מפתח שונים, במטרה לרכז מידע ממגוון רחב של מקורות וממגוון רחב של פורמטים
  2. בקיבולת שלהם- כך למשל מסדי נתונים רלציונים פועלים על שרת אחד ואילו מסדי נתונים לא-רלציונים יכולים לפעול על מספר רב של שרתים.

מה זה בסיס נתונים רלציוני

בסיס נתונים רלציוני (Relational database) – ידוע גם כ – RDBMS ובנוי על בסיס טבלאות, כאשר כל טבלה מרכזת נתונים על ישות מסוימת במערכת, כך למשל: טבלה המרכזת את שמות אנשי המכירות, טבלה המרכזת קטגוריה של מוצרים, טבלה עם רשימת לקוחות, רשימת ספקים וכן הלאה.  לכל ישות במערכת מצורף קוד זיהוי (מספר קטלוגי, מספר זהות, מספר לקוח, מספר הזמנה וכן הלאה) כך שבעת ההקלדה של הקוד המזהה, נשלף המידע המקושר אליו בסכמה- כלומר- היקף המכירות, שבוצעו בסניף X, בתאריך Y על ידי מוכרן Z מאפיין זה מקל על תהליך ניתוח המידע. כדי לוודא שהמידע הנמשך לשדה בבסיס הנתונים מהימן ותואם יש להגדיר את השדה מבעוד מועד, כך למשל תאריך מופיע בפורמט מסוים וכולל ספרות בלבד, תעודת זהות מוגבלת לתשעה תווים ושדה של שם יכלול אותיות בלבד ללא מספרים. יתרון נוסף שיש לבסיס נתונים זה הוא היכולת לקשר בין טבלאות שונות, כך למשל, פריטי “אב” בעץ מוצר יקושרו לטבלאות הנוגעות לפרטי “הבנים”. ישנם מספר בסיסי נתונים רלציונים, הידועים ביניהם הם: SQL Server, MySQL, , DB2, PostgreSQL Oracle ו-IBM.

  • MySQL – מסד נתונים המבוסס על שפת המחשב לעיבוד מידע – (SQL (Structured Query Language נמצא בבעלותה של חברת התוכנה Oracle. התוכנה מהווה את הבסיס לאתרי תוכן רווחים כמו אתר “ויקיפדיה”, מערכות בסיסי נתונים לניהול תוכן שונות, על בסיס דפי האינטרנט, כמו וורדפרס וכמו דרופל. פועלת על מספר פלטפורמות ביניהן Linux, OpenBSD , OpenServer, SCO UnixWare ומערכת Windows על גרסאותיה השונות. המערכת מופעלת על ידי רישוי חופשי או על ידי רישוי מסחרי- והדבר נתון לבחירת המשתמשים.
  • אורקל (ORACLE) – מערכת ניהול עבור מסדי נתונים מבוססי טבלאות. המערכת בנויה משני חלקים- הראשון הוא רכיב ה-  Instance המורכב מ- DBWR ‏(database writer)  , (system monitor) SMON ו- PMON (Process monitor) הרכיב השני נוגע לשטח האחסון. הנתונים נשמרים בשתי תצורות- הראשונה- טבלאית והשנייה על בסיס קבצי דאטה בייס (data base). השמירה הטבלאית מיוחסת ללוגיקה, הנובעת מסכמה של נתונים ואילו התצורה הפיזית- היא קצבי הדאטה. ניתן לבצע פעולות שונות על בסיס הנתונים, לרבות ניתוח נתונים קיבוץ והרחבה של מידע, כתיבת פרוצדורות חדשות וכן הלאה. התכנות נעשה באמצעות .JAVA היתרון המרכזי של אורקל הוא בתמיכה במערכות ERP , שבאה לידי ביטוי ביכולת לפתח ולשנות את מסכי האפליקציה, ליצור טפסים, להפיק דוחות ולבצע פעולות נוספות.
  • DB2 – תוכנה טבלאית בפיתוח של IBM המתאימה למערכות הפעלה שונות כמו Windows, Linux ו- UNIXוכן למערכות בסיסי נתונים. היתרון המרכזי של DB2 הוא בכך שמדובר על אחד מבסיסי הנתונים הנפוצים ביותר שיש. המערכת מתעדכנת ומתפתחת באופן תדיר, בכל מהדורה מתווספים שימושים שונים, המקלים על תהליך הפיתוח ומרחיבים את התמיכה במערכות הפעלה שונות. שפת התכנות בניהול בסיס נתונים זה מבוססת על JAVA – שפת הבסיס למערכות בסיסי נתונים ומערכות המתמחות בניתוח נתונים.
  • Firebird – זהו בסיס נתונים חדש, המשמש הן כשרת והן כבסיס נתונים יחסי לפיתוח בקוד פתוח. לבסיס נתונים זה אפשר לכתוב פרוצדורות וטריגרים ויכולת מובנית לאתר שגיאות מערכת (באגים) ניתן לבצע בו פיתוחים במספר שפות פייתון, רובי C, c++, Java, #c, וכן הלאה. ה – Firebird משמש כשרת קלסי, סופר שרת עליו ניתן לבצע מספר ריצות (תהליכונים)  ושרת סופר קלסי, שממצה באופן מיטבי את משאבי המערכת. הפיתוח נעשה באמצעות שפת ה-SQL.
  • Microsoft Access – זהו בסיס נתונים טבלאי עם ממשק משתמש גרפי עם יכולת לאסוף מידע בהיקף נרחב (מחולל יישומים) מתאים למשתמשים, אשר מכירים את יכולות הכלי ולעסקים בסדר גודל קטן עד בינוני. בסיס הנתונים כלול בסביבות ה- Professional של מייקרוסופט או נמכר בנפרד. ניתן לפתח באמצעותו יישומי תוכנה באמצעות שפת תכנות מונחית עצמים, אירועים ותסריטים משתנים (Visual Basic for Applications). ב- Access ניתן לייצר טבלאות, טפסים, דוחות, שאילתות ולתמוך בתהליכי אוטומציה באמצעות פקודות מאקרו או כתיבת תסריטים (סקריפטים) וכן ניתוח נתונים.
  • PostgreSQL – זוהי מערכת בסיסי נתונים בקוד פתוח, אשר נתמכת על ידי קהילת משתמשים ולא כפופה לאף חברה מסחרית (ממש בדומה לאפאצ’י, לינוקס וכן הלאה). היתרון המרכזי במערכת זו הוא בנק הידע הרב, שנוצר בבסיס שלה, וזאת בשונה מ- MYSQL, שכמעט ולא מקבל שום מידע מהקהילה, ואף היא הפועלת באמצעות רישיון פתוח. המערכת נוחה לשימוש, פועלת באמצעות שפות פיתוח רבות, וניתן להריץ אותה על מגוון פלטפורמות ולבצע בה תהליכי ניתוח נתונים.

מה זה בסיס נתונים לא-רלציוני

מסד נתונים לא-רלציוני (non-relational database) – זהו מסד נתונים רחב היקף, שידוע גם בשם NoSQL, שנועד לטפל במסות של מידע, שנכנסות למערכת בקצב מסחרר. המידע הנכנס למערכת מגוון ומגיע ממקורות רבים כמו- תגובות, לייקים, שיתופים ברשתות החברתיות, פורומים, טוקבקים, תמונות, קבצי טקסט, מידע טכנולוגי מקודד וכן הלאה. יש לציין, שהמידע עצמו אינו מאורגן בטבלאות אלא מסווג על פי ערכי מפתח מסוימים לעיתים על ידי סיווג “משפחתי” או על בסיס מסמך, שמהווה את המפתח של התוכן וזאת במטרה לנהל את הנתונים על מספר רב של שרתים ולבצע ניתוח מידע. היתרון המרכזי של מסדי נתוניםNOSQL  בא לידי ביטוי ביכולת להקליד את הנתונים בכל תצורה ללא כלי כתיב נוקשים ומורכבים. בדרך זו ניתן לטפל בנתונים מובנים או שאינם מובנים בקלות ולכן לבצע ניתוח מידע וניתוח נתונים במהירות. בסיס נתונים NoSQL נחלק למספר סוגים, הנה העיקריים מבניהם:

  • Document – מסמכים, המטופלים במסד הנתונים, המקודדים בפורמטים או קידודים שונים כמו XML, YAML ו- JSON וצורות בינאריות כמו BSON. המסמכים עצמם מטופלים במסד הנתונים באמצעות מפתח ייחודי, המשמש לייצוג המסמך. ניתן לארגן את המידע במסמכים באמצעות: תגיות, אוספים, מטה-נתונים, שאינם נראים לעין ומילון מונחים קיימים מספר סוגים של מסמכים הינה העיקריים מבניהם:
    1. MongoDB הוא מסד נתונים בקוד פתוח המיועד לטפל במסמכים במספר פלטפורמות. התוכנה מבצעת שימוש במסמכים דמויי JSON עם סכמות אופציונליות. MongoDB פותחה על ידי MongoDB Inc. ומורשית לשימוש באמצעות הרישיון הציבורי של שרת הצד (SSPL).
    2. Qizx הוא מאגר XML קנייני המספק אחסון מקורי לנתוני XML.
    3. אפאצ’י CouchDB -מסד נתונים מסוג NoSQL עם קוד פתוח, המיושם ב- Erlang.התוכנה נעזרת בפורמטים ופרוטוקולים כדי לאחסן, להעביר ולעבד נתונים וכן לבצע ניתוח נתונים. אחסון הנתונים מבוצע ב- JSON, כאשר השאילתות מיוצרות בשפת JavaScript.
    4. Amazon DocumentDB הוא שירות מסדי נתונים קנייני מסוג NoSQL, התומך במבני נתוני מסמכים וכן מאפשר תמיכה מוגבלת בעומסי עבודה של MongoDB עד גרסת 3.6 של MongoDB (שוחררה בשנת 2017) וגרסה 4.0 (שוחררה בשנת 2018). DocumentDB משמשת לאחסון מסמכים, ומקלה על ביצוע האחסון ועל כתיבת שאילתות.
    5. BaseX – מערכת ניהול מסדי נתונים XML מקומית וקלת משקל, אשר פותחה כפרויקט מקומי. ניתן לבצע בה אחסון, לפתח שאילתות ולבצע הדמיות של מסמכי XML ואוספים בהיקף נרחב. השימוש בה מוצר באמצעות רישיון תוכנה חופשי.  
  • key-value – מסד נתונים של NoSQL, אשר מספק מנגנון לאחסון ושליפה של נתונים שאינם קשורים זה לזה באמצעות טבלה, ונמצאים במאגרי מידע יחסיים, ומשמשים יישומי מידע רחבי היקף. הנה חמש דוגמאות רווחות למסד זה:
    1. Oracle – מאפשר לטפל בנתונים טבלאיים, ומאפשר להקים שאילתות, וביצוע מניפולציות של נתונים היררכיים ונתונים פשוטים.
    2. Azure Cosmos DB – הוא שירות מסדי הנתונים הרב-מודליים המופץ בעולם. פיתוח מבית מיקרוסופט.
    3. דינמו – זהו מאגר נתונים מבוזר בעל מאפיינים של מסדי נתונים וטבלאות מבוזרות. תחילה נוצר על מנת לתת מענה לבעיות טכניות באתר אמזון ולאחר מכן המשיך ועדיין ממשיך לשמש כשרת אחסון.  
    4. האפאצ’י של חברת Ignite – מסד הנתונים של אפאצ’י Ignite, שייך לפלטפורמות מחשוב בזיכרון ומשתמש ב- RAM כרובד האחסון המאחסן שכבות של נתונים.
    5. Riak – מאגר נתונים מבוזר של ערכי מפתח מסוג NoSQL המציע זמינות גבוהה, ויכולת לנטר תקלות פשוטות ומורכבות. זמין בגרסת קוד פתוח וגרסה המוצעת לארגונים, ונתמכת באחסון באמצעות הענן.
  • wide column store – סוג של מסד נתונים NoSQL, המבצע שימוש בטבלאות, שורות ועמודות, אך בשונה ממסד נתונים יחסי, שמות העמודות עשויים להשתנות משורה לשורה באותה הטבלה וזאת כיוון שכל משפחת עמודות מאוחסנת בנפרד, והנתונים נשמרים בשורות נפרדות אך העמודות בכל שורה נתונה נשמרות יחד. Amazon DynamoDB Apache, Accumulo Apache ,Cassandra Apache ,HBaseataStax Enterprise הם רק חלק מהיישומים, הפועלים בשיטה זו.
  • Graph Store – מסדי נתונים, שבנויים על סכמה תלוית קשרים בין נתונים שונים. Graph Store כשמה כן היא נועדה להציג נתונים בתצורה של גרפים חזותיים. מסדי נתונים גרפיים כמו Datastax, Neo4J ו- Enterprise Graph, משמשים על מנת להתחקות אחר דפוס מסוים בבליל נתונים אקראי, שאינם מקיימים קשרים זה עם זה ומקלים על תהליך של ניתוח נתונים.
  • Object Database- כשמו כן הוא מאפשר שמירה וסידור המידע באמצעות הצגה של עצמים כמו אובייקטים, פונקציות או מבני נתונים. בשונה מניהול בסיסי נתונים יחסיים כל פיסת מידע מטופלת כיחידה נפרדת בתוך בסיס נתונים. לשימוש במסד נתונים זה ישנם שני יתרונות: ראשית נגישות גבוהה למידע ושנית זמינות גבוהה של נתונים. ניתן להקים שאילתות בבסיס הנתונים על בסיס עצם אחד ולייחד עצם אחר ממש באותה שאילתה: כך למשל: “על כל מי שמתגורר בתל אביב מלא שם רחוב ועבור כל שם של סוכן מכירות מלא את שם הסניף”.

חלוקה של בסיסי נתונים לפי פעילות

בסיס נתונים אנליטי

בסיסי נתונים אנליטיים מאפיינים בדרך כלל קטלוגים או מידע היסטורי, שיש רצון לשמור אותו בתצורה של ארכיב, את המידע ניתן לנתח והוא נועד לקריאה בלבד. כך למשל ארגונים יכולים להיעזר בניהול בסיסי נתונים אנליטיים כדי לאחסן את נתוני המכירות בחמשת השנים האחרונות. אתרי אי-קומרס רחבי היקף כמו “אמזון” מבצעים שימוש בבסיסי נתונים אנליטיים, המשמשים לקריאה של מידע כדי להציג מידע. יחד עם זאת, אין מן הנמנע לממשק את בסיס הנתונים האנליטי עם פלטפורמה אינטרנטית, המייצרת שאילתות דינמיות, הדבר נעשה באתרי אינטרנט רבים בתחום המסחר.

בסיסי נתונים אופרטיביים

בסיסי נתונים אופרטיביים מאחסנים רשומות שונות באופן דינמי, כלומר, המידע המוצג למשתמש מתממשק עם פלטפורמות אחרות ומתעדכן בזמן אמת בהתאם לאירועים עסקיים שונים. כך למשל: אם לקוח ביצע רכישה דרך האתר, בסיס הנתונים יקבל את המידע ממערכת המכירות ויציג למשתמש את המלאי הזמין הנותר לאחר הרכישה. השימוש בבסיסי נתונים אופרטיביים נעשה, כאשר מעוניינים לעקוב אחר רשומות, שמשתנות באופן תדיר, כמו פריטים מסוימים במלאי, וכן כאשר מעוניינים להתריע על מחסור צפוי בפריט אחד או במספר פריטים. באמצעות ניהול בסיסי נתונים אופרטיביים, עסקים יכולים להבטיח עמידה באמות שירות ורמות מלאי התואמות את הביקוש השוטף ואף להיערך מבעוד מועד לעתיד לבוא. בשונה מניהול בסיסי נתונים אנליטיים, המיועדים להצגת המידע לצפייה בלבד, בניהול בסיסי נתונים אופרטיביים ניתן לעדכן מידע, להוסיף או למחוק רשומות.

חלוקה של מסדי נתונים נפוצים לפי סוגים

מסדי נתונים עיתיים (Temporal Databases)

מסד נתונים המתייחס לאירועים מנקודת מבט, הנוגעת לממד של הזמן. כלומר הנתונים המאוחסנים בו מיוחסים למשך הזמן, שנדרש לפעולה מסוימת. כך למשל: משך הזמן הנדרש לרישום של עסקה במערכת, משך הזמן הנדרש לקבלת החלטה וכן הלאה, משך הזמן שנתון נרשם כאמין וכן הלאה. המופעים או האירועים עשויים להיות בזמן עבר, הווה ועתיד. בראייה חד-זמנית, דו-זמנית ותלת-זמנית.

מסדי נתונים מבוזרים (Distributed Databases)

בסיס נתונים מבוזר, הוא למעשה מסד נתונים, הפזור בין שרתים שונים, אלו יכולים להיות שרתים פנים ארגוניים ובמקביל שרתים חוץ ארגוניים כמו שרתי הענן. האתגר המרכזי במסדי נתונים מבוזרים הוא לרכז את הנתונים ממגוון המקורות וליצור קשרים לוגים בדאטה בייס (Data Base). לשם כך מופעלת מערכת ניהול מרכזית, החולשת על השרתים השונים. עסקים הבוחרים במודל של מסדי נתונים מבוזרים נוהגים לעשות זאת משום שמדובר על מודל בטוח יחסית, המאפשר “לפזר את הסיכון”.

מסדי נתונים אקטיביים (Active Databases)

אלו הם מסדי נתונים פעילים, אשר בבסיסם פועלת ארכיטקטורה בתצורה של כללי ECA קצרים, וכן טריגרים שמטרתם להגיב לאירועים שונים בתוך הדאטה בייס (data base). נהוג לבצע שימוש במסד נתונים אקטיבי, כאשר נדרשים לתגובה מהירה בזמן אמת במערכות אבטחה, התראה או לצורך אישורים ואיסוף מידע במערכות בסיסי נתונים. מסד נתונים אקטיבי רווח בתצורות שונות במאגרי הדאטה בייס (data base) העכשוויים.

מסדי נתונים שיתופיים (Cooperative Databases)

מסדי נתונים שיתופיים בנויים על מערכת ניהול (DBMS), המטפלת במטה-בסיסי נתונים שונים וממפה אותו לכדי מסד נתונים אחד מאוחד. הרשת מתחברת אל מאגרי מידע שונים, כאשר בדרך כלל מדובר על מחשבים בכל נקודה גאוגרפית בעולם וממזגת אותם באמצעות תהליך של הפשטה למסד נתונים וירטואלי. היתרון במסד נתונים שיתופי הוא ביכולת לאחזר בשאילתה אחת מידע המרוכז ממספר רב של דאטה בייסים (data base), כאשר מאחורי הקלעים מתבצע תהליך של פירוק השאילתה לשאילתות משנה. הדבר מקל על התהליך של ניתוח הנתונים.

מסדי נתונים הסתברותיים (Probabilistic Databases)

מסד נתונים הסתברותי, כשמו כן הוא, נוגע לנתונים הקשורים להסתברויות, ובמילים אחרות, נכונות הנתונים אינה ודאית, אך יש להם ערך וניתן לממש אותו באמצעות תהליך, שנקרא “כימות תקינות הנתונים” המקל על ניתוח נתונים.

אילו מנגנונים קיימים לניהול בסיסי נתונים

לכל מערכת מורכבת כמו מערכת ניהול בסיסי נתונים יש צורך במנגנוני ניהול שונים, המאפשרים למרכז את המידע, לאחזר אותו בקלות ולנתב אותו. מנגנונים אלו כוללים: קטלוג מערכת, מיטוב שאילתות, ניהול אחסון, יומן אירועים, ניהול זיכרון מטמון, מנגנון שכפול ומנגנון בקרת המקביליות.

קטלוג מערכת (System Catalog)

זהו המקום, המרכז את ההגדרות, השדות והרשומות ובמילים אחרות כל המידע הנוגע לבסיס הנתונים. כאן מפורטים שמות הפריטים והישויות במערכת, הסוגים שלהם וחוקי האימות של השדות השונים. (שדות מספריים, שדות מוגבלים למספר ערכים, שדות עם ערכי אותיות בלבד וכן הלאה) המידע בקטלוג מאוחסן באמצעות טבלה על בסיס הנתונים, שמשמשת אף לניתוח נתונים.

מיטוב שאילתות (Query Optimizer)

מיטוב שאילתות זה תהליך סטטיסטי, שמבוסס על איסוף דאטה, הנוגע לטבלאות בבסיס הנתונים. מידע זה כולל את מאפייני הטבלאות. גודלן, היקפן, התדירות שבה הן מתעדכנות וכן הקשרים, שהן מקיימות זו עם זו. נוסף על כך, נאספים נתונים נוספים הנוגעים לקטלוג המערכת וזאת במטרה ליצור אופטימיזציה לשאילתה כחלק מתהליך ניהול בסיסי נתונים.  

מנהל האחסון (Storage Manager)

זהו כלי מובנה, המאפשר לטייב את מסדי הנתונים ולפנות מקום בנפח האחסון המובנה של כל מסד נתונים. בכלי זה ניתן לנקות קבצים או נתונים, שאין בהם צורך בתהליך מהיר ומובנה, ממש בדומה לפעולת הניקוי במחשבים הביתיים. ניתן באמצעות מנהל האחסון להעביר מידע בין שרתים ולנהל את נפח האחסון בקלות יחסית בדאטה בייס (Data Base).

בתחום מאגרי המידע במדעי המחשב, יומן עסקאות (גם יומן עסקאות, יומן מסד נתונים, יומן בינארי או שביל ביקורת) הוא היסטוריה של פעולות המבוצעות על ידי מערכת לניהול מסדי נתונים המשמשת להבטחת מאפייני ACID עקב קריסות או כשלים בחומרה. מבחינה פיזית, יומן הוא קובץ המציג שינויים במסד הנתונים, המאוחסן בתבנית אחסון יציבה.

יומן אירועים (Transaction Log)

זהו למעשה רכיב בתוך המערכת, שנועד לתת מענה לפערים בדאטה בייס (data base), שנוצרים בין ריצות העדכון השונות. התהליך נעשה באמצעות הפעלת טריגר במערכת הניהול של מסד הנתונים, שמטרתו לבדוק את יומני המסד עבור עסקאות לא מחויבות ולהחזיר את השינויים, שבוצעו בעסקאות אלו. נוסף על כך קיימת התייחסות גם לעסקאות, שכבר בוצעו אולם השינויים שלהם טרם מומשו בבסיס הנתונים- במקרה זה העסקאות מוחלות מחדש.

ניהול זיכרון מטמון (Cache Manager)

זהו רכיב חומרה, הידוע גם בשם “קש” (cache), שמטרתו לאסוף נתונים ממקורות אחסון חיצוניים (ממש בדומה לתהליך התקנת “קבצי עוגיות” (cookies) במנועי חיפוש אינטרנטיים. השימוש בקבצי מטמון נעשה על מנת לשלוף מידע במהירות ללא כל צורך לבצע ריצה מחודשת במאגר הנתונים המקורי, כך שקבצי המטמון ניתנים לאחזור במהירות, כאשר “הלקוח” הזקוק לנתונים, שממוקדם במקור המטמון (קרי משאב האחסון המארח) משלם רק על הגישה לנתונים אלו.

מנגנון שכפול (Replica Control)

מנגנון שכפול נועד לקצר תהליכים טכניים, הנוגעים לעדכון הגדרות של בסיסי נתונים שונים. באמצעות הפעלת מנגנון השכפול ניתן בלחיצת כפתור אחת לשכפל הגדרות מבסיס נתונים אחד למשנהו ואף ליצור מספר מופעים באתרים שונים ולסנכרן ביניהם. ובמילים אחרות, מנגנון השכפול מאפשר ליצור אחידות הן ברמת ההגדרות והן ברמת הדאטה בייס (data base).

מנגנון בקרת המקביליות (Concurrency Control)

מנגנון בקרת המקביליות נוצר על מנת לתת מענה לבעיית התנגשות בין תנועות, שמבוצעות במקביל במסד הנתונים. תפקידו של מנגנון זה הוא להבטיח, שאוסף של פעולות לאובייקטים, הממוקמים במסד הנתונים מתבצעות באופן תקין ומציגות נתונים עקביים. כאמור המנגנון מופעל, כאשר שתי תנועות (האוסף של הפעולות על האובייקטים) רצות במקביל ומבצעות פעולה של כתיבה לאותו האובייקט- התוצאה של מצב זה היא חוסר עקביות. כדי להימנע ממצב זה מופעל “המנעול” (Lock Based), המבוסס על אלגוריתם בשם PL2  (נעילה בשני שלבים) במנגנון זה קיים חיסרון מובנה, שעלול להביא “לקיפאון” (Deadlock) ולכן יש הבוחרים לבצע שימוש במנגנון בקרת מקביליות אופטימי, שנועד לתת מענה לחיסרון זה.

מה זה DBA (מנהל בסיס נתונים)

DBA (Database Administrator) הוא איש תשתיות, בעל תפקיד מרכזי, האחראי על המידע המוצג במסד הנתונים. תפקידו של ה-DBA נחלק לשני תחומים עיקריים: הראשון אפליקטיבי (כלומר ברמת המידע המוצג בסביבת העבודה של משתמש הקצה) והשני ברמת התשתית.

  • בתחום האפליקטיבי- ה-DBA  יסייע בפתרון בעיות הקשורות להתממשקות למערכות שונות בארגון, או קושי להטמיע יישומים חדשים במערכות מידע ארגוניות כמו מערכות CRM או מערכות ERP וכן מערכות בסיסי נתונים אחרות. איש ה-DBA דואג לתוכן, למבנה הלוגי, לקשרים השונים בין הנתונים, להקמה של טבלאות ולפיתוח של שאילתות. ה-DBA מפתח את בסיס המידע בשפת ה-SQL.
  • בתחום התשתיתי- זהו תפקיד הכולל תחזוקה שוטפת וניהול של מערכות בסיסי נתונים, בין היתר מדובר על ביצוע שחזור וגיבויים לנתונים שונים, שמירה על זמינות המידע (כלומר, שהמערכת תפעל באופן מתמיד ולא “תיפול”) , ואם כבר “נפלה” לוודא שאין שגיאות לאחר ש”שעלתה לאוויר” מחדש, שהמידע שמוצג בה ממשיך לקיים את אותם קשרים לוגיים, שהוגדרו לו מבעוד מועד. נוסף על כך איש ה-DBA אחראי על גישה מוצפת וסוגיות נוספות, הנוגעות לאבטחה וכן אחראי על שמירה על ביצועים מהירים למערכת (כלומר ניקוי קבצי cache, שמירה על מהירות ריצת השאילתות וכן הלאה)

מדוע Qlik היא המערכת העדיפה לניהול בסיסי נתונים?

Qlik הינה פלטפורמת בינה עסקית (BI), המאפשרת למשתמשים העסקיים, שאין להם שום הבנה בבסיסי נתונים, לנתח את כל הנתונים בצורה קלה ואינטואיטיבית. Qlik מאפשרת ניתוח כמויות גדולות של נתונים ממגוון רחב של מקורות ע”י החזקת כל הנתונים שרוצים לנתח בזיכרון.  בבסיס מערכת Qlik , עומד מנוע אסוציאטיבי (פטנט רשום) המאפשר למשתמשים לקבל בכל לחיצת כפתור את התשובות לשאלות העסקיות שלהם, לעבור מנתונים אגרגטיביים ברמות השונות לנתונים אותם הוא מבקש לחקור ברמת הרשומה הבודדת.

אילן גת
אילן גת מכהן בתפקיד מנכ”ל החברה משנת 2018. בתפקידו הקודם היה מנכ”ל חברת DavidShield/PassportCard במשך 6 שנים ולפני כן נשלח מטעם החברה להקים ולנהל חברה בבייג’ין, סין. לאילן תואר ראשון במנהל עסקים בהצטיינות ותואר שני בשיווק מהמכללה למנהל.

    בואו לפגוש את הנתונים שלכם מקרוב

    מלאו פרטים כאן ונחזור אליכם בהקדם

    חייגו אלינו חייגו אלינו צור קשר צור קשר צור קשר לאתר תמיכה