כריית מידע (Data Mining) או בשמו הנוסף כריית נתונים זהו כלי אוטומטי, רב-עוצמה, המסייע לזהות מגמות ודפוסים קיימים בין אינסוף רשומות בבסיסי הנתונים (Data Base). תהליך הזיהוי והניתוח נעשה באמצעות הצלבת נתונים. תוצרי התהליך מאפשרים לקבל החלטות עסקיות מבוססות ידע. כריית הנתונים המודרנית, זו המאפיינת את תקופתנו באה לתת מענה לפער שהיה עד כה בשוק. אם בעבר תהליך ניתוח הנתונים התבסס בעיקרו על שיטות מסורתיות מבוססות סטטיסטיקה, הרי שהיום, כשמאגרי המידע רק צוברים עוד ועוד נתונים, נדרש היה לבנות מודל חדש, שישמש עבור כריית מידע (Data Mining), ינתח אותו ויסייע בניתוח מידע. המודל החדש מבוסס על בינה מלאכותית ואלגוריתמים מתמטיים במטרה להפוך מידע מבוזר למידע מאורגן, שבאמצעותו ניתן היה לייעל תהליכים עסקיים. מעבר לכך, ברמה העסקית היום-יומית, הרי שכריית מידע נוכחת בעולם העסקי במספר תצורות ובעיקר בתצורתה השיווקית, כי הרי היום עסקים נעזרים בכריית נתונים כדי להתאים טוב יותר המסרים השיווקיים ללקוחותיהם, להציע להם מוצרים ושירותים על סמך פרופיל אישי ולתקשר איתם באופן שוטף. שימוש אחר הנוגע לכריית מידע (Data Mining) מזוהה עם פעילות פיננסית בקרב בנקים וחברות ביטוח, אשר נעזרים באלגוריתמים מתמטיים הנוגעים ל data mining- כדי לזהות הונאות עסקיות וחריגות כספיות. אך מעבר לכך כריית מידע (Data Mining) הוא מדע הנתונים החדש, שבאמצעותו ניתן להגיע לתובנות בכל תחום.

תוכן עניינים

כיצד התפתח תחום כריית מידע (Data Mining)

בטרום עידן המחשב, דפוסים שונים בין פיסות של מידע זוהו באופן "ידני" כלומר אנשים ליקטו מידע ממקורות שונים, חלקם גלויים וחלקם סמויים (ממש בדומה לפעולת מודיעין) הצליבו בין הנתונים שנאספו ודנו עליהם. ההיסטוריה מלמדת שבמאה ה-18 נעזרו בחוק בייס – חישוב הסתברות מותנית של אירוע בתנאי שידועות ההסתברויות ההפוכות. ובמאה ה-19 הוחלט לבצע ניתוחי רגרסיה באמצעות מודלים סטטיסטיים, שמטרתם להעריך קשרים בין משתנים. עם כניסת רשתות המחשוב וצמיחה בנפח המידע התהליך הידני לא נתן מענה מספק, הן מבחינת יכולת איסוף המידע והן מבחינת מהירות הניתוח ונדרש למצוא פתרון אוטומטי יותר, שהתבסס על עיבוד מידע נוירונים, אלגוריתמים גנטיים, ניתוח אשכולות, עצי החלטה ווקטורים תומכים. כל אלו אפשרו לזהות מגמות ודפוסים באמצעות כריית מידע (Data Mining) בצורה ממוחשבת – מהלך שכבר הוטמע בעסקים רבים כבר בשלהי שנות ה-80 של המאה הקודמת. וכבר אז ממשלות נעזרו במידע שנאסף כדי לנתח את האוכלוסייה וחברות קמעונאיות ניתחו את תכולת הקניות של לקוחותיהם.

היכנסו ללמוד על קליקסנס מערכת ה BI המתקדמת של Qlik>>>

שיטות מוקדמות לכריית נתונים

חוק בייס

חוק בייס ידוע גם בשם נוסחת בייס על שם המתמטיקאי האנגלי תומאס בייס, שהתגלתה במאמר אקדמי על פתרון בעיה בתורת הסיכויים, אשר פורסם ב-1764. על פי חוק בייס ניתן לחשב תוצאה או אירוע בהסתברות כל עוד יודעים מהן ההסתברויות ההפוכות. כך למשל אם בעיר מסוימת יש שני סופרמרקטים גדולים, כאשר 60% מבין התושבים רוכשים באופן קבוע בסופרמרקט הגדול, ואילו השאר רוכשים באופן קבוע בסופרמרקט הקטן, ובסקר שביעות רצון נמצא כי דווקא אלו שרוכשים באופן קבוע בסופר מרקט השני מרוצים יותר (90% שביעות רצון בסופרמרקט הקטן לעומת 80% שביעות רצון בסופרמרקט הגדול) ניתן לקבוע – שהשירות של הסופרמרקט הקטן טוב יותר. האם אמרה זו נכונה? ובכן לצורך כך מכניסים נתונים לנוסחת בייס , אשר בוחנת את היחס בין הקבוצות השונות ואת רמת שביעות הרצון שלהן. לאחר מכן מכניסים את הנתונים לנוסחת ההסתברות השלמה – כיוון שמכירים את ההסתברות ההפוכה להיתכנות של "האירוע" (=הקביעה הנוגעת לשביעות הרצון של הלקוחות) ומפריכים את הטענה או מאששים אותה.

ניתוח רגרסיה

ניתוח רגרסיה ובשמו הלועזי regression analysis הוא ניתוח סטטיסטי, שבדרך כלל נעשה באמצעות מחשב, המודד יחסים בין שני משתנים או יותר מן העבר, במטרה לחזות מגמות עתידיות, למשל יחס בין המכירות של השנה הקודמת ) בניתוחי רגרסיה של משתנה תלוי (משתנים לא ידועים) וגורמים ידועים (המשתנה הבלתי-תלוי, במקרה שלנו – המכירות בשנה הקודמת). משוואה מתמטית מסייעת לבטא את הקשר בין שני הגורמים. ברגרסיה פשוטה – ההשוואה בין שני המשתנים נוגעת למשתנה ידע אחד (נקרא גם משתנה מוסבר) לבין משתנה בלתי-ידוע אחר (נקרא גם משתנה בלתי-מוסבר), ואילו ברגרסיה רבת-משתנים ההשוואה נעשית בין משתנה תלוי אחד לבין מספר משתנים בלתי-תלויים כמו למשל מציאת קשר בין מכירה של מוצר מסוים ביחס לגיל, מין ומצב כלכלי של קבוצת אוכלוסייה. דרך נוספת להיעזר במודל הרגרסיה נעשית כדי להסיק סיבה להיתכנות של מצב מסוים, גם כאן בהשוואה בין משתנים "מסבירים" לבין משתנים "מוסברים" (למה אדם חלה למשל) או מה הסיבה שתרמה להחלמה או לבריאותו של אדם. יש לציין, שמדובר על מודל סטטיסטי, ולכן הוא נשען על הנחות בלבד ולא על אמיתות מוצקות.

אם אתה בשוק של שבט על, http://www.swisswatch.is/ סופר שיבוט רולקס הוא המקום ללכת אליו! האוסף הגדול ביותר של שעוני רולקס מזויפים באינטרנט!

ניתוח אשכולות

ניתוח אשכולות מתייחס לחלוקה של עצמים דומים לקבוצות שונות. כאשר כל קבוצה שומרת על זהות מסוימת בין סך חלקיה. כך למשל : קבוצת בנות לעומת קבוצת בנים, קבוצת בגדים כהים לעומת קבוצת בגדים בהירים וכן הלאה. ניתוח אשכולות משמש רבות את תחומי השיווק ובעיקר את תחום ניתוח התנהגות הצרכנים וזאת באמצעות פילוח האוכלוסייה על פי תכונות דמוגרפיות שונות או לפי הרגלי צריכה. ניתוח אשכולות אף משמש את המדע. כך למשל חוקרים ביולוגים מחלקים את המידע הגנטי לאשכולות שונים וזאת כדי לאתר זנים מסוימים או תתי-אוכלוסיות. גם בתחומי המחקר הסוציולוגי נעשה שימוש במודל כריית מידע (Data Mining) זה, כיוון שכדי להסביר את השוני בין קבוצות שונות ואף בין פרטים בתוך הקבוצה, מחלקים את האוכלוסייה הנחקרת לאשכולות ביחס לקשרים בין-אישיים (קבוצת אבות-בנים, קבוצת אימהות נתונים-בנות, קבוצות אחים וכן הלאה). קיבוץ האשכולות נחלק לשני סוגים: הראשון – קיבוץ קשה, כאשר כל עצם או ישות שייך לאשכול אחד והשני – קיבוץ רך כאשר כל עצם או ישות משויך למספר אשכולות עלפי דרגת שייכות. ישנם מספר מודלים לניתוח אשכולות, ביניהם מודל הקישוריות, הבוחן את המרחק בין העצמים/ ישויות שונות מההיבט ההיררכי. מודל מרכז הכובד, שבוחן את ההתפלגות הסטטיסטית של חברי האשכול, מודל הצפיפות, שבוחן את האזור בו מתקבצים מספר רב של עצמים, ומודל תורת הגרפים, הבוחן את הקבוצה ביחס למיקומה בין צמתים בתוך גרף אחד.

עץ החלטה

עץ החלטה (ידוע גם כעץ רגרסיה או עץ סיווג) הוא מודל חיזוי סטטיסטי בתחום כריית מידע (Data Mining) והלמידה החישובית ומשמש כמודל לחיזוי על בסיס מיפוי תצפיות והתאמה בין ערכים, כאשר "עלי העץ" מייצגים סיווגים שונים ו-"ענפי העץ" מייצגים צירופי תכונות, שיחלקו את הסיווג. במודלים של כריית נתונים או כריית מידע (Data Mining) עץ ההחלטות משמש לתיאור הנתונים ובמודלים של ניתוח החלטות, עץ ההחלטות משמש ככלי להדמיה חזותית. קיימים שני סוגי חיזוי לעצי החלטה – עץ רגרסיה (העוסק בערך רציף), עץ סיווג (העוסק בערך בדיד) ועץ CART Classification And Regression Tree אשר משלב בין שני סוגי החיזוי. כיום ישנם אלגוריתמים הלומדים כיצד לקבל החלטות על בסיס נתונים, שמתפצלים בין קבוצת המקור לתתי קבוצות בתהליך הולך-וחוזר גם בתתי הקבוצות בתוך העץ (תהליך זה נקרא מחיצות רקורסיביות) .במדע כריית נתונים ניתן למצוא עצי החלטה משני סוגים: הראשון – עץ סיווג עם תוצאה צפויה והשני – עץ רגרסיה כאשר התוצאה משקפת מספר ממשי (עלות של מוצר, מספר רץ בתור וכן הלאה) .

מכונת תמך וקטורי

זוהי שיטה ללמידה מונחית המשמשת הן לסיווג ולרגרסיה והן לניתוח נתונים. השיטה נקראת באנגלית: Support Vector Machine SVM-. הדוגמאות בשיטה זו מסווגות ל"חיובי" ול"שלילי" ומיוצגות כווקטורים במרחב לינארי. כאשר במרחב ה-SVM נוצר וקטור שמשמש כמפריד הלינארי כלומר הוא מחלק את המרחב לשני חצאים, שנצבעים בשני צבעים שונים, והמטרה של המודל היא לסווג את שייכות הנקודות החדשות (אירועים, פרטים, עצמים וכן הלאה) לכל מרחב.. ובמילים אחרות האם דואר חדש שנכנס מסווג כספאם או לא? האם מוטציה בגן תגרום למחלה או לא? וכן הלאה. ישנם מנתחי נתונים, המבצעים שימוש ב- SVM גם למטרות לא-ליניאריות באמצעות הוספת "גרעין" (Kernel) הממפה את הקלט. את ה-SVM מחלקים לשני סוגי הפרדה: הפרדה קשיחה והפרדה רכה:
הפרדה קשיחה – חלוקת אזורי החלוקה לשוליים רחוקים ושוליים קרובים, כך שלא רק שקיים סיווג ראשוני לשתי קבוצות שונות אלא קיים סיווג משני שמתייחס לאובייקטים בתוך הקבוצה עצמה.
הפרדה רכה – מתייחסת לרוחב השוליים ונסמכת על פונקציה מרחיבה, שמתאימה לבעיות ללא הפרדה-ליניארית.

היכנסו ללמוד על ביג דאטה כאן>>>

אילו מודלים של כריית מידע (Data Mining) קיימים

מודלים תיאוריים

מודלים המתייחסים לסיווג דפוסים ופילוחים ומתבססים על ניתוח אשכולות. בדומה לשיטת כריית נתונים או כריית מידע (Data Mining) המבוססת על אשכולות, גם כאן הרעיון מאחורי הסיווג והפילוח נוגע לחלוקת האובייקטים בתוך האשכולות עצמם ולניתוחם על ידי אלגוריתם ייעודי. תוצאות המודל מספקות מידע על אירועים מהעבר הרחוק והקרוב וכן מאפשרות לקבל תשובות לשאלות שיעלו בעתיד באמצעות נתונים היסטוריים בעיקרון המנחה לקבלת ההחלטה. מודלים תיאוריים משמשים בדרך כלל ליצירת מתאמים, טבלאות צולבות ובחינת תדירות של אירוע מסוים, באמצעותן ניתן לחשוף דפוסים.

מודלים לחיזוי

מטרתם של מודלים אלו היא לחזות תוצאות עתידיות ולאו דווקא התנהגות עכשווית. בשימוש במודלים לחיזוי מעוניינים לענות על שאלות הנוגעות לתרחישים עתידיים כמו "מה עלול לקרות"? ו-"מדוע תרחיש מסוים עלול לקרות"? במודל לחיזוי כריית נתונים או כריית מידע (Data Mining) נעשה סיווג, ניתוח סדרות זמן ורגרסיה – זאת כדי למצוא דפוסים, שחוזרים על עצמם או אירועים מבדלים. מידול הנתונים נעשה באמצעות שימוש במשתנים מסוימים במטרה לצפות בערכי נתונים עתידיים בלתי-ידועים עבור משתנים אחרים.

מודלים לכריית דפוסים

כשמם כן הם, מודלים שכל מטרתם היא לזהות דפוסים בתוך מסדי נתונים רחבי היקף. הדפוסים עצמם עשויים להעיד על חוקיות מסוימת בדאטה וכן הקשרים וקישורים שלא בהכרח ניתנים להסקה באופן ראשוני. בדרך זו נחשף מידע, שלא ניתן היה לצפות אותו ויש בכוחו למנוע שגיאות, סיכונים, תקלות ופגמים.

מודלים לזיהוי אנומליה

מודלים אלו נוצרו כדי לזהות תוצאות חריגות, שלא בהכרח מתכנסות לתבניות, אשכולות, תצפיות או דפוסים צפויים, אלו למעשה המודלים המשלימים למודל התיאורי, מודל החיזוי ומודל כריית נתונים או בשמו האחר מודל כריית מידע (Data Mining). השימוש במודלים אלו מסייע לגלות תקלות, בעיות וסטיות מתוצאות התקן. כך למשל בעיה בתעבורת מידע ברשת עלולה לרמז על מתקפת האקרים, חריגה בתוצאה של בדיקה רפואית עשויה להעיד על מחלה. ישנן שלוש שיטות לזיהוי אנומליות:

שיטות לא-מונחות (unsupervised)- שמבוססות על ההנחה כי מרבית התצפיות במסד הנתונים מייצגות מקרים תקינים או נורמליים. בשיטות אלו משתמשים בשיטת ניתוח האשכולות, אשר מסווגת ומשייכת את המקרים השונים לקבוצות. מה שלא ניתן לסווג או לשייך – נחשב באנומליה.
שיטות מונחות (supervised)- נעשות כאשר התצפיות בבסיס הנתונים מסווגות לשני סוגים: תצפיות "נורמליות" ותצפיות "לא נורמליות". בשיטות אלו נעזרים בלמידה חישובית לאימון מסווגים כדי לאתר מקרים חדשים, שטרם עלו בתהליך הלמידה.
שיטות מונחות למחצה (semi-supervised)- מבוססת על מודל הבוחן דפוסים של התנהגות נורמלית ובוחן אותם אל מול תצפיות חדשות.

כיצד מתבצע תהליך כריית מידע (Data Mining)

עיבוד המידע

תהליך עיבוד המידע נחלק לשלושה שלבים: איתור דפוסים, סינון נתונים ויצירת וקטורים מאפיינים לתצפיות:

איתור דפוסים- כריית מידע או כריית נתונים נסמכת על איתור דפוסים ותבניות בבסיס הנתונים רחב-היקף כמו מחסן נתונים או מחסן נתונים מחלקתי. כשבסיס הנתונים רחב דיו הוא יכיל ברוב המקרים את מרב התבניות.
סינון נתונים- השלב הבא נוגע ל"ביצוע ניקיון" בדאטה. כעת מסוננים כל הנתונים, שאינם מציגים מידע מלא או שמייצרים "רעש" במערכת.
בשלב השלישי מיוצרים וקטורים מאפיינים (Feature vector) לכל תצפית ותצפית, הווקטור עצמו מבטא את סיכום רשומת התצפית. הווקטורים מסייעים להפחית את היקף הנתונים ובעצם מקבצים אותם תחת פרטים מזהים (למשל תמונה של 1000 פיקסלים, תקובץ לפי מזהה עיניים ושפתיים, וכך ניתן יהיה לגשת לנתונים באמצעות עיבוד מזערי בלבד). האפיון הנכון של הווקטורים משמעותי מאוד לתהליך ונחלק לשתי סדרות : סדרת אימון, אשר משמשת את האלגוריתם עצמו וסדרת הבדיקה, אשר מסייעת לאמת את רמת הדיוק בתוך התבניות.

כריית מידע (Data Mining)

כריית מידע (Data Mining) או כריית נתונים הוא תהליך כולל למציאת דפוסים, תבניות ואנומליות בתוך מסדי נתונים גדולים. תפקידה של כריית מידע (Data Mining) לטפל בארבע בעיות עיקריות: סיווג, ניתוח אשכולות, רגרסיה ולמידת חוקי האסוציאציה

טיפול בבעיות סיווג- בעיקר בכל הקשור לפעולתו של האלגוריתם לסיווג מקרים חדשים באמצעות "עצי החלטה", "שיטת השכן הקרוב", "סיווג בייס נאיבי" ורשת עצבית מלאכותית. שימושים נפוצים: ניבוי יכולת החזר של הלוואה עתידית.
ניתוח אשכולות- האשכולות מקבצים עצמים או ישויות עם מאפיינים קרובים או דומים. כך שניתן באמצעות אלגוריתם לאפיין כל אשכול ואשכול ולסווג אותו. שימושים נפוצים: אפיון מערך הלקוחות בחברה.
ניתוחי רגרסיה- צמצום שגיאות הניבוי באמצעות פונקציית רגרסיה לינארית.
למידת חוקי אסוציאציה- מציאת הקשרים, חוקיות מסוימת וחזרתיות בתוך הנתונים השונים. כל למשל ניתן לדעת אם לקוח רוכש מספר מוצרים קבועים יחדיו, ובניתוח רחב של כלל הקניות שלנו ניתן לדעת אם ישנם שני פריטים התלויים זה בזה כמו פסטה ורוטב עגבניות. באמצעות המידע שהתקבל ניתן להציע לו סל קניות דיגיטלי מובנה מראש או אף לסדר את המוצרים במרכול בהתאם להרגלי הצריכה.

אימות התוצאות

זהו השלב האחרון בהפיכת נתונים לידע ומטרתו לאמת את התבניות, שנמצאו על ידי האלגוריתם. יש לציין שלא כל התבניות בהכרח מאומתות, וזאת כיוון שיש תבניות, שסובלות מתופעה שנקראת "התאמת יתר" – בעיית יסוד במדע הסטטיסטיקה שנוגעת להתאמה יתרה של נתונים למודל מסוים (בדרך כלל במודל האימון) ולכן במצב זה לא ניתן להסתמך על הנתונים לצורך ביצוע תצפיות. הדרך להימנע מהתאמת יתר היא לקבוע את המודל על בסיס מספר מוגבל של מאפיינים, שיאפשר למפות ולסנן בהמשך את "הרעש" הסטטיסטי ואת המידע החסר. מעבר לכך, ניתן לבצע בדיקה נוספת של האלגוריתם על תרחישים, שטרם נבדקו וזאת במטרה להשוות בין פלט סדרת הבדיקה לפלט סדרת האימון ולחלץ משם את "הרעש הסטטיסטי", שהוא למעשה המידע הלא-רצוי.

לקריאה כיצד מערכות ה BI של Qlik תורמות להפקת נתונים>>>

איך לבחור אלגוריתם לכריית נתונים

סיווג

בעיות בסיווג עלולות לצוץ כאשר קיימת בעיה במתאם בין הנתונים. כך למשל כאשר ישנם נתונים סטוכטיים, או כאשר מעוניינים ליצור איזשהו רצף, סדרה או להבין דפוס בין נתונים. לצורך כך מומלץ להיעזר במודל עץ ההחלטה, המסייע בקבלת החלטות ובזיהוי אסטרטגיה להשגת המטרה. מודל זה רווח מאוד בכל הקשור ללמידת מכונה. כמו כן מומלץ להיעזר במודל SGD ירידת שיפוע סטוכטית (הכוונה לקבוצת נתונים, שנבחרה באופן אקראי), אשר פועלת בשיטה של ייעול פונקציות ומתאימה לטיפול בבעיות אופטימיזציה רחבות היקף. מודלים נוספים הם סיווג ביסיאני נאיבי המבוסס על חוק בייס ומסייע בסיווג טקסט לקטגוריות וכן אלגוריתם "השכן הקרוב" המסייע לסווג רגרסיה מקומית ומבוסס על חישובי ממוצעים.

קישור

במקרים בהם קיימת איזושהי אינטראקציה מורכבת בין תכונות ניתן לבחור בכל אלגוריתם המתייחס לנתון זה. אך כדי להגיע להחלטה הנכונה ביותר חשוב לבחון מספר אלגוריתמים על בסיס הנתונים. האלגוריתמים שיתאימו במקרים אלו עבור כריית נתונים הם עצי החלטה (המבוססים על צמתים בינאריים, הבודקים קיומם של תנאים), רשתות נוירונים (אשר מפשטות משימות מורכבות). כמו כן מומלץ לבחון אלגוריתמים המתבססים על פונקציות ליניאריות או על פונקציות מרחק.

דפוסים עוקבים

דפוסים עוקבים נוגעים לחוקיות ולתבנית מסוימת כך למשל קיום קשר בין שני פרטים שתלויים זה בזה ולכן מומלץ לבחון אלגוריתמים הנוגעים לביצוע מחרוזות חיפוש ולזיהוי תבניות עבור כריית נתונים כמו : Naïve string-search algorithm, או אלגוריתם Rabin–Karp שמסנן במהירות טקסטים לתבניות ובודק את התאמת מיקומם או אלגוריתם Knuth – Morris – Pratt אשר עוקב אחרי תווים מסוימים ומחפש התאמה בין מחרוזות שונות.

הקצבה

כאשר המטרה העסקית נוגעת להקשרים של מידע, הרי שמוטב להיעזר במודלים הנוגעים להקבצות של מידע באשכולות, כלומר שעצמים שונים בתוך הדאטה נחלקים לקבוצות שונות על סמך קרבה או זהות מסוימת. אשכולות אלו עשויים להיות היררכיים, מבוססי הפצה או שיטות חלוקה, מודל הצפיפות, וכן הלאה. מומלץ להיעזר במודלים המסייעים בפילוח של מידע בפורמטים שונים, טקסט, שמע, תמונה, וידאו ולהתאים את הבחירה למטרה העסקית. כך למשל זיהוי של פערים בביקוש ביחס למדדי העבר או שימוש באשכולות למתן המלצות ללקוחות וכן הלאה.

אז למה קליק Qlik?

עסקים נעזרים בטכניקות לניתוח סטטיסטי כדי לזהות דפוסים והקשרים בין נתונים היסטוריים וכדי לנתח התנהגות לקוחות, לגלות הונאות, לדרג אשראי, לחזות רמות מלאי, לנהל משאבים ותחזוקה וכן לנבות תרחישים עתידיים. קליק יצרה תוכנה לניתוח מידע, אשר מתאימה גם למשתמשים ללא רקע טכני, תוכנה המשלבת בין "מכונה לומדת" ל"חוכמה אנושית" – תוכנה המחליפה את מהנדסי הנתונים, מייצרת דוחות ומאפשרת את ביצוע הניתוח באופן עצמאי על בסיס לוח המחוונים (הדשבורד) עצמו, שאליו ניתן להתחבר מכל מכשיר המחובר לרשת האינטרנט ובאופן מוצפן. פלטפורמת ה-BI של קליק מהדור החדש מאפשרת לארגונים גדולים וקטנים לבנות את מערכי הנתונים שלהם ממגוון מקורות ולבצע ניתוח חזותי של מסדי נתונים גדולים. נוסף על כך, הפלטפורמה מעמידה לרשותם כלי מחקר נתונים אינטואיטיביים, המאפשרים להם לאתר את הנתונים הדרושים להם במהירות ובקלות ולשקלל את תהליכי הניבוי באמצעות מרכיב המכונה הלומדת.

Qlik Sense, פלטפורמת ה- BI והניתוח המובילה בתעשייה מצוידת במנוע אסוציאטיבי, רכיב AI מוגן בפטנט ויחיד במינו בעל ארכיטקטורה מתוחכמת המאפשרת למשתמשים לחקור את הדאטה בחופשיות מלאה, לבנות דוחות, מצגות, תרשימים וגרפים, ואף להניע תהליכים מתוך הדשבורד עצמו. נוסף על כך משתמשי המערכת יכולים לטעון נתונים, לשנות אותם ואף להעשירם בקלות ובכך למנף את ניתוח המידע, לגלות מידע נסתר ולהגיע לתובנות עסקיות – ללא כל צורך בתסריטים מורכבים.

מאמרים

כריית נתונים ומידע (Data Mining) המחצבים החשובים ביותר של ימינו