איך Big Data יסייע בהגנה על מתקפות סייבר
כלי הביג דאטה נועדו לניתוח כמויות גדולות של מידע בזמן קצר. גם במלחמה בפשעי סייבר יכולות אלו מהוות יתרון ומאפשרות ניהול יעיל יותר של המערכה המקוונת
- "יש חולשה מובנית בפתרונות אימות שאינם לוקחים בחשבון את המשתמש"
- גרטנר: עשירית משירותי הסייבר לחברות יסופקו בענן עד שנת 2015
- מפקד לוטם: "צריך לפתח תוכנות לחימה במקום תוכנות ניהול"
מציאות זו הביאה לכך שכלי ניתוח התוכן שהיו קיימים בשוק לא הצליחו לנתח את התוכן הלא מובנה, וחברות עסקיות מצאו עצמן מול שוקת שבורה. במקום שגרת פעילות בה הן יודעות להפיק דו"חות על כל מרחב הנתונים הקיים אודות הלקוחות, הספקים והעסקאות שלהן, הם הצליחו לנתח רק חלק מאותו מרחב. מדוע? מכיוון שהחלק הלא ידוע היה המידע הלא מובנה, אותו אי אפשר לנתח בגלל שאין כלים מתאימים.
בסוג מידע זה, קיים קושי בכרייה ושיוך נתונים באופן יעיל. מילות מפתח חשובות, המצביעות על תובנות עסקיות יכולות להסתתר בכל מסמך ובהעדר כלים מתאימים, תהליך חיפוש המידע עלול להיות ממושך. על מנת להתמודד עם האתגר של כריית נתונים במידע לא מובנה, פותחו כלים ייעודיים, בעיקר בתחום הקוד הפתוח, המאפשרים לבצע אחסון מידע וחיפוש באופן מבוזר ומקבילי.
למרות התפתחות כלים אלו בשנים האחרונות, הם עדיין סובלים מחבלי לידה מסוימים כמו למשל בניתוח מידע בזמן אמת. עדיין מדובר בתהליכים ארוכים יחסית, הדורשים מיומנות אנושית גבוהה בתחום הבינה העסקית. עוד תחום שכלים אלו לא טיפלו בו כראוי הוא האיחוד בין מידע לא מובנה למידע מובנה. כמו כן, חברות הפיתוח של כלים אלו התמודדו עם השאלה כיצד מפתחים כלים חדשים ובמקביל לא משנים למשתמש את חווית התפעול שלהם.
מגבלות אלו הביאו לכך כי בחודשים האחרונים מספר שחקנים בתחום פיתחו או רכשו כלים, המאפשרים כריית מידע לא מובנה במהירות, באמצעות ממשק דומה לכלים, הקיימים בעולם המידע המובנה. הבשורה בכלים החדשים, היא האפשרות לתחקר מידע לא מובנה הקיים בקבצים ובדפי אינטרנט, בעזרת כלים ידועים ונוחים לשימוש. בין החברות אשר הכריזו על כלים מסוג זה ניתן לציין את החברות EMC , Cloudera, Microsoft, ו-Oracle כאשר רובם מתבססים על סביבת ה-Hadoop מבית Apache הכולל את מבנה הקבצים, Hadoop Distributed File System (HDFS).
כלים אלו סוללים את הדרך למגוון יישומים פוטנציאלים, שיכולים לעשות שימוש במרחב המידע החדש שהתגלה ובתובנות העסקיות שמידע זה מציף. דוגמה לכך יכולה להיות מערכת שיווק מתוחכמת שמתריעה על עסקאות פוטנציאליות ע"י כריית נתונים מרשתות חברתיות, או למשל מערכת להגנה מפני מתקפות סייבר, אשר עוקבת אחרי התנהגויות חריגות ברשת. מערכות הגנה מסוג זה חייבים לסרוק כמויות מידע אדירות על פעילויות חריגות ברשת ובניסיונות חדירה שלא צלחו.
אמנם מדובר על כלים חדשים באופן יחסי בתחום ניתוח הנתונים, אולם אין ספק כי הם יוכלו לעזור לארגונים רבים לגבש תובנות משמעותיות הנמצאות במידע הלא מובנה ובשילוב שלו עם מידע מובנה - מרחב נתונים שעד היום היה נסתר מעיני החברות. הצלחת כלים אלו תאפשר למערכות עסקיות לקבל נתונים אודות התנהגות של ארגונים, אנשים וקבוצות ולהגיב מהר להזדמנויות.
הכותב הינו סמנכ"ל טכנולוגיות בקבוצת מלם-תים