מדמים מציאות - כך מקטינים את זמן ההתאוששות DR בארגון לאחר אסון
מאת:
דוד בן טולילה, 1.8.16, 08:00
בתרגול נכון, גם באמצעות משחק מלחמה, מקטינים את זמן ההתאוששות ומשפרים את הפתרון. אחרי הכל האתגר הגדול באירוע כזה הוא לא הטכנולוגיה אלא האנשים וניהול הארגון.
ארגונים משקיעים הון עתק בשכפול אתר ה-
Data Center ובפתרונות של ניהול תכנית התאוששות מאסון -
DRP. ההשקעה בהקמת אתר משני לארגון כרוכה במנעד הוצאות רחב ושינוי בשגרת היומיום של מחלקת ה-
IT.
ארגונים שעיקר קיומם מתבסס על תשתיות מחשוב יחדלו לתפקד בעקבות השבתה ולכן תרגול האופן שבו הארגון יבצע את תהליך ההתאוששות מאסון הוא
קריטי.
כל ארגון קובע עבורו מהם יעדי ההתאוששות הנכונים, תוך תכנון הפתרון הרלוונטי ומעבר לשלב הביצוע המורכב. השלב הקריטי והחשוב בסיום תהליך הקמת האתר המשני, הוא התפעול והתרגול, שלעיתים נזנחים ונדחקים הצידה. בפועל, במידה והארגון לא תרגל את הפתרון בצורה מלאה, לא ניתן יהיה לדעת בוודאות האם פתרון של ניהול תכנית התאוששות מאסון
DRP, שהושקעו בו עשרות מיליוני ש"ח אכן יעבוד בזמן אמת. המשמעות היא, שמה שלא מתורגל הוא בעל סיכוי נמוך שיעבוד ללא תקלות בזמן חירום.
התקשורת מדווחת על אירועי
DR רק כאשר התשתית הטכנולוגית החיונית לפעילותו של הארגון קורסת בעקבות כשל טכני. לרוב לא שומעים על כל המקרים של כמעט ונפגע. ארגונים, שעיקר קיומם מתבסס על תשתיות מחשוב, יחדלו לתפקד בעקבות השבתה ולכן תרגול האופן, שבו הארגון יבצע את תהליך ההתאוששות מאסון, הוא קריטי ומשפיע על התחום העסקי, התפעולי, הכספי והתדמיתי
.
מה שלא מתורגל לא עובד
מטרת התרגול היא לבחון האם תכנית ה-
DRP אכן עונה על הדרישות האמיתיות של הארגון להתאוששות מאירוע אסון. לצורך כך, התרגול צריך לדמות אירוע אסון ובאמצעותו לבחון את יעילות תכנית ה-
DRP. תוצאות התרגול תאפשרנה להפיק לקחים ולתקן ליקויים, שנמצאו במהלך התרגול.
תרגול נכון צריך להיות מקיף ולכלול לא רק את התשתיות הטכנולוגיות אלא את האנשים ואת הנהלת הארגון. בתרגול בוחנים האם תהליך קבלת ההחלטות פועל נכון והאם יש מענה לכל סוג של תרחיש אפשרי. למעשה, תרגול מקיף מעלה את רמת הביטחון של הארגון ומוריד את מפלס החרדה באופן משמעותי בזמן אירוע אמת ולכן מומלץ לבצעו לפחות אחת לשנה.
בפועל, תרגול מלא הוא תרגול, שבו הארגון עובד באופן ממשי על האתר המשני לתקופה של מספר ימי עבודה. התרגול כולל, את חיבור המשתמשים והממשקים לאתר המשני ואת כל תעבורת הרשת ופונקציות אבטחת המידע, שמתבצעות מהאתר המשני. רק בביצוע תהליך מלא של העלאת האתר המשני, ניתן להבין מהו זמן ההתאוששות (
RTO) האמיתי של הפתרון. בעת התרגול המלא, האתר המשני מתפקד כשכפול מדויק של האתר הראשי ואילו האתר הראשי הופך להיות אתר משני אליו משוכפלים הנתונים החדשים הנכתבים בארגון בזמן העבודה בתרגיל.
משחק מלחמה
מעבר לתרגול הפתרון הטכנולוגי, נדרש גם לתרגל את האנשים בארגון באמצעות משחק מלחמה, זהו כלי חשוב ויעיל לתרגול הארגון. במסגרת המשחק, נכנסים הצוותים המעורבים בניהול ותפעול אירוע
DR לחדר סגור למספר שעות במהלכן, מינהלת המשחק מציפה רשימה של תרחישים אפשריים, תקלות ואירועים. זו הזדמנות כמעט יחידה מסוגה למקבלי ההחלטות הטכנולוגיים בארגון להתאמן בזיהוי האירועים, בתהליך קבלת ההחלטות ובניהול האירוע עצמו.
מנהל התשתיות של ארגון פיננסי גדול, שביצע את משחק המלחמה לפני כמספר חודשים העיד, שזה אפשר לו הבנה עמוקה יותר של מורכבות הסיטואציה, הקנה כלים ומיומנויות עתידיות ושיפר את כשירויות העובדים, המנהלים ואת מיומנויות ההתנהגות. כך, הארגון יכול לפתח אסטרטגיה מותאמת מציאות בצורה אופטימאלית עבורו ובאופן מסוים אף לחזות סיטואציות עתידיות בזמן אסון, להשפיע עליהן ולשפר את המוכנות העסקית לקראת אסון או משבר.
מאת: דוד בן טולילה, אוגוסט 2016
מנכ"ל ומייסד חברת
Energy Team