אסטרטגיית ניהול הסיכונים: המשכיות עסקית בכל תנאי

מתוך מגזין IT: חברת הביטוח מגדל בחרה ב-Data Center של Med-1 לאירוח אתר ההתאוששות מאסון

כשחברת הביטוח מגדל עיצבה אסטרטגיה של המשכיות עסקית בכל מצב, ללא פשרות וללא הנחות, התגבשה גם ההחלטה למקם את אתר הגיבוי במתקן האירוח Data Center Med-1 בצפון: "האסטרטגיה של מגדל היא ליצור יתרון תחרותי המבוסס על אמינות וזמינות ברמות האפשריות הגבוהות ביותר - בדרך כלל אף ברמות גבוהות ממה שהרגולטור מסתפק בהן, זאת מתוך דאגה ומחויבות עמוקה לזכויות המבוטחים ומתוך כוונה לשמר רמת שירות גבוהה גם בעת אסון", אומר שי בסון, משנה למנכ"ל ומנהל חטיבת טכנולוגיות ומשאבים במגדל חברה לביטוח.

ניהול סיכונים הוא ציר הפעילות העסקית של חברות ביטוח. ההתמחות שלהן במזעור החשיפה לסיכונים תפעוליים, פיננסיים וסביבתיים היא המאפשרת לחברות אלה "לקנות" את הסיכונים מחברות ומפרטיים - במחיר שכדאי ללקוח, שלא מסוגל לנהל סיכונים בצורה דומה - ועדיין להרוויח בסיכום הכולל.

מרכיב מהותי באסטרטגיית ניהול הסיכונים של חברות ביטוח הוא הגנה חזקה על מערכות המידע שלהן לצורך הבטחת המשכיות עסקית בכל תנאי, כולל אסון טבע רחב ממדים, פעולות מלחמה וטרור, פעילות פלילית ואף טעויות אנוש.

רמת הסף שקבע הרגולטור להגנה על מערכות המידע של חברות הביטוח מבטיחה את המשך השירות למבוטחים במקרים אלה, אבל חברות ביטוח שמונחות על ידי אסטרטגיה של מצויינות תפעולית לא מסתפקות בדרישות הרגולציה. "החברות משקיעות משאבים רבים ביצירת אמינות וזמינות שיאפשרו להם להמשיך לספק שירותים ללקוחותיהם בכול מצב אומר רוני שדה, מנכ"ל Med-1, "מתקני האירוח שלנו במרכז ובצפון הם היחידים שנותנים מענה לדרישה הגוברת להבטחת המשכיות עסקית והגנה על מערכות המידע בסטנדרטים העולמיים הגבוהים ביותר".

ניהול סיכונים בתפיסת הברבור השחור "מבחינת הלקוחות", אומר שי בסון, "הרציונל לבטח את העסק הוא הצורך הקריטי להכין רשת ביטחון להגנה מתוצאות אפשריות של אירועים הרסניים. מהגדרה זו ברור מדוע התכונה החשובה ביותר של רשת הביטחון היא יכולתה לשרוד בכשירות מלאה ולהמשיך לתפקד גם כאשר אירוע כזה פוגע בתשתיות כולן. לדוגמה, פוליסת ביטוח רעידת אדמה היא חסרת ערך אם מערכות המידע של חברת הביטוח עצמה אינן חסינות ביחס לאירועי רעידת אדמה.

זו הסיבה, מדוע החליטה הנהלת מגדל לפני שנים ספורות לערוך רביזיה מקיפה בתכנית ההמשכיות העסקית של החברה ולהתאים אותה לתסריטי "קיצון" - גם אם ההסתברות שלהם היא נמוכה. להמחשה, הניסיון מראה, שחברות שלא הצליחו לחזור לעבודה תוך 72 שעות מאירועי 9/11 (משום שמערכות הגיבוי שלהן שכנו באותם בנייני משרדים שקרסו), לא חזרו יותר לעסקים כרגיל גם אחרי שנתיים ושלוש."

"במאה ה-21 כל תוכנית המשכיות עסקית (BCP בקיצור) חייבת להתבסס על תוכנית התאוששות מאסונות (DRP) למערכות המידע", אומר רוני שדה, מנכ"ל Med-1. "התשתית של מערכת מידע בסביבה ממוגנת, עמידה באסונות, הינו אתר Data Center חלופי, בנוי ייעודית לשרוד כל אתגר, מעשי טבע או ידי אדם. אל האתר אפשר להעביר את הפעילות מהאתר הראשי (Production) בביטחון ובזמן הקצר ביותר, ללא הפרעה מוחשית למהלך העבודה השוטפת. בניית אתרים כאלה, הפעלתם המקצועית ואירוח מערכות המידע הראשיות, ה-Production, שלהן - כמו גם תשתיות ה-DRP של חברות עסקיות, הינה ההתמחות של Med-1."

כידוע, מערך עיבוד ואחסון המידע הוא "רצפת היצור" של חברות במגזר הפיננסי בכלל ושל חברות ביטוח במיוחד. "עבורנו, שרידות המידע ההיסטורי במערכות האחסון היא קריטית אף עוד יותר מאשר בבנקים", אומר שי בסון. "משום שאנו מטפלים לא רק בטרנזקציות של הזמן האחרון. יש לנו פוליסות בנות 50 שנה ויותר שעדיין מהוות חלק מהותי ממערך ההגנות של הלקוחות, שלכל צורך ועניין הם שותפים עסקיים ושלא יעלה על הדעת לאכזב אותם. אצלנו ההיסטוריה היא ישות חייה ובועטת בתפעול היומיומי ולכן חשיבות שימור המידע בכל מחיר היא עליונה. תובנה זו הובילה את הנהלת מגדל להגדיר יעד שאפתני במיוחד לנושא ההתאוששות מאסונות ולהעמיד במרכזו את ההגנה על האחסון.

המודל שנבחר הוא שיכפול וכפילות מלאה של התשתיות והמערכות בין שני אתרים מופרדים פיזית - למעלה מ-70 ק"מ מפרידים בין השניים - עצמאיים תפעולית, שכל אחד מהם מסוגל לספק שירות מלא ברמת ביצועים גבוהה ללא תלות בתמונת הראי שלו". תרבות של אפס תקלות התוכנית יצאה לדרך בתחילת 2011 כאשר במחצית הראשונה של השנה נחקר ואופיין הדרוש ובחצי השני נעשו המכרזים ונבחר האתר המשני, שיכול להחליף בזמן קצר ביותר את האתר הראשי.

"הדרישות שלנו מאתר ה-DR היו מחמירות וקפדניות מתוך הבנה שלא ניתן להתפשר על איכות המתקן אליו נדלג בעת אסון", אומר שי בסון. "בנוסף לעמידות בכל ספקטרום אסונות הטבע, החל ברעידת אדמה וכלה בשיטפונות, דרשנו אמצעי מיגון ואבטחה מפני פעולות איבה ופגעי מלחמה; עצמאות באספקת חשמל למשך לפחות 72 שעות; ניטור, ניהול ושליטה בזמן אמת 7x24 - ולא פחות חשוב: תרבות תפעולית של "אפס תקלות". האתר שנמצא כמתאים ביותר ובו בחרנו הוא מתקן האירוח של חברת Med-1 בצפון". המתקנים של חברת Med-1 נבנו כמתקני Data Center ייעודיים כשהחברה ממקדת את עסקיה בנושא אירוח מערכות מידע עבור לקוחות דוגמת מגדל, שיודעים להעריך את התועלות של אמינות מושלמת להמשכיות עסקית.

"מתקני האירוח שלנו הם היחידים שנותנים מענה לדרישה הגוברת להבטחת המשכיות עסקית והגנה על מערכות המידע בסטנדרטים העולמיים הגבוהים ביותר", אומר רוני שדה. "המתקנים נבנו עפ"י תקנים בינלאומיים והם זמינים היום לאירוח אתרי מחשב ראשיים (Production) - בנוסף לאירוח אתרי DR. חברות רבות הגיעו למסקנה שכלכלית עדיף לשכור שטחים ולרכוש שירותים באתרי ה-Data Center שלנו מאשר לבנות את המתקנים שלהם".

"שובר שוויון" כבר בקנה מידה קטן חברת Med-1 מפעילה, בנוסף לאתר בצפון שני מתקני Data Center מאובטחים בגוש דן. בסך הכל מציעה Med-1 ללקוחותיה למעלה מ-13,000 מ"ר שטח רצפה במבנה תת קרקעי ממוגן, מאובטח ומגובי חשמל. המתקנים יכולים לעבוד עצמאית עד 72 שעות ללא תלות בחברת החשמל או ספקי תשתית אחרים. שטח האחסון מחולק ל"כלובים ואולמות אירוח" נעולים וערוך לאירוח שרתים ומערכות אחסון בכול תצורה. באתרים אלה ניתן לקבל שירותי אירוח מנוהלים 24x7, במודל של מיקור חוץ, תפיסה כלכלית השואבת את כוחה מהתמחות, יתרון לגודל, מיקוד עסקי וגמישות תפעולית. "המעבר למודל של שכירת שירותי Data Center מנוהלים התחזק מאוד בשנים האחרונות," אומר רוני שדה.

"שירותי Data Center רחוקים מאוד מהמיקוד העסקי של הלקוחות, שאין להם בדרך כלל כל עניין בבעלות על נכסי נדל"ן ובוודאי שלא על נכסים ייעודיים לצורך הספציפי של אחסון מערכות מידע. היתרון לגודל ולהתמחות הוא "שובר שוויון" כבר בקנה מידה קטן יחסית, מכיוון שהשקעה מסיבית במתקן איכותי היא משקולת פיננסית כבדה על רגלי העסק ששואף לגמישות וזריזות." "היתרונות המובהקים של אירוח האתר הראשי במתקן Data Center מנוהל ומאובטח באים לביטוי בעלות הכוללת של תוכנית המשכיות עסקית שלא מוכנה להתפשר על עיגול פינות", אומר רוני שדה.

"אם מתכוונים להבטיח את רציפות השירות בכל מצב, כולל אסונות טבע בהיקף ארצי או מלחמה כוללת, הרעיון לעשות הכול לבד בתוך הארגון, מחייב השקעות גדולות מאוד שאינן מאפשרות לרוב הארגונים בארץ ליישם פתרון BCP. חשבון עלות-תועלת יראה לכם שעדיף למקם גם את אתר ה-Production במתקן Data Center חיצוני ולא רק את אתר הגיבוי". החלפת מנועי מטוס תוך כדי טיסה מערכת המידע של מגדל משרתת, כמובן, את כל 3,400 עובדי החברה, אך בנוסף יש לה ציבור משתמשים ישירים ועקיפים גדול פי 50. אלה כוללים מעל 10,000 סוכני ביטוח, שנסמכים על שירותי מגדל בכל פעולה יומיומית, החל בהצעת פוליסה וכלה בבירור ערכי פדיון, גביה או תשלום כלשהו, וכ-1.7 מיליון לקוחות פרטיים ועסקיים.

בהקמת ה-Data Centers, במסגרת פרויקט ה- DRP שנוהל במגדל בוצע גם שדרוג מהותי של כל מערכי האחסון התשתיות והתקשורת. מרכיב מהותי הפתרון הינו מעבר לווירטואליזציה של 98% מסביבת המחשוב, עדכון והחלפת מערכות האחסון הגיבוי. הוקם מערך תקשורת עצמאי רובסטי בין המתקנים המבוסס על קישור של סיבים אפלים בשני נתיבים בלתי תלויים. "הפרויקט בכללותו מגלם מהלך של שידוד מערכות הנוגע לכל אספקט תפעולי של מגדל", אומר שי בסון.

"לא השארנו אבן על אבן, החל בהחלפת השרתים הקלאסיים לשרתי להב, דרך החלפת חוות האחסון (1.3 פטה-בייט בסך הכול) בפתרונות High End, דרך מעבר ל- Exadata עבור בסיסי נתונים של אורקל וכלה בהסבה כוללת של שרתי היישומים מסביבת UNIX לסביבת Linux וירטואלית. מה שמדהים עד היום את הנהלת מגדל הוא, שהכל התרחש באפס הפרעות לעבודה העסקית השוטפת של הארגון! להמחשה, תדמיינו החלפת שני המנועים של מטוס נוסעים תוך כדי טיסה בלי שהנוסעים - והטייסים - ירגישו שמשהו לא רגיל קורה בחוץ!" בנובמבר הושלם מבצע הדילוג (Re-Hosting) של האתר המשני למתקן ה- Data Center של Med-1 בצפון לאחר ביצוע סדרת מבחני כשירות אולטרה-ריאליסטיים. "לכשירות מבצעית של אתר DR יש שני אספקטים: גיבוי מיידי - "שיקוף", של כל אחת מהמערכות בפני עצמה באמצעות מנגנון הרפליקציה - ויכולת להעביר את פעילות החברה מהאתר הראשי לאתר המשני תוך זמן קצר (פחות מיום עבודה) וכמעט ללא אובדן מידע שוטף, כלומר טרנזאקציות שהתחוללו בזמן הדילוג לא נופלות בין הכיסאות", אומר שי בסון.

"במקרה שלנו מדובר בדילוג של מספר סביבות עבודה נפרדות, שכל אחת מהן חיונית לתפעול וכולן תלויות זו בזו. וביניהן VMware על שרתי Wintel, Solaris על שרתי Sun, Exadata על שרתי אורקל ו-AS/400 על מחשבי IBM. במסגרת הניסויים הוכחנו שאפשר לעבור בין המערכות בזמן קצר ביותר, בלי שהמשתמשים יבחינו בשינוי כלשהו בביצועים או בהפרעה לרציפות העבודה.

בדילוג כולל של המערכות השגנו חזרה לשגרה תפעולית תוך 10 שעות, שהם פחות ממחצית הזמן עליו אנו מחויבים עפ"י המדיניות שהוגדרה בהנהלת החברה". סיווג AAA יחיד במגזר הפיננסי ההשקעה של מגדל בתשתיות מידע שיבטיחו המשכיות עסקית בכל תרחיש, גם הקיצוני ביותר, לא נעלמה מעיני חברת המדרוג שמנהלת טבלת רמת השרידות למגזר הפיננסי. מגדל היא היחידה בארץ עד כה שסווגה כ-AAA, הדרגה הגבוהה ביותר בסולם. "באנלוגיה, הדירוג הגבוה משקף חוזקם של שלושת עמודי תווך בהשקעה שעשינו," אומר שי בסון: גיבשנו תפיסת BCP הוליסטית, שאינה מסתפקת בדרישות הרגולטור אלא מודרכת על ידי DNA ארגוני - השאיפה למצוינות בשירות הלקוחות - ומתבטאת בכל פרט בפתרון שפתחנו בשותפות עם Med-1.

יישמנו לראשונה בישראל טכנולוגיות חדשניות, העונות להגדרת ההמשכיות העסקית כפתרון אופרטיבי שלם לרציפות התפקוד הארגוני בכל תסריט מאתגר. שדרגנו ועדכנו את החומרה והתוכנה הבסיסית במטרה למזער את מורכבות הניהול ברמה הכלל-מערכתית, באמצעות מעבר מסונכרן לפלטפורמות וירטואליות סטנדרטיות, שמבטיחות זריזות עסקית ויכולת גידול (Scalability) ללא הפרעות. "אני רוצה לציין שמהנדסי Med-1 היו שותפים לסיום המוצלח של הפרויקט. בסיפורי הצלחה, אנו רואים שילוב יכולות מקצועיות גבוהות עם טכנולוגיה. גם במקרה שלנו הנתונים הפיזיים של ה-Data Center והמחויבות העסקית של הספק להיות גורם מרכזי במגזר ה-Data Center הם שהובילו לבחירה ב- Med-1 כמארחת של אתר מגדל.

אבל כדי לממש תוכניות שינוי תשתיות מהותיות, כאשר מנהל ה-IT לוקח אחריות על השלמת הביצוע בלוח זמנים נוקשה וללא הפרעות לרציפות העבודה השוטפת, אנו נזקקים לשותפים בעלי תרבות שירותית מפותחת, לא רק נכסים פיזיים מתאימים. את השותפים האלה פגשתי ב-Med-1 ואיני יכול שלא לחלוק איתם את הקרדיט להצלחה". "התרבות השירותית ששי בסון מדבר עליה היא השתקפות הבסיס העסקי עליו הוקמה Med-1", אומר רוני שדה.

"אנחנו ממוצבים בנקודה בה נפגשים ארבעה כוחות, הפועלים להגברת הביקוש לשירותי אירוח עבור מערכות המידע של ארגונים: מגמות הרגולציה העולמית המצב הגיאו-פוליטי הייחודי בישראל הערך המוסף הכלכלי (החלפת השקעה הונית בהוצאה תפעולית) ועלייה במודעות של ההנהלות לתלות הקריטית במערכות המידע, כתנאי מוקדם להבטחת רציפות עסקית בשגרה ובחרום. "כדי לעמוד ברמות של אמינות וזמינות הגבוהות ביותר ולאפשר המשך פעילות של לקוחות בכל מצב ובכל תנאי, יישמנו בהקמת ה-Data Center את התקנים המחמירים ביותר של תקנים בינלאומיים.

אלה מתחילים במבנה עצמו, ממשיכים במתקני העזר והאנרגיה, ומסתיימים בנוהלי עבודה ואבטחה קפדניים. ברור שהגורם האנושי תופס מקום מרכזי ביכולת של החברה לעמוד בהתחייבויות לרמת הזמינות (SLA) כלפי לקוחותיה. אנו משקיעים גם באנשים, לא רק בציוד, ומפתחים משאבי אנוש בראיה ארוכת טווח. עובדים טובים, מסורים לשירות ומחויבים למצוינות מקצועית, הם שעושים את ההבדל האיכותי - ולקוחות כמו מגדל יעידו על האפקטיביות של הגישה השירותית שלנו".