ג'ף בזוס / צילום: Shutterstock
תקלה חריגה בת 15 שעות בשירותי הענן של אמזון (AWS) גרמה לשיבושים נרחבים באינטרנט העולמי - וגם בישראל. במשך שעות ארוכות, אתרים ושירותים מרכזיים חוו הפסקות ותפקוד חלקי. בין הנפגעים: מאנדיי, זום, פלייסטיישן, שירותי אמזון עצמם, פורטנייט ודואולינגו. לפי דיווחים, גם בנקים בבריטניה וחברות תעופה נפגעו. לאחר כשלוש שעות מסרה אמזון כי זיהתה את מקור התקלה ופועלת לתיקונה, אך רק כעבור כ־15 שעות הודיעה שהשירותים חזרו לפעילות מלאה.
● אחרי השיבושים: אמזון מדווחת על סימני התאוששות ב-AWS
● בהשקעה של 200 מיליון דולר לפחות, מגה אור תקים חוות שרתים בבית שמש
מעבר לפגיעה הישירה בשירותים המאוחסנים בשרתי אמזון, התקלה יצרה תגובת שרשרת שפגעה גם בחברות ובשירותים הפועלים במעגלים רחבים יותר, וסיפקה תזכורת לתלות העצומה של האינטרנט בתשתיות הענן של ענקית הטכנולוגיה.
מה הוביל לתקלה שפגעה בפעילות של אתרים רבים?
אמזון עדכנה כי התקלה נמצאה באחד הרכיבים, DynamoDB, מאגר מידע שאוגר בתוכו מידע רב על חברות ועל הלקוחות שלהם. בדיווח הראשוני של אמזון נאמר כי לקוחות לא יכולים לגשת לנתונים שמאוחסנים שם, זאת בשל תקלה ב־DNS (מערכת שמות הדומיין). כדי להסביר זאת בפשטות, ניתן להמשיל זאת לסוג של "ספר טלפונים לאינטרנט" שנתקל בבעיה. המערכת אמורה לנתב את הבקשות ששולחים לשרת, אבל בעת תקלה, "הטלפון" מתקשר למספר לא מחובר.

רון קמחי, סמנכ"ל טכנולוגיות וממייסדי EON אומר לגלובס כי "הענן הוא דבר דינמי. יש צוותי פיתוח אדירים, צוותים שעובדים כל הזמן והם אחראיים לפתח יכולות חדשות ושיפורים. ברגע שבאג נכנס למערכת, יש מנגנונים שמנסים למנוע ממנו לעשות אימפקט רחב. אבל לרוב מדובר בכמה כשלים לוגיים. לא צריך התקפה זדונית כדי שיהיה כשל בתשתית. טעויות שקורות בתום לב, לא רשלנות ולא התקפה, כמה כשלים שבאים אחד אחרי השני, וזהו, הכדור שלג הזה מתחיל להתגלגל וקשה לבלום אותו".
הריכוזיות בשוק הענן במספרים
שוק שירותי הענן הוא אחד הריכוזיים ביותר בעולם הטכנולוגיה. מרבית התשתיות שעליהן נשענים אינספור שירותים ואתרים מתופעלות בידי קבוצה מצומצמת של ספקיות, מה שמעצים כל תקלה לשיבוש עולמי.
על פי נתוני חברת המחקר האמריקאית Synergy Research Group לרבעון השני של 2025, אמזון (AWS) שומרת על מעמדה כמובילת השוק עם נתח של 30%. מיקרוסופט (אז’ור) ניצבת במקום השני עם 20% ואחריה גוגל קלאוד עם 13%. שלוש החברות יחד מחזיקות בכ־63% משוק תשתיות הענן העולמי, ששוויו מוערך בכ־99 מיליארד דולר לרבעון וצומח בקצב של כ־25% בשנה. השחקניות האחרות, בהן אורקל, סיילספורס ואליבאבא, מחזיקות בנתח של אחוזים בודדים בלבד. ל־AWS יש כיום בסיס לקוחות של כ־4 מיליון ארגונים ועסקים ברחבי העולם, נתון המדגיש את מרכזיותה במארג האינטרנט הגלובלי.
כשתקלה אחת משביתה עשרות שירותים
בעזרת שירותי הענן הלקוחות יכולים להציע שירותים לצרכנים באמצעות פלטפורמות מקוונות, לאחסן את המידע על בשרתים רלוונטיים ולספק אותו ללקוח. עסקים משלמים דמי מנוי לאמזון כדי לאפשר את השירותים האלו. בגלל הריכוזיות המשמעותית בענף, תקלה כזו בשירות משמעותי כמו אמזון, בהכרח תשפיע דרמטית על לקוחות רבים ומגוונים. המשמעות היא ששיבושים בתשתית כזו משמעותית באינטרנט העולמי תוביל לתקלות נרחבות בשירותים אינטרנטיים רבים.
הגישה המרכזית לאינטרנט היא שהוא אמור להיות מבוזר, ניטרלי, מעין כלי חופשי שלא נשלט על ידי גורם אחד. למרות שבשנים האחרונות ענקיות הטכנולוגיה כבר הפכו שחקניות מלאות ששולטות על חלקים נרחבים באינטרנט, תקלה כזו מלמדת הרבה ביחס לשוק. מספיקה תקלה נקודתית באמזון כדי להשבית עשרות שירותים פופולריים רבים.
כפי שאומר לגלובס צביקה רונן, מומחה לניהול סיכוני קוד פתוח ובעלי חברת FossaWare, "נפילת AWS הזכירה לכולנו את המחיר של ריכוזיות בענן ובעיקר את התלות של שרשראות אספקת קוד פתוח בתשתיות צד שלישי. כשאזור שלם של AWS הופך למקרטע, פעולות של בניית תוכנה נעצרות, התקנות חבילות קוד פתוח נתקעות, והרשת זועקת לעזרה".
ההערכה: שוק מחשוב הענן יזנק עד 2030
זו לא הפעם הראשונה שיש תקלות רחבות כאלו שמשפיעות בצורה רחבה. כך לדוגמה, מטא חוותה בעבר את אחת התקלות הגדולות ביותר עבורה - 7 שעות שכלל השירותים שלה לא היו זמינים כלל. תקלה כזו הובילה להרבה עסקים ונותני שירות שלא יכלו לשמור על קשר עם לקוחות שלהם. מקרה נוסף שיכול להראות את הריכוזיות הבעייתית בשוק קרה ביולי 2024, אז במהלך עדכון שבוצע על ידי חברת אבטחת המידע CrowdStrike - שירותים רבים לא פעלו בשל תקלה אצל חברת אבטחת המידע. המקרים האלו מראים איך שירותים רבים מסתמכים בריכוזיות רבה על כלים ספציפיים, שמספיקה תקלה אחת בהן כדי להשבית שירותים רבים.
על פי נתונים חדשים של חברת המחקר BCC, שוק מחשוב הענן צפוי לגדול בשנה הקרובה. לפי המחקר, השוק צפוי לצמוח מ־738.2 מיליארד דולר בשנת 2025 ל־1.6 טריךיון דולר עד סוף 2030, בקצב צמיחה שנתי של 17.2%. המשמעות היא שהביקוש מספקיות הענן יעלה, מה שיכול לחזק דרמטית את הריכוזיות בשוק.
כמה פגיעה כזו יכולה להיות משמעותית למשק? אם חברות רבות הושפעו, בהם גם בנקים, חברות תעופה ועוד - ההשלכה יכולה להיות משמעותית. מהדי דאודי, מנכ"ל חברת ניטור ביצועי האינטרנט Catchpoint, העריך ל־CNN כי ההשפעה הפיננסית של התקלה הזו תסתכם במיליארדי דולרים. "ההשפעה הכלכלית של התקלה הזו תגיע בקלות למאות מיליארדים עקב אובדן פרודוקטיביות עבור מיליוני עובדים שלא יכלו לבצע את העבודה שלהם, בנוסף לפעילות עסקית שהופסקה או התעכבה - מחברות תעופה ועד מפעלים".
בשנת 2021, אמזון התמודדה עם אירוע דומה כזה. תקלה רחבה שהשפיעה על הרבה מאוד לקוחות. רון קמחי, הוביל באותה תקופה את תחום Disaster Recovery באמזון, ראה מקרוב את התקלה. "זה כמעט בלתי אפשרי למנוע את האירוע הבא. זה רק עניין של זמן עד שהתקלה הזו תקרה. גם אם יצמצמו את הסיכון, עדיין התקלות יקרו". עלו כל מיני פתרונות להסתמך על חוות שרתים באותו האזור, אבל עדיין יש תקלות שיכולות להפיל אזור שלם ולא רק מתקן בודד. "כשיש שלוש חברות שמחזיקות את כל השוק, האסטרטגיה החזקה לשוק ריכוזי כזה היא לא להסתמך על ספקית אחת".
לדבריו קמחי, "הגישה שאנחנו רואים שאמזון נוקטת, וכך גם מיקרוסופט וגול, היא שיש אחריות גם של הלקוח. על הלקוח לדאוג שהמערכות שלו יהיו חסינות. כי תקלות יקרו תמיד, ותקלות זה דבר בלתי נמנע".
האם ניתן לצמצם את השיבושים?
אז מה בכל זאת אפשר לעשות כדי למזער נזקים במקרה של תקלה עולמית באחד משירותי הענן? התקלה עצמה ככל הנראה תקרה, וללקוח של ספקית ענן אין איך למנוע אותה. עם זאת, ישנה אסטרטגיה מרכזית כדי למנוע את השיבושים בשירות והפתרון המרכזי הוא יצירת גיבוי בשרתים אחרים ולא להתבסס על מערכת אחת בלבד. אולם, גיוון כלל השירותים עלול להיות יקר ועל כן ישנם מקרים בהם כמעט בלתי אפשרי. במקביל, יש כל מיני פתרונות חלקיים, כמו לגבות ביותר מחוות שירותים אחת.