המהנדס הישראלי שהפך למוח מאחורי המעבדים של חברת הענן הגדולה בעולם

נאפע בשארה נחשב למוח המרכזי מאחורי המעבדים של חברת הענן הגדולה בעולם, האחרונה מביניהן שהצטרפה לגל הבינה המלאכותית היוצרת • עכשיו הוא עסוק בפיתוח שבבי AI שמתחרים במעבדים הגרפיים של אנבידיה • ומדוע ארם חייבת לו את הנפקת הענק אליה יצאה השבוע? • ישראל בחזית השבבים העולמית - פרויקט מיוחד

נאפע בשארה / צילום: ערוץ היוטיוב הרשמי AWS Events
נאפע בשארה / צילום: ערוץ היוטיוב הרשמי AWS Events

נאפע בשארה, יליד חיפה, הפך בשנים האחרונות לאורח מקובל ואהוד במסדרונות ההנהלה של אמזון בסיאטל. "גרביטון", מעבד הליבה שפיתח יחד עם קבוצת ישראלים לשרתי הענן של AWS, הפך לפרת מזומנים עבור ענקית הקמעונות - ואפשר לה לשמור על רווחיות גבוהה למדי, גם כאשר המכירות ירדו בשל המשבר בהייטק וההאטה הכלכלית.

לאחרונה הודיעו באמזון כי 20 מיליון מעבדים כאלה יוצרו ושולבו בשרתיה, ולפי ההערכה, מעל ל-20% מכלל השרתים באמזון מכילים את השבב שמקורו בישראל. האימוץ הנרחב של הגרביטון בשרתי אמזון רק הולך ועולה, במידה רבה על חשבון מעבדי הליבה של אינטל ו-AMD.

עוד בסדרהלכל הכתבות

הצג עוד

את השבבים האלה מפתח בשארה יחד עם עמיתו בילי הרבויה, הישראלי שמנהל את אנפורנה בפועל. לפיתוח שותפים מאות מהנדסים במשרדי אמזון בתל אביב ובחיפה.

בשארה, יחד עם בילי הרבויה והיזם הסדרתי אביגדור וילנץ, הקימו את אנפורנה לאבס (Annapurna Labs) ב-2011, לאחר שהחליטו לוותר על טיול להר האנפורנה בנפאל לטובת עסקיהם. ארבע שנים בלבד לאחר מכן, נמכרה החברה לאמזון ב-370 מיליון דולר. הרכישה השתלמה לאמזון, מכיוון שבשנה שעברה חשפה החברה כי השבבים שתוכננו על ידי החברה הישראלית חסכו לה 5 מיליארד דולר.

מאז השיקה אנפורנה לאבס עוד שני שבבים שנועדו לספק שירותי בינה מלאכותית ללקוחות שירותי הענן: שבב לאימון מודלים חדשים המנתחים טקסטים, קול או תמונה, תחת המותג "טרייניום" (Trainium), ושבב המשמש להפעלה שוטפת של מודלי בינה על גבי המידע הארגוני, בשם "אינפרנשיה" (Inferencia). השניים משתלבים היטב בטרנד הבינה המלאכותית החדש, אף שהגרסה הראשונה שלהם הושקה כבר לפני ארבע שנים.

 נאפע בשארה (47)

אישי: נשוי+, מתגורר בסן חוזה. יליד חיפה, גדל בתרשיחא
מקצועי: למד הנדסת חשמל ומחשבים בטכניון. מנהל הטכנולוגיות הראשי באנפורנה לאבס וסגן נשיא אמזון AWS
עוד משהו: איל וולדמן, לימים מייסד מלאנוקס, אחראי לצעד הראשון בקריירה של נאפע, כאשר גייס אותו למארוול טכנולוגיות עוד בהיותו סטודנט

בשארה וצוותו אחראים גם על הישג של חברה אחרת - חדירתה של ענקית השבבים הבריטית ארם (ARM) לשוק שרתי הענן והבינה המלאכותית, מה שמאפשר לה כיום לצאת להנפקה ולבקש שווי אסטרונומי של 55 מיליארד דולר.

בשארה סיפר בעבר בשיחה שנערכה בכנס מצולם של אמזון, כי אינטל לא היתה מעוניינת לעבוד עם אנפורנה לאבס בראשית דרכה, בגלל היותה חברה צעירה מדי. לכן פנתה הנהלת אנפורנה לארם, שהתמחתה בעיקר בשבבים לטלפונים חכמים, דוגמת שבבי הליבה של מכשירי האייפון וכן המעבדים של מכשירי סמסונג המיוצרים על ידי קוואלקום. בשארה וצוותו שכנעו את ארם להיכנס לתחום שהיה רחוק ממנה באותה תקופה, שרתי ענן, לאחר שבעבר זנחה אותו בעקבות ניסיון שלא צלח, ועירב גם צוותים ישראליים מפריסקייל וממארוול.

כיום, 50% מכלל שבבי השרתים מבוססי ארם מותקנים באמזון, ובעקבות ההצלחה התעורר גם אצל חברות כמו מיקרוסופט וגוגל תיאבון לפתח שבבי שרתים דומים המבוססים על הטכנולוגיה של החברה הבריטית.

חלק מהפעילות הזו מתנהלת במרכזי הפיתוח של החברות בישראל. ארם חייבת להנהלת אנפורנה, וגם לבכירי אמזון שרכשו את אנפורנה - בהם מהנדס-העל ג'ים המילטון - דיבידנדים על ההחלטה להיכנס לתחום השרתים; בזכותם במידה רבה היא השיגה דריסת רגל בתחום הצומח של הבינה המלאכותית היוצרת.

מאפשרים לאמזון לחסוך היכן שצריך

שבבי הבינה המלאכותית של אמזון לא נועדו להתחרות במעבדים הגרפיים של אנבידיה באופן ישיר, אך באופן טבעי הם מאפשרים לה לחסוך היכן שצריך, ולהימנע מההוצאות הכבדות הכרוכות בכך. המעבדים של אנבידיה - מונופול בשוק המעבדים הגרפיים לשוק שרתי הענן - יקרים להחריד, ולפי ההערכה, ההפעלה של מעבד "איפרנשיה" של אמזון זולה ב-40%.

בחודשים האחרונים סובלת אמזון מתדמית ציבורית של מי שהצטרפה באיחור לרכבת הבינה המלאכותית היוצרת. היא הכריזה על מודל שפה גדול בשם טיטאן רק לאחר שמיקרוסופט הציגה כבר את GPT וגוגל את "פאלם".

בניגוד אליהן, אמזון החליטה ללכת על גישה פתוחה יותר, ולצד מודל השפה שלה, היא מציעה ללקוחותיה את האפשרות לבחור מודלים אחרים של חברות מתחרות, בהן אנטרופיק, סטביליטי ואפילו AI21 הישראלית, של פרופ' אמנון שעשוע.

כלפי חוץ מקרינים באמזון ביטחון - החברה משקיעה בבינה מלאכותית מיליארדי דולרים עוד לפני ש-OpenAI משכה את כל העיניים אליה עם מנוע ChatGPT. ובכל זאת, מייל שדלף לתקשורת האמריקאית מעיד על פרויקט בינה מלאכותית יוצרת מיוחד בפיקוחו הישיר של מנכ"ל אמזון, אנדי יאסי.

אלא שלמרות התדמית, אמזון היא עדיין ספקית מחשוב הענן הגדולה בעולם, עם נתח שוק של 32%, ובשל כך היא נחשבת גם לספקית שירותי הבינה המלאכותית הגדולה ביותר. לשם השוואה, נתח השוק של מיקרוסופט מכלל שירותי הענן עומד על 22%, בעוד שגוגל שומרת על נתח של 11% מכלל השוק, כך על פי חברת המחקר סינרג'י.

"לקוחות מעבירים פעילות מאנבידיה אלינו"

גארי סילגי, סמנכ"ל באנפורנה, הופיע לפני מספר שבועות באירוע של אמזון, וטען כי "יש לנו לקוחות שמעבירים את הפעילות שלהם ממעבדי GPU (של אנבידיה, א' ג') למעבדים שלנו, בעיקר בתחום האימון וההסקה, במטרה לשפר ביצועים ולהפחית משמעותית את העלויות".

סילגי הכיר את בשארה כבר כאשר עבדו יחד במארוול, שרכשה בישראל את גלילאו. בווידיאו שהעלו השניים לרשת לפני מספר שבועות, שאל סילגי את בשארה על אתגרי הפיתוח של שבבי אמזון. "אנפורנה שונה מרוב יצרניות השבבים האחרות", אומר בשארה בשיחה המצולמת. "אנחנו לא רק עסוקים בתכנון השבב - אלא גם מעורבים בבנייה ובייצור שלו. כך, אנחנו לא רק האדריכלים - אנחנו גם הקבלנים וגם השרברבים של המבנה, אם לשאול מונחים מעולמות הבנייה.

"אנחנו צריכים לחשוב גם על הולכת החשמל במעבד ועל הדרך שבה החום שלו מתפזר - ולא רק על 'אפסים' או 'אחדות' ושערים לוגיים של מעגלים. בגלל שאנו מספקים שירותים לעצמנו, אנחנו יכולים טוב יותר לספק משוב, ולהשפיע בזמן אמת על התכנון".

מעצם העובדה שבשארה פועל בתוך אמזון, עומדים לרשותו כל משאבי הענן הנדרשים כדי להריץ את תוכנית העיצוב המורכבת. "היינו הראשונים להשתמש בענן בסדרי גודל בתהליכי הפיתוח. רבים מחברינו בתעשיית השבבים לא יכלו לספק כמה מהשבבים הפופולריים ביותר היום בלי להשתמש בענן בדרך שבה אנו התחלנו להשתמש בו לפני שש או שבע שנים".

לדברי בשארה, "כשאתה ניגש לבנות שבב שכזה, זה כמו לתכנן בית - אבל עם 50 מיליארד לבנים. ותחשוב שאתה נדרש למקם את מיליארדי הלבנים האלה על גבי התוכנית, תוך כדי שאתה מנסה להבין איך להניח את הקורות, הצנרת, הכבלים, תעלות האוורור והחלונות והדלתות, כדי שהבית יתקשר עם העולם שמחוצה לו.

"עכשיו, דמיין שהלבנה הזו היא בעצם טרנזיסטור - מעגל חשמלי - בגודל 5 ננומטרים בלבד. גובה הבניין הוא 80 קומות, והחיווט שעובר בו הוא באורך של 35 קילומטר. עכשיו תחשוב שוב איך אתה מתכנן את כל זה, עם גודל תוכנית שאינו עולה על 3 על 3 סנטימטרים. העיצוב והייצור של שבבים הם אחד מפלאי האנושות - לא פחות מורכבים ומופלאים מתכנון מטוסים או הנחתת אדם על הירח".

גם באמזון החלו לוותר על שבבי אנבידיה

עד כמה שבבי הבינה המלאכותית של אנפורנה מאתגרים את אנבידיה? בעוד שמעבד האימון טרייניום נחשב לחדש בשוק, ועדיין מעורר סימני שאלה, שבב "אינפרנשיה" כבר הוכיח את פעילותו על מוצרים פנימיים של אמזון, כמו המסייעת האישית הדיגיטלית אלכסה והחנות המקוונת.

ההערכות הן כי גם באמזון החלו לוותר על מעבדי אנבידיה כמו H100 או A100, וכי היא תמשיך להציע ללקוחותיה לאמן את המודלים שלהם עם שבבים של אנבידיה, אך לאחר שלב האימון, ועם המעבר לשלב תפעול המודל על גבי הנתונים בארגון, היא כבר מציעה יותר ויותר שירותים הנסמכים על השבב שלה.

ויש מי שנהנה מהעלייה של שבבי הבינה המלאכותית של אמזון - היזם משה תנ״ך הודיע כי החברה בניהולו, ניוריאליטי, נמצאת בשלבים האחרונים לקראת ייצור של מעבדי בינה מלאכותית, שיעבדו יחד עם מעבדי ״אינפרנשיה״ במטרה לחסוך ללקוחות רכישתם של מעבדי ליבה, כמו גרביטון של אמזון או מעבדים אחרים של אינטל ו- AMD. המוצר אף ייתר, לדידו של תנ״ך, את הצורך להתקין בשרת בקר התקשורת והסייבר, כמו זה המיוצר על ידי אנפורנה, תחת המותג Nitro. לטענתו, עיבוד דיבור, למשל יוכל לעבוד ביעילות רבה יותר ולחסוך עד 90% מעלות הביצוע. בטווח הארוך, יש לפתרון הישראלי איום כלפי אנבידיה, שנחשבת ליצרנית של פתרון יעיל, אך יקר למדי.