מה חושב סם אלטמן על המודל הסיני שמשגע את העולם

השקת מודל השפה הסיני דיפסיק, שהצליח להוכיח כי הוא משתווה לאיכויות של המודל החדש ביותר של OpenAI, עוררה הדים רבים בעמק הסיליקון • מה כתבו עליה בכירי הענף?

סם אלטמן, מנכ''ל OpenAI / צילום: ap, stf
סם אלטמן, מנכ''ל OpenAI / צילום: ap, stf

בכירי עמק הסיליקון הופתעו, ככל הנראה, כמו רבים מהשקת מודל השפה הסיני דיפסיק שהצליח להוכיח כי הוא משתווה לאיכויות של המודל החדש ביותר של OpenAI. האיש שמאחורי ChatGPT, מנכ"ל OpenAI סם אלטמן, כתב ברשת איקס במהלך הלילה כי "מודל R1 של דיפסיק הוא מרשים ביותר, במיוחד לאור העלות הנמוכה שלו. אנחנו נשיק מודלים טובים יותר, אבל טוב שיש מתחרה חדש! נשחרר כמה דברים בקרוב". 

כל מה שכדאי לדעת על מודל ה-AI הסיני שמפיל את השווקים
מתקפת סייבר רחבה על חברת ה-AI הסינית שמטלטלת את השווקים
"אבולוציה טבעית. לא כולם מנצחים": למה אנבידיה וברודקום צללו בוול סטריט?

מארק אנדריסן, מייסד קרן הענק אנדריסן הורוביץ, צייץ כי "דיפסיק הוא רגע ה'ספוטניק' של הבינה המלאכותית", ואילו אנבידיה הסתפקה בתגובה טכנית ומדודה מאוד, לאחר שהתגלית הסינית החדשה מחקה כחצי טריליון דולר משוויה.

"DeepSeek מהווה התקדמות מצוינת בבינה מלאכותית ודוגמה מושלמת ל-Test-Time Scaling", מסרה החברה. אנבידיה משתמשת במונח Test-Time Scaling כדי לתאר את התהליך שבו ניתן לשפר את ביצועי המודל לצורכי הפעלתו לאחר שלב האימון, שלב המכונה "הסקה" או Inference.

"העבודה של DeepSeek ממחישה כיצד ניתן לייצר מודלים חדשים באמצעות טכניקה זו, תוך מינוף של מודלים קיימים וטכנולוגיות מיחשוב שעומדות בתקנות היצוא. ביצוע Inference דורש מספר משמעותי של מעבדים גרפיים וטכנולוגיות תקשורת מואצת", כתבה החברה.

בכך מודה אנבידיה כי דיפסיק אכן השתמשה במעבדים מיושנים שלא חוסים תחת מגבלות היצוא האמריקאיות, אך רומזת לכך שכדי ליהנות מהמודל יש צורך בשימוש במעבדים רבים, כך שלפי הרמיזה של ענקית הטכנולוגיה, קיים הבדל בין שלב גיבוש ואימונו באמצעות חומרה מיושנת לבין הרצת המודל בפועל - פעולה הדורשת כמות גדולה יותר של חומרה. 

"מיחשוב מציית לחוקי הגז"

פט גלסינגר, עד לאחרונה מנכ"ל אינטל, כתב גם הוא כי "מיחשוב מציית לחוקי הגז", וכי הוזלתו תגרום לכך שהוא יתפשט למקומות רבים בשוק, והוסיף כי העובדה שהצוות הסיני היה מוגבל במשאבים, אילצה אותו לפעול ביצירתיות. 

ויש גם מי שמפקפק באמיתות ההצהרות של דיפסיק. מנכ"ל חברת Scale AI, אלכסנדר וואנג, טוען כי לפי הבנתו, דיפסיק עשו שימוש ב-50 אלף מעבדי H100 של אנבידיה - היקף מיחשוב גדול ומשמעותי יותר ממה שהוצהר קודם לכן על-ידי החברה, שעשתה שימוש במעבד מהדור הקודם, לטענתה, H800.

ג'ונתן רוס, מנכ"ל חברת הבינה המלאכותית גרוק (Groq), השתעשע על חשבון החברה הסינית: הוא העלה בפוסט ברשת לינקדאין את המסרים ששלחה דיפסיק אתמול בעת ההשבתות שחוותה - בין אם בשל מתקפת סייבר או בשל עומס על שרתיה - ושיבץ לינק המפנה לשירות שלו.