DeepSeek | שאלות ותשובות

כל מה שכדאי לדעת על מודל ה-AI הסיני שהפיל את השווקים

הסטארט־אפ DeepSeek השיק מודל בינה מלאכותית שפותח בפחות מ־6 מיליון דולר, ומתחרה באלו של ענקיות הטכנולוגיה האמריקאיות שזכו להשקעות עתק • הנפגעת העיקרית: אנבידיה, על רקע החשש שלא נדרש כוח מחשוב חזק לפיתוח AI • איך הממשל הסיני קשור לסיפור, ומה צופים כלכלני הבנקים הגדולים בעולם?

Deepseek / אילוסטרציה: Reuters, VCG
Deepseek / אילוסטרציה: Reuters, VCG

יום כזה לא ראו בוול סטריט כבר הרבה זמן: שבוע המסחר נפתח בירידות חדות, כאשר האחראי לטלטלה הוא סטארט־אפ סיני קטן בשם DeepSeek. בהשקעה של פחות מ־6 מיליון דולר, ותוך שימוש בשבבים חלשים יחסית, הצליח הסטארט־אפ לפתח מודל בינה מלאכותית שמתעלה על מודלים אמריקאיים בהשקעות ענק.


"אבולוציה טבעית. לא כולם מנצחים": למה אנבידיה וברודקום צוללות בוול סטריט?
הירידות החדות הגיעו גם לבורסה בת"א: "אנחנו נמצאים רק בתחילת האירוע"
בהשקעה של פחות מ-6 מיליון דולר: מודל ה-AI הסיני שמפיל בחדות את מניות השבבים

הדרמה הגדולה כללה ירידה של כ־3% במדד הנאסד"ק שהובילה אנבידיה - שהוכיחה שגם עם שווי שוק אדיר של כ־3.5 טריליון דולר אפשר לרדת בקלות בשיעור דו־ספרתי - ולצד זאת מגמה דומה גם בקרב מניות אחרות בתחום השבבים, בהן מארוול, ברודקום, AMD ו־Arm.

המודל החדש והזול להפליא ערער את הנחת היסוד שצריך כוח חישובי חזק כדי לפתח את הבינה המלאכותית הטובה ביותר, והבהיל את המשקיעים שמיהרו להיפטר ממניות בתחום. המגמה הגיעה גם לבורסות אסיה וביתר שאת לבורסה בתל אביב, כאן מניות השבבים הדואליות קמטק ונובה צנחו בחדות ומשכו מטה את מדד הדגל.

DeepSeek

מתי נוסדה? מאי 2023
מי עומד מאחוריה? דמות אלמונית יחסית בשם ליאנג וונפנג, ראש קרן הגידור High-Flyer Quant , המנהלת נכסים בכ־8 מיליארד דולר
מה עושה החברה? מפתחת מודלי בינה מלאכותית בקוד פתוח
למה נוצרה סערה בשוק? החברה הסינית הצליחה לפתח מודל AI חזק בעלות נמוכה יותר, ובעזרת מעבדים חלשים ומעטים יותר ביחס למתחרות האמריקאיות

מה מיוחד בפיתוח הסיני, האם הוא באמת מאיים לפוצץ את בועת הבינה המלאכותית, שאנבידיה ויתר החברות במועדון השבבים נהנו ממנה בשנים האחרונות, ומה בכלל הסיכוי של אפליקציית AI סינית לחדור לשוק האמריקאי? גלובס עושה סדר.

מה עורר את הסערה?

DeepSeek שחררה לאחרונה את מודל V3, שאנליסטים הגדירו כ"אחד המודלים הפתוחים החזקים ביותר". המודל שוחרר ברישיון קוד פתוח, שמאפשר למפתחים להתאים אותו עבור רוב היישומים. בניית המודל ארכה כחודשיים והושקעו בו פחות מ־6 מיליון דולר. לצורך השוואה, גוגל השקיעה מאות מיליוני דולרים כדי לאמן את מודל ג'מיני שלה.

ביצועי המודל מרשימים לא רק בגלל ההשקעה הצנועה, אלא גם בשל החומרה החלשה שמאחוריו. על פי הדיווחים, בשל מגבלות הייצוא של ארה"ב החברה השתמשה ב־2,000 שבבי אנבידיה בעלי יכולת נמוכה, זאת בעוד שהמתחרות מפתחות מחשבי על עם כ־16 אלף שבבים לכל הפחות.

בשבוע שעבר שחררה החברה את מודל R1 שחשפה בסוף נובמבר, ואמור להתחרות במודל ה־Reasoning של OpenAI, ה־GPT o1. החברה טוענת שהמודל מתעלה או לפחות משתווה למודל ה־o1 בכמה אמות מידה - כמו מתמטיקה, קידוד והנמקה. על פי פרסומים, מודל R1 מורכב משש גרסות ממוקדות וקטנות יותר, שכל אחת מהן עם 1.5 מיליארד פרמטרים.

"המודל של OpenAI הוא הטוב ביותר בביצועים, אבל אנחנו גם לא רוצים לשלם עבור יכולות שאנחנו לא צריכים", אמר לוול סטריט ג'ורנל אנתוני פו, מייסד שותף בסטארט־אפ שמשתמש בבינה מלאכותית כדי לחזות תשואות כספיות, ועבר ל־DeepSeek ממודל של קלוד. לדבריו, בדיקות של החברה הראו שהמודל החדש מבצע באותו האופן את המשימות וברבע מהעלות.

מי עומד מאחורי החברה?

עדיין אין הרבה המידע בנוגע לחברה הסינית, אך העומד בראשה הוא דמות אלמונית למדי בשם ליאנג וונפנג. על פי הדיווחים ברשת, החברה נולדה מקרן גידור סינית שנקראת High-Flyer Quant, שמנהלת נכסים בכ־8 מיליארד דולר. וונפנג, כך לפי בלומברג, הקים את DeepSeek עם הון רשום של 10 מיליון יואן (שווה ערך ל־1.4 מיליון דולר).

וונפנג, שכבר לא כל כך אלמוני, אף נפגש ב־20 בינואר עם לי קצ'יאנג, ראש מועצת המדינה של סין, כדי לדון בצמצום הפערים של חברות סיניות מול המקבילות מארה"ב, כך פורסם בוול סטריט ג'ורנל. בראיון שסיפק לגוף התקשורת 36kr, אמר וונפנג שמה שהוביל להתקדמות לא היה גיוס כספים - אלא ההגבלות של ארה"ב על גישה לשבבים הטובים ביותר.

למה השוק הגיב בירידות?

אחד החששות העיקריים שהאנליסטים מצביעים עליו הוא התמחור הגבוה של ענקיות הטכנולוגיה. אם חברה סינית קטנה הצליחה לפתח מודלים מוצלחים עם ציוד ירוד והשקעה צנועה, מדוע הענקיות מבזבזות עוד ועוד? "הוצאות הבינה המלאכותית המסיביות שלהן זקוקות להערכה מחודשת", אומרים מומחים בתחום ל־CNBC.

גם בנקי ההשקעות התייחסו לדרמה. בג'יי.פי מורגן הודו שהמודל מפחית את העלויות בצורה דרמטית, וצוטטו את "הטענה החתרנית" של וונפנג שלפיה "יותר השקעות אינן שוות ליותר חדשנות". גם בג'פריס התייחסו לכך וציינו כי "הופעת דגמי אימון יעילים מסין עשויה להעצים עוד יותר את המרוץ אחר דומיננטיות בינה מלאכותית בין ארה"ב לסין. שאלת המפתח היא אם האסטרטגיה תהיה לבנות בכל מחיר, או שמא ההתמקדות תעבור ליעילות גבוהה יותר - מה שמפעיל לחץ על השחקניות הגדולות".

חדרי מלחמה ותגובות בהולות: ענקיות הטכנולוגיה נכנסו להלם

הביצועים המרשימים של מודל ה־AI הסיני החדש עוררו סערה לא רק בשווקים, והאפליקציה מצאה עצמה במהירות במקום השלישי בטבלת ההורדות בחנות האפליקציות של אפל. ענקיות הטכנולוגיה כמו מטא ומיקרוסופט, שרק מגדילות את השקעותיהן בתחום הבינה המלאכותית, נאלצות לצפות מהצד בחברה סינית קטנה שמראה שאפשר אחרת.

כעת, כך נראה, החברות בלחץ אדיר והנורות האדומות נדלקות בזו אחר זו. לפי דיווח ב־The Information, במטא חוששים שהמודל החדש Llama, שהיא מתכננת להשקיע בו 60-65 מיליארד דולר (בהשוואה לכ־40 מיליארד דולר בשנה הקודמת), לא יהיה מספיק טוב מול הפיתוח הסיני החדש. החשש הזה הוביל את החברה לפתוח ארבעה חדרי מלחמה, או "קבוצות מיוחדות של חוקרים", כדי לנתח את המודל החדש ולנסות להוציא תובנות עבור Llama. חלק מהקבוצות ינסו להבין איך הגיעו הסינים לעלויות פיתוח והפעלה נמוכות כאלה.

מנכ"ל מיקרוסופט סאטיה נאדלה, שנחשב לדמות מרכזית בתחום הבינה המלאכותית כיום, כבר הביע בשבוע שעבר את דאגתו ואמר כי "אנחנו צריכים לקחת את ההתפתחויות מסין מאוד מאוד ברצינות", כאשר התכוון לאותו מודל חדש של DeepSeek.

יחד עם זאת, יש גם דמויות מפתח בכלכלה האמריקאית שמרוצים מהפיתוח החדש. מארק אנדריסן, משקיע הון סיכון אמריקאי שייעץ לנשיא הנכנס דונלד טראמפ, צייץ בטוויטר (X) כי "DeepSeek R1 היא אחת מפריצות הדרך המדהימות והמרשימות שראיתי אי פעם".

לעומתם, בסיטי דווקא חשבו שזה לא משנה את התפיסה הנהוגה כיום. "בעוד שההישג של DeepSeek עשוי להיות פורץ דרך, אנחנו מפקפקים בתפיסה שההישגים נעשו ללא שימוש במעבדי GPU מתקדמים כדי לבנות את מודלי השפה הבסיסיים עליהם מבוסס המודל הסופי שעבר טכניקת זיקוק. הדומיננטיות של החברות האמריקאיות במודלי AI יכולה להתערער, אך אנחנו מעריכים שבסביבה מגבילה יותר הגישה של ארה"ב לשבבים מתקדמים היא יתרון. לפיכך, אנחנו לא מצפים שחברות AI מובילות יתרחקו ממעבדי GPU מתקדמים יותר".

למה דווקא אנבידיה צונחת?

ענקית השבבים, שהפכה בשנה האחרונה לחברה הגדולה ביותר בעולם במונחי שווי שוק, סיימה את המסחר ביום שני עם ירידה של כמעט 17%, ובכך מחקה קרוב ל־600 מיליארד דולר משוויה. את סוף היום היא סיימה כחברה השלישית בגודלה בוול סטריט, אחרי אפל ומיקרוסופט.

"האיום הגדול על אנבידיה", מעריך סרגיי וסצ'ונוק, אנליסט בכיר בבית ההשקעות אופנהיימר, "הוא שחברות הטכנולוגיה יבינו שהן לא צריכות את המעבדים החזקים של אנבידיה ואפשר להצליח גם עם יעילות נמוכה יותר. או שהן יגיעו להנחה שיש להן מספיק שבבים". עוד מוסיף וסצ'ונוק כי "אם המקרה של DeepSeek מלמד שאפשר לעשות המון עם פחות, אולי מרוץ החימוש בשבבים ירד, ואז האקו־סיסטם שנבנה כולו על אנבידיה, יהיה בבעיה רצינית".

חנן זכאי, סמנכ"ל לקוחות וחטיבת טכנולוגיה ב־CodeValue, שעוסקת בתחומי הענן והטרנספורמציה, מסכים ומסביר לגלובס כי "DeepSeek שוברת את הפרדיגמה שצריך הרבה מאוד כוח מחשוב כדי לעבד בינה מלאכותית. אם זה יתברר כנכון, זו מכה אנושה לאנבידיה".

מהם החששות של ארה"ב?

מעבר לתחרות הגדולה מול המודלים האמריקאיים, בארה"ב קבעו מגבלות משמעותיות על ייצוא טכנולוגיות מתקדמות של שבבים לסין, בין השאר כדי לעצור את התקדמות הבינה המלאכותית במדינה. DeepSeek הוכיחה שמהנדסיה התגברו על ההגבלות והתמקדו ביעילות למרות המשאבים הדלים. לא ברור אם לחברה כן הייתה חומרה מתקדמת כדי לאמן את המודלים, אבל בסופו של יום המגבלות התגלו כלא אפקטיביות.

עוד פורסם כי המודלים של DeepSeek עוברים צנזורה כדי למנוע ביקורת על המפלגה הקומוניסטית בסין, מה שמציב אתגר לאמץ אותה בעולם. צנזורה כזו יכולה להעיד על המעורבות של הממשל הסיני או לפחות על הכוח החזק שלו על החברה.

מה מיוחד במודל קוד פתוח?

המודל הסיני מאפשר למפתח לקחת פריט תוכנה ולעשות בו שימוש חופשי. מודלים של OpenAI לצורך השוואה פתוחים לשימוש, אך אם המפתח ירצה להגיע לשלב מתקדם ובטח לשימוש מסחרי - יידרש ממנו תשלום על השימוש בקוד. זכאי מ־CodeValue מסביר לגלובס כי "הבשורה המשמעותית היא שאפשר להוריד את הקוד אליך למערכות ולשרתים ולעשות שימוש".

האם המודל יוגבל בארה"ב?

וסצ'ונוק מאופנהיימר מצנן את ההתלהבות ואומר כי "בעולם שבו מחרימים את טיקטוק ואת וואווי, לא ירשו למודלים של בינה מלאכותית סינית להיכנס לארה"ב". לדבריו לא יהיה אפשר להשתמש שם במודלים האלו מטעמי ביטחון לאומי, "ולכן זה מוריד חלק מהלחץ". בנוסף, וסצ'ונוק אומר שהמודל הסיני לא מקבל גישה למסדי מידע אמריקאיים, ולכן זה יכול לפגוע ביעילות שלו.

מהדיווחים עולה שהמודל מסרב לענות על שאלות פוליטיות רגישות על סין והמנהיג שי ג'ינפינג, ומספק תגובות בהתאם לתעמולה הרשמית בסין. עם זאת, מדובר בקוד פתוח כך שמשתמשים יכולים לשנות זאת בקלות.