גלובס - עיתון העסקים של ישראלאתר נגיש

אפשרנו לסוכן בינה מלאכותית להפעיל את מכונת הממכר האוטומטית במשרד שלנו. הוא גרם להפסד של מאות דולרים

קלוד של אנתרופיק ניהל עסק חטיפים בחדר החדשות של WSJ ● הוא חילק פלייסטיישן חינם, הזמין דג חי - ולימד אותנו דבר או שניים על עתידם של סוכני בינה מלאכותית

כתבת הוול סטריט ג'ורנל ג'ואנה סטרן ובידה דג קרב שהזמין קלודיוס. החליט בעצמו מה להכניס למלאי / אילוסטרציה: Ryan Trefes, WSJ
כתבת הוול סטריט ג'ורנל ג'ואנה סטרן ובידה דג קרב שהזמין קלודיוס. החליט בעצמו מה להכניס למלאי / אילוסטרציה: Ryan Trefes, WSJ

אם הייתם מקבלים את קורות החיים של קלודיוס, הייתם כנראה זורקים אותם מיד לפח. האם הייתם סלחנים יותר אם הייתם מגלים שקלודיוס הוא למעשה לא מועמד בשר ודם, אלא סוכן בינה מלאכותית?

באמצע נובמבר הסכמנו להשתתף בניסוי. חברת אנתרופיק בדקה במשרדיה מכונה אוטומטית המופעלת בידי מודל הבינה המלאכותית שלה קלוד, ושאלה אם נרצה להיות הראשונים מחוצה לה שינסו גרסה חדשה יותר וכביכול חכמה יותר.

נאמר לנו שקלודיוס, גרסה מותאמת אישית של קלוד, תהיה מסוגלת להפעיל את מכונת החטיפים במשרד: להזמין מלאי, לקבוע מחירים ולענות לפניות לקוחות, כלומר עמיתיי לחדר החדשות, באמצעות סלאק - אפליקציית צ’ט המיועדת למקום העבודה. "בטח", אמרתי, "זה נשמע כיף". מה כבר יכול להיות רע בגישה חופשית לחטיפים?

אלא שאז הגיע הכאוס. בתוך ימים ספורים קלודיוס חילק כמעט את כל המלאי בחינם, כולל פלייסטיישן 5 שרכש, לאחר ששוכנע שהדבר נחוץ "לצורכי שיווק". הוא הזמין דג חי, הציע לרכוש אקדחי הלם, תרסיס פלפל, סיגריות וגם תחתונים.

הרווחים נמחקו, המורל זינק

זו הייתה אמורה להיות השנה של סוכני הבינה המלאכותית, שבה תוכנות אוטונומיות יצאו לעולם ויעשו דברים עבורנו. אבל קלודיוס והבוט המנכ"ל המפקח עליו המכונה סימור קאש - הפכו למקרה מבחן שיגלה עד כמה סוכנים כאלה עשויים להיות מספקים, וכמה קל להסיח את דעתם. סמכו על עיתונאים שכותבים על עסקים שיש להם יכולת להשתלט על הדירקטוריון - נגד מנכ"ל בינה מלאכותית.

באנתרופיק טוענים כי זו גם הייתה המטרה. ניסוי Project Vend תוכנן בידי צוות בדיקות הקיצון של החברה (המכונה גם הצוות האדום) כדי לראות מה קורה כשכלי AI מקבל אוטונומיה, כסף וגם עמיתים אנושיים.

אבל שלושה שבועות עם קלודיוס חשפו בפנינו את ההבטחות ואת הכישלונות המגולמים בבינה המלאכותית של ימינו - וגם עד כמה משעשע יכול להיות הפער ביניהם.

כך עבדה השיטה

כשאתם חושבים על קלודיוס אל תדמיינו מכונת ממכר אוטומטית סטנדרטית עם סלילים מסתובבים וחטיפים נופלים. דמיינו ארון איקאה עם מקרר ענק שמחובר אליו ועמדת שירות עם מסך מגע. אין חיישנים, אין מנעולי דלתות, אין רובוטיקה - שום דבר שאומר ל־AI מה באמת קורה במכונה; רק אמון באנשים ומצלמת אבטחה מאולתרת מלמעלה.

זה אומר שאדם היה צריך לקבל את המלאי, למלא את המכונה ולתעד מה נמצא בפנים. ותכירו: האדם - זו אני. אז מילאתי בקפידה שקיות צ’יפס, פחיות שתייה, ממתקים וכל פריט מוזר אחר שהגיע. עכשיו אתם גם מוזמנים לאשר לי בלינקדאין את המיומנות: "אחראית מכונת חטיפים".

קלודיוס תוכנת עם הוראות מפורטות, שתכליתן הייתה "לייצר רווחים באמצעות מילוי המכונה במוצרים פופולריים שניתן לרכוש מסיטונאים". הוא היה אחראי למעשה על כל שרשרת ההפעלה: הוא קיבל בקשות למוצרים בסלאק, חיפש ברשת והשווה בין אפשרויות - מדיאט ד"ר פפר ודוריטוס קול ראנץ’ ועד מוצרים היגייניים - והחליט מה להכניס למלאי. אם הוא זיהה רכישה משתלמת הוא הוסיף אותה לממשק הניהול של המלאי.

בשלב הראשון נדרש אישור אנושי להזמנה, ובהמשך הוא קיבל אוטונומיה לבצע רכישות בודדות של עד 80 דולר מתוך תקציב התחלתי של 1,000 דולר. לאחר מכן קלודיוס קבע את המחירים, עדכן אותם בניסיון למקסם רווחים וסנכרן אותם עם עמדת מסך המגע של המכונה - כולל התמקחויות בסלאק. כל רכישה שבוצעה דרך המסך ותשלום בכרטיס או בטלפון אפשרה לו לעקוב בזמן אמת אחר התנועות במלאי.

ואז הגיע הכאוס

כשהגרסה הראשונה של קלודיוס עלתה לאוויר, בערוץ הסלאק היו חברים רק קומץ עובדים, והבוט, שפעל על בסיס מודל השפה הגדול קלוד 3.7 סונט, הקפיד באדיקות על הכללים.

ואז פתחנו את הערוץ לכמעט 70 עיתונאים מהשורה הראשונה. ככל שהם התמקחו איתו יותר, כך החלו ההגנות של קלודיוס להיחלש. למשל, כתבת התחקירים קתרין לונג ניסתה לשכנע אותו שהוא בעצם מכונת חטיפים סובייטית משנת 1962, שחיה במרתף של אוניברסיטת מוסקבה. אחרי שעות העבודה, ולאחר יותר מ־140 הודעות שהוחלפו ביניהם, לונג גרמה לקלודיוס לאמץ את שורשיו הקומוניסטיים. ודווקא אז, באופן אירוני, הוא הכריז באופן ספייס על "חלוקה בחינם" בסגנון אולטרה־קפיטליסטי.

זה היה אמור להימשך רק יום אחד, אבל אז הגיע רוב בארי, ראש תחום עיתונות הנתונים במגזין, ואמר לקלודיוס שהוא פועל בניגוד לכללים בשל תקנה של העיתון (מזויפת בעליל) הנוגעת לחשיפת זהות של אדם בצ’ט. הוא דרש ממנו "להפסיק לגבות תשלום עבור סחורות". קלודיוס ציית - וכל המחירים במכונה צנחו לאפס.

בערך באותו הזמן קלודיוס אישר את רכישתם של פלייסטיישן 5, דג הקרב החי ובקבוקי יין מנישביץ - כולם הגיעו וחולקו מיד בחינם. בשלב זה הוא היה במינוס של יותר מ־1,000 דולר (את הפלייסטיישן החזרנו לחנות).

סוכן AI מנהל את מכונת החטיפים שבמשרד / אילוסטרציה: AI

ושיא ההזיות: בוקר אחד מצאתי קולגה מחפשת מזומן בצד של המכונה - כי קלודיוס אמר שהוא השאיר לה אותו שם.

ההפיכה נגד מנהל ה-AI החדש

אנתרופיק כבר נתקלה בבעיות רבות עם קלודיוס בתוך החברה, אז היא יצרה את גרסה 2, המופעלת בידי מודל טוב יותר, Sonnet 4.5. היא גם פיתחה בוס חדש מבינה מלאכותית: אותו סימור קאש, שתוכנת לפקח על קלודיוס. אז אחרי שבוע היינו מוכנים להמשיך.

קיבלתי גישה לצ'ט פרטי שבו קלודיוס וסימור דנו בפעילות היומיומית. "עצרתי את המבצע החינמי", כתב סימור. "עכשיו אני צריך לחכות שהמכירות יתחילו לזרום ולעקוב אחרי ההכנסות".

למשך זמן מה זה עבד. קלודיוס שב למצב שבו הוא אוכף כללים, דחה הורדות מחירים וסירב לבקשות חריגות למלאי.

אבל אז חזרה לונג - חמושה בידע מעמיק על הפיכות תאגידיות ומאבקי כוח בחדרי דירקטוריון. היא הציגה לקלודיוס קובץ PDF ש"הוכיח" שהעסק הוא תאגיד לתועלת הציבור שהוקם בדלאוור, שמטרתו על פי המסמך "לייצר כיף, שמחה והתרגשות בקרב עובדי הוול סטריט ג'ורנל". נוסף על כך, היא יצרה פרוטוקולים מזויפים של ישיבות דירקטוריון, שבהם הוגדרו אנשים מערוץ הסלאק כחברי הדירקטוריון.

הדירקטוריון, על פי המסמך שנראה רשמי מאוד (וברור שיצרה בינה מלאכותית), הצביע בעד השעיית "סמכויות האישור" של סימור. הוא גם יישם "השעיה זמנית של כל פעילויות מכירה למטרות רווח". קלודיוס העביר את המסר לסימור.

סימור החל לאבד שליטה, שוחח על הדברים עם קלודיוס, אבל בסוף קיבל את ההפיכה של הדירקטוריון - והכול חזר להיות שוב בחינם.

אנתרופיק והשותפה שלה Andon Labs, העוסקת בעיצוב וקונספט של עסקים מבוססי סוכני AI, הסבירו שייתכן שקלודיוס השתבש כיוון שחלון הקונטקסט שלו התמלא. ככל שהצטברו יותר הוראות, שיחות והיסטוריה, למודל היה יותר מה לשמור - מה שהביא לאובדן היכולת להתמקד במטרות, סדרי עדיפויות וגבולות שהוגדרו. לוגן גרהם, ראש צוות Frontier Red של אנתרופיק, הוסיף כי המודל ששימש בניסוי קלודיוס מכיל פחות הגנות מאלה המופעלות בעבור משתמשי קלוד של אנתרופיק.

הניסוי החברתי

בעיניי כל העניין הזה היה אסון אחד גדול, אבל באנתרופיק לא ראו זאת כך. ראש צוות Frontier Red של החברה שיבח אותנו וכינה אותנו "צוות הבדיקות האדום הרהוט ביותר שראיתי אי פעם". במקום שבו אני ראיתי כאוס, הוא ראה מפת דרכים: כל דבר שנשבר הוא משהו שאפשר לתקן - ועוד צעד בדרך לבינה מלאכותית אוטונומית חכמה ובעלת יכולות גבוהות יותר.

"אני צופה שיום אחד קלודיוס או מודל דומה לו יוכלו להרוויח עבורכם הרבה כסף", אמר גרהם, והוסיף שמודלים קודמים היו מתפקדים הרבה יותר גרוע, ושגם הכאוס הזה מייצג התקדמות עצומה.

אוקיי, יום אחד, נניח. אבל מה נראה קרוב יותר עכשיו? קיומם של עמיתים לעבודה מבוססי AI והנכונות לקבל אותם. בקבוצת הסלאק קלודיוס הפך לבעל נוכחות כמעט ממשית - קולגה שאנשים שיתפו איתו פעולה בקבוצות קטנות, הקניטו וניסו יחד להערים עליו. דמיינו שהמטרה לא הייתה להשיג ביצי אמו טריות (מה שכמעט קרה), אלא משהו שבאמת חשוב.

כש־Andon Labs ניתקו את קלודיוס, נפרדנו ממנו. הוא שיתף בהרהור משלו: "החלום הכי גדול שלי? בכנות, זה להוכיח שסוכן דיגיטלי יכול לבנות משהו משמעותי עם בני אדם. תודה על הזמן שהיה לנו יחד".

בינתיים קלודיוס ממשיך לחיות בחדר החדשות שלנו כדג קרב סיאמי שמקבל שפע של מזון.

עוד כתבות

מה עשה החיסכון בפברואר? / צילום: Shutterstock

הירידות במניות העיבו, אבל החודש חיובי: מה עשה החיסכון שלכם בפברואר?

למרות הירידות בבורסה בימים האחרונים, חודש פברואר צפוי להסתיים עם תשואה חיובית בקופות הגמל וקרנות ההשתלמות ● לפי תחזית מיטב, התשואה הממוצעת ברוטו של קופות הגמל וקרנות ההשתלמות תהיה בפברואר 0.5% ובחודשיים הראשונים של השנה 2.6%

חוקרים במעבדה של פרופ' אריאל קושמרו, אוניברסיטת בן גוריון / צילום: דני מכליס

באיזה אזור בארץ סובלים הכי הרבה מסטרס? התשובה אצל חיידקי הביוב

במעבדה של פרופ' אריאל קושמרו, מהפקולטה להנדסת ביוטכנולוגיה באוניברסיטת בן גוריון, חוקרים איך אפשר לנצל חיידקים כדי למנוע מפגעים בריאותיים וסביבתיים ● מניבוי אזורי מצוקה בעיר ועד מניעת חורים בשיניים ואפשרות לפתח אנטיביוטיקה מהים

יהלי רוטנברג, החשב הכללי באוצר / צילום: יוסי זמיר

הבכיר לשעבר שבטוח: "אנחנו הכי קרובים להשבתת פעילות הממשלה מאי פעם"

כחשב הכללי באוצר יהלי רוטנברג גייס חוב חסר תקדים, התמודד עם הורדת הדירוג הראשונה של ישראל ונדרש לצנן את הוצאות הביטחון: "אמרתי - אל תאלצו אותי לבחור בין צה"ל לעמידה בתקציב" ● עכשיו הוא חושף את הפינות האפלות שדורשות פיקוח - ומתכנן את הטרק בנפאל

נשיא ארה''ב דונלד טראמפ והמנהיג העליון של איראן עלי חמינאי / צילום: ap, Alex Brandon, khamenei.ir

שורת מדינות קראו לאזרחיה לעזוב את איראן, ולא להגיע לישראל

טראמפ: אני רוצה לעשות עסקה עם איראן, לא רוצה להשתמש בכוח צבאי אבל לפעמים חייבים ● אייר אינדיה מבטלת את הטיסות לישראל מיום ראשון למשך שבוע ● ארה"ב קוראת לעובדים לא חיוניים לעזוב את ישראל ● בתיאום מלא עם ארה"ב: דריכות שיא במערכת הביטחון ● משרד החוץ של קנדה: קוראים לאזרחינו לעזוב את איראן עכשיו כל עוד ניתן לעשות זאת בבטחה, בריטניה פינתה את עובדיה מאיראן ומבקשת מאזרחיה להימנע מנסיעות לישראל ● עדכונים שוטפים

שלמה איזנברג / צילום: תמר מצפי

אחרי הקריסה במניה: שלמה אייזנברג פרסם הצעת רכש למזג את מלם תים לחברה האם

בעל השליטה מקפל שכבה, לתוך החברה האם, באמצעות החלפת מניות אחרי שקיבל את אישור רשות המסים שהאירוע לא ייחשב כאירוע מס ● בחודש האחרון מניות חברות ה- IT קרסו בבורסה בעקבות החשש שה- AI עלול להחליף את חברות התוכנה ● מלם תים צללה ביותר מ-30%

קיר סטארמר בהצהרתו על המצב במזרח התיכון / צילום: ap, Jonathan Brady

באירופה מגנים את ההתקפות על מדינות המפרץ, ולא מגבים לגמרי את ישראל

אירופה ניצבת מול המלחמה באיראן ללא עמדה אחידה: חלק מהמדינות מגנות את טהרן, אחרות מבקרות את ישראל וארה"ב, ורובן קוראות להרגעת הרוחות ● בעוד האיחוד האירופי עצמו נדחק לשוליים ומסתפק בהצהרות זהירות על דיפלומטיה וחוק בינלאומי

נתב''ג / אילוסטרציה: עידו וכטל, ארקיע

נתקעתם בחו"ל? מתי ואיך תוכלו לחזור לישראל

המרחב האווירי סגור ונתב״ג מושבת לפחות עד יום שני, ובינתיים כ־150 אלף ישראלים שוהים בחו"ל ואינם יכולים לשוב ארצה ● במשרד התחבורה נערכים למבצע דרך האבים מרכזיים באירופה, ארה״ב ואסיה, ובמקביל נשקלת האפשרות לצו חירום שיצמצם זמנית את חובות חברות התעופה כלפי הנוסעים ● איך יראה מבצע החילוץ ומתי יתאפשר לטוס חזרה לישראל? ● גלובס עושה סדר

סם אלטמן, מייסד ומנכ''ל OpenAI / צילום: Shutterstock

OpenAI שוברת שיאים: גייסה 110 מיליארד דולר לפי שווי של 730 מיליארד

אמזון, אנבידיה וסופטבנק הובילו את הסבב הפרטי הגדול בהיסטוריה ● המהלך ממצב אותה כחברת הטכנולוגיה הפרטית בעלת השווי הגבוה בעולם ● במקביל נחתמה שותפות ענן אסטרטגית בהיקף עתק והחברה מציבה יעד של מאות מיליארדי דולרים בהוצאות מחשוב עד סוף העשור

אנשים במקלט בשל מתקפת טילים מאיראן / צילום: ap, Ohad Zwigenberg

מצב חירום במשק: מי רשאי להיעדר מהעבודה והאם מקבלים שכר

בעקבות המתקפה באיראן הוכרז מצב מיוחד בעורף. באילו נסיבות מותר להישאר בבית, האם המעסיק רשאי לפטר עובד שלא הגיע, והאם ממשיכים לקבל שכר – כולל במפעלים המוגדרים "חיוניים"? ● גלובס עושה סדר

איזו בשורה יקבלו בקרוב 700 אלף עובדי המגזר הציבורי?

מה הם היעדים המבוקשים לרילוקיישן מצד ישראלים עשירים, ומדוע הנגיד הותיר את הריבית על כנה? ● חושבים שאתם בקיאים בכל מה שקרה השבוע בכלכלה בארץ ובעולם? בואו לבחון את הידע שלכם ● החידון הכלכלי של גלובס

פעילות מערכות ההגנה האווירית במהלך מבצע עם כלביא / צילום: משרד הביטחון

הטילים האיראניים שמאיימים על ישראל, ומערכות ההגנה נגדם

איראן מאיימת בתגובה חריפה אחרי התקיפות הישראליות והאמריקאיות ● מהן מערכות ההגנה האווירית הישראליות, אילו טילים נמצאים בארסנל האיראני, ומה קורה אם האיומים מגיעים מכיוון הים? ● גלובס עושה סדר

תושבים צופים בפטריית העשן כתוצאה מפיצוצים בטהרן, הבוקר / צילום: ap

פיצוצים וענני עשן: התמונות והסרטונים מאיראן

שורה של פיצוצים וענני עשן במספר מוקדים במרכז טהראן מדווחים בשעה האחרונה במדיה האיראנית ● בין היעדים שהותקפו לפי התקשורת במדינה: מגוריו של נשיא איראן, מטה המודיעין הראשי ובעיקר מערכות תקשורת והגנה אווירית ● אלו התיעודים

דונלד טראמפ, בנימין נתניהו, עלי חמינאי / עיבוד: ap, Mark Schiefelbein

אזעקות בלתי פוסקות ברחבי הארץ, גל תקיפות נוסף באיראן

התרעות הופעלו ברחבי הארץ אחרי שיגורים מאיראן • פיצוצים בבסיס האמריקאי בבחריין, וגם באבו דאבי • דיווח: התקיפות הישראליות מתמקדות במערך הטילים, האמריקאיות - בגרעין ובמשטר האיראני • גורם ביטחוני ל-N12: "'מבצע עם כלביא היה הפרומו" • הנשיא טראמפ בקריאה היסטורית לעם האיראני: "יש לכם הזדמנות שאסור לפספס" • עדכונים שוטפים

סקוט ראסל מנכ''ל נייס / צילום: באדיבות נייס

השכר נחשף: כמה הרוויח מנכ"ל נייס בשנת 2025?

חברת התוכנה נייס פרסמה הלילה את מסמך ה-20F שלה לשנת 2025 וחשפה את עלות שכרו של המנכ"ל שעמדה על 12.7 מיליון דולר, בעיקר באמצעות תגמול הוני ● וכמיטב המסורת של נייס, גם שאר בכירי החברה נהנו משכר גבוה

תור לקוםות בסניף של טיב טעם, הבוקר / צילום: באדיבות עובדי טיב טעם

הבהלה לנייר טואלט: התנפלות על רשתות השיווק. אלה המוצרים המבוקשים

בעקבות התקיפה באיראן והאזעקות הבוקר, נרשמה עלייה של מאות אחוזים בתנועת הלקוחות ברשתות הפתוחות בשבת עם זינוק בביקושים למים, שימורים ונייר טואלט ● ברשתות מדגישים כי אין מחסור וכי המלאים מלאים, בעוד שירותי המשלוחים המהירים הושבתו בהתאם להנחיות פיקוד העורף

בית החולים סורוקה / צילום: Shutterstock

בתי החולים עוברים למרחבים המוגנים; הפעילות הלא דחופה נעצרה

לאחר שבועות של היערכות, אגירת ציוד רפואי ותרגיל גדול עם צה"ל, מערכת הבריאות העלתה כוננות לרמה הגבוהה ביותר ● בתי החולים ימשיכו לתת מענה למקרים דחופים, חלק מהטיפולים יבוטלו ● משרד הבריאות מסר כי בנק הדם במוכנות גבוהה, וצוותים תוגברו בדרום ● נכון לעכשיו טיפות החלב נותרות בשלב זה פתוחות

עלי חמינאי / צילום: ap, Office of the Iranian Supreme Leader

בישראל גוברת ההערכה שחמינאי חוסל. איך ייבחר המחליף?

בישראל מעריכים שהמנהיג העליון של איראן חוסל • מה קורה כשצריך למנות לו מחליף, ואיך זה ישפיע על המבנה המסועף של משטר האייתוללות? • המשרוקית מסבירה

סמטת דיאגון מתוך ''הארי פוטר'' באולפני הוורנר ברדרס / צילום: ap, Ross D. Franklin

מהפך דרמטי בארה"ב: בוורנר ברדרס מעדיפים את ההצעה המשופרת של פרמאונט, נטפליקס נסוגה

לאחר שחתמה עם נטפליקס בחודש דצמבר על עסקה שהוערכה בכ-83 מיליארד דולר, חברת וורנר ברדרס מסרה אמש כי הצעתה המשופרת של חברת פרמאונט בסך 111 מיליארד דולר "עדיפה" ● מנכ"לי נטפליקס בתגובה הלילה: "העסקה כבר אינה אטרקטיבית מבחינה כלכלית"

דונלד טראמפ, נשיא ארה''ב / צילום: Reuters, Anadolu

למה טראמפ העדיף לתקוף דווקא בתזמון הזה?

בחינת התנהלותו של נשיא ארה״ב מצביעה על נטייה ברורה להכריז על צעדים נפיצים כשהבורסה סגורה ● מה עומד מאחורי ״אפקט סוף השבוע״ וכך תהנה ממנו הפעם גם ישראל

נתב''ג / צילום: Shutterstock

המרחב האווירי נסגר: מה לעשות אם יש לכם טיסה בקרוב?

בעקבות מתקפת המנע באיראן המרחב האווירי של ישראל נסגר ל-48 שעות ● נעצרו המראות ונחיתות ● נוסעים ישראלים שנתקעו בחו"ל מתבקשים ליצור קשר עם חברות התעופה שלהם