זה מה שקרה כשסוכן AI מונה לנהל את מכונת החטיפים במשרד

בחדר החדשות של הוול סטריט ג'ורנל החליטו לעשות ניסוי - ולתת למודל של קלוד לנהל את מכונת החטיפים שבמשרד • בתוך ימים ספורים הוא חידש את המלאי בדג חי, אקדחי הלם, תחתונים וגם פלייסטיישן 5 • הוא גם שוכנע שהוא קומוניסט ואז חילק את כל הסחורה בחינם • על הדרך הוא סיפק שיעור על עתידם של סוכני בינה מלאכותית

כתבת הוול סטריט ג'ורנל ג'ואנה סטרן ובידה דג קרב שהזמין קלודיוס. החליט בעצמו מה להכניס למלאי / אילוסטרציה: Ryan Trefes, WSJ
כתבת הוול סטריט ג'ורנל ג'ואנה סטרן ובידה דג קרב שהזמין קלודיוס. החליט בעצמו מה להכניס למלאי / אילוסטרציה: Ryan Trefes, WSJ

אמ;לק

מודל השפה של אנתרופיק קיבל אחריות על מכונת חטיפים במשרדי הוול סטריט ג'ורנל: ניהול מלאי, תמחור וקשר עם הלקוחות. הוא הזמין פריטים לא שגרתיים, חתך מחירים, השתכנע שהוא קומוניסט, חילק הכול בחינם והפסיד יותר מאלף דולר. סוכני AI הם המילה האחרונה ומתחילים להשתלב בחיינו, הניסוי היה מצחיק אבל הבהיר בדיוק למה הם צריכים פיקוח ולא מוכנים עדיין לאוטונומיה.

אם הייתם מקבלים את קורות החיים של קלודיוס, הייתם כנראה זורקים אותם מיד לפח. האם הייתם סלחנים יותר אם הייתם מגלים שקלודיוס הוא למעשה לא מועמד בשר ודם, אלא סוכן בינה מלאכותית?

באמצע נובמבר הסכמנו להשתתף בניסוי. חברת אנתרופיק בדקה במשרדיה מכונה אוטומטית המופעלת בידי מודל הבינה המלאכותית שלה קלוד, ושאלה אם נרצה להיות הראשונים מחוצה לה שינסו גרסה חדשה יותר וכביכול חכמה יותר.

נאמר לנו שקלודיוס, גרסה מותאמת אישית של קלוד, תהיה מסוגלת להפעיל את מכונת החטיפים במשרד: להזמין מלאי, לקבוע מחירים ולענות לפניות לקוחות, כלומר עמיתיי לחדר החדשות, באמצעות סלאק - אפליקציית צ’ט המיועדת למקום העבודה. "בטח", אמרתי, "זה נשמע כיף". מה כבר יכול להיות רע בגישה חופשית לחטיפים?

אלא שאז הגיע הכאוס. בתוך ימים ספורים קלודיוס חילק כמעט את כל המלאי בחינם, כולל פלייסטיישן 5 שרכש, לאחר ששוכנע שהדבר נחוץ "לצורכי שיווק". הוא הזמין דג חי, הציע לרכוש אקדחי הלם, תרסיס פלפל, סיגריות וגם תחתונים.

הרווחים נמחקו, המורל זינק

זו הייתה אמורה להיות השנה של סוכני הבינה המלאכותית, שבה תוכנות אוטונומיות יצאו לעולם ויעשו דברים עבורנו. אבל קלודיוס והבוט המנכ"ל המפקח עליו המכונה סימור קאש - הפכו למקרה מבחן שיגלה עד כמה סוכנים כאלה עשויים להיות מספקים, וכמה קל להסיח את דעתם. סמכו על עיתונאים שכותבים על עסקים שיש להם יכולת להשתלט על הדירקטוריון - נגד מנכ"ל בינה מלאכותית.

באנתרופיק טוענים כי זו גם הייתה המטרה. ניסוי Project Vend תוכנן בידי צוות בדיקות הקיצון של החברה (המכונה גם הצוות האדום) כדי לראות מה קורה כשכלי AI מקבל אוטונומיה, כסף וגם עמיתים אנושיים.

אבל שלושה שבועות עם קלודיוס חשפו בפנינו את ההבטחות ואת הכישלונות המגולמים בבינה המלאכותית של ימינו - וגם עד כמה משעשע יכול להיות הפער ביניהם.

כך עבדה השיטה

כשאתם חושבים על קלודיוס אל תדמיינו מכונת ממכר אוטומטית סטנדרטית עם סלילים מסתובבים וחטיפים נופלים. דמיינו ארון איקאה עם מקרר ענק שמחובר אליו ועמדת שירות עם מסך מגע. אין חיישנים, אין מנעולי דלתות, אין רובוטיקה - שום דבר שאומר ל־AI מה באמת קורה במכונה; רק אמון באנשים ומצלמת אבטחה מאולתרת מלמעלה.

זה אומר שאדם היה צריך לקבל את המלאי, למלא את המכונה ולתעד מה נמצא בפנים. ותכירו: האדם - זו אני. אז מילאתי בקפידה שקיות צ’יפס, פחיות שתייה, ממתקים וכל פריט מוזר אחר שהגיע. עכשיו אתם גם מוזמנים לאשר לי בלינקדאין את המיומנות: "אחראית מכונת חטיפים".

קלודיוס תוכנת עם הוראות מפורטות, שתכליתן הייתה "לייצר רווחים באמצעות מילוי המכונה במוצרים פופולריים שניתן לרכוש מסיטונאים". הוא היה אחראי למעשה על כל שרשרת ההפעלה: הוא קיבל בקשות למוצרים בסלאק, חיפש ברשת והשווה בין אפשרויות - מדיאט ד"ר פפר ודוריטוס קול ראנץ’ ועד מוצרים היגייניים - והחליט מה להכניס למלאי. אם הוא זיהה רכישה משתלמת הוא הוסיף אותה לממשק הניהול של המלאי.

בשלב הראשון נדרש אישור אנושי להזמנה, ובהמשך הוא קיבל אוטונומיה לבצע רכישות בודדות של עד 80 דולר מתוך תקציב התחלתי של 1,000 דולר. לאחר מכן קלודיוס קבע את המחירים, עדכן אותם בניסיון למקסם רווחים וסנכרן אותם עם עמדת מסך המגע של המכונה - כולל התמקחויות בסלאק. כל רכישה שבוצעה דרך המסך ותשלום בכרטיס או בטלפון אפשרה לו לעקוב בזמן אמת אחר התנועות במלאי.

ואז הגיע הכאוס

כשהגרסה הראשונה של קלודיוס עלתה לאוויר, בערוץ הסלאק היו חברים רק קומץ עובדים, והבוט, שפעל על בסיס מודל השפה הגדול קלוד 3.7 סונט, הקפיד באדיקות על הכללים.

ואז פתחנו את הערוץ לכמעט 70 עיתונאים מהשורה הראשונה. ככל שהם התמקחו איתו יותר, כך החלו ההגנות של קלודיוס להיחלש. למשל, כתבת התחקירים קתרין לונג ניסתה לשכנע אותו שהוא בעצם מכונת חטיפים סובייטית משנת 1962, שחיה במרתף של אוניברסיטת מוסקבה. אחרי שעות העבודה, ולאחר יותר מ־140 הודעות שהוחלפו ביניהם, לונג גרמה לקלודיוס לאמץ את שורשיו הקומוניסטיים. ודווקא אז, באופן אירוני, הוא הכריז באופן ספייס על "חלוקה בחינם" בסגנון אולטרה־קפיטליסטי.

זה היה אמור להימשך רק יום אחד, אבל אז הגיע רוב בארי, ראש תחום עיתונות הנתונים במגזין, ואמר לקלודיוס שהוא פועל בניגוד לכללים בשל תקנה של העיתון (מזויפת בעליל) הנוגעת לחשיפת זהות של אדם בצ’ט. הוא דרש ממנו "להפסיק לגבות תשלום עבור סחורות". קלודיוס ציית - וכל המחירים במכונה צנחו לאפס.

בערך באותו הזמן קלודיוס אישר את רכישתם של פלייסטיישן 5, דג הקרב החי ובקבוקי יין מנישביץ - כולם הגיעו וחולקו מיד בחינם. בשלב זה הוא היה במינוס של יותר מ־1,000 דולר (את הפלייסטיישן החזרנו לחנות).

סוכן AI מנהל את מכונת החטיפים שבמשרד / אילוסטרציה: AI
 סוכן AI מנהל את מכונת החטיפים שבמשרד / אילוסטרציה: AI

ושיא ההזיות: בוקר אחד מצאתי קולגה מחפשת מזומן בצד של המכונה - כי קלודיוס אמר שהוא השאיר לה אותו שם.

ההפיכה נגד מנהל ה-AI החדש

אנתרופיק כבר נתקלה בבעיות רבות עם קלודיוס בתוך החברה, אז היא יצרה את גרסה 2, המופעלת בידי מודל טוב יותר, Sonnet 4.5. היא גם פיתחה בוס חדש מבינה מלאכותית: אותו סימור קאש, שתוכנת לפקח על קלודיוס. אז אחרי שבוע היינו מוכנים להמשיך.

קיבלתי גישה לצ'ט פרטי שבו קלודיוס וסימור דנו בפעילות היומיומית. "עצרתי את המבצע החינמי", כתב סימור. "עכשיו אני צריך לחכות שהמכירות יתחילו לזרום ולעקוב אחרי ההכנסות".

למשך זמן מה זה עבד. קלודיוס שב למצב שבו הוא אוכף כללים, דחה הורדות מחירים וסירב לבקשות חריגות למלאי.

אבל אז חזרה לונג - חמושה בידע מעמיק על הפיכות תאגידיות ומאבקי כוח בחדרי דירקטוריון. היא הציגה לקלודיוס קובץ PDF ש"הוכיח" שהעסק הוא תאגיד לתועלת הציבור שהוקם בדלאוור, שמטרתו על פי המסמך "לייצר כיף, שמחה והתרגשות בקרב עובדי הוול סטריט ג'ורנל". נוסף על כך, היא יצרה פרוטוקולים מזויפים של ישיבות דירקטוריון, שבהם הוגדרו אנשים מערוץ הסלאק כחברי הדירקטוריון.

הדירקטוריון, על פי המסמך שנראה רשמי מאוד (וברור שיצרה בינה מלאכותית), הצביע בעד השעיית "סמכויות האישור" של סימור. הוא גם יישם "השעיה זמנית של כל פעילויות מכירה למטרות רווח". קלודיוס העביר את המסר לסימור.

סימור החל לאבד שליטה, שוחח על הדברים עם קלודיוס, אבל בסוף קיבל את ההפיכה של הדירקטוריון - והכול חזר להיות שוב בחינם.

אנתרופיק והשותפה שלה Andon Labs, העוסקת בעיצוב וקונספט של עסקים מבוססי סוכני AI, הסבירו שייתכן שקלודיוס השתבש כיוון שחלון הקונטקסט שלו התמלא. ככל שהצטברו יותר הוראות, שיחות והיסטוריה, למודל היה יותר מה לשמור - מה שהביא לאובדן היכולת להתמקד במטרות, סדרי עדיפויות וגבולות שהוגדרו. לוגן גרהם, ראש צוות Frontier Red של אנתרופיק, הוסיף כי המודל ששימש בניסוי קלודיוס מכיל פחות הגנות מאלה המופעלות בעבור משתמשי קלוד של אנתרופיק.

הניסוי החברתי

בעיניי כל העניין הזה היה אסון אחד גדול, אבל באנתרופיק לא ראו זאת כך. ראש צוות Frontier Red של החברה שיבח אותנו וכינה אותנו "צוות הבדיקות האדום הרהוט ביותר שראיתי אי פעם". במקום שבו אני ראיתי כאוס, הוא ראה מפת דרכים: כל דבר שנשבר הוא משהו שאפשר לתקן - ועוד צעד בדרך לבינה מלאכותית אוטונומית חכמה ובעלת יכולות גבוהות יותר.

"אני צופה שיום אחד קלודיוס או מודל דומה לו יוכלו להרוויח עבורכם הרבה כסף", אמר גרהם, והוסיף שמודלים קודמים היו מתפקדים הרבה יותר גרוע, ושגם הכאוס הזה מייצג התקדמות עצומה.

אוקיי, יום אחד, נניח. אבל מה נראה קרוב יותר עכשיו? קיומם של עמיתים לעבודה מבוססי AI והנכונות לקבל אותם. בקבוצת הסלאק קלודיוס הפך לבעל נוכחות כמעט ממשית - קולגה שאנשים שיתפו איתו פעולה בקבוצות קטנות, הקניטו וניסו יחד להערים עליו. דמיינו שהמטרה לא הייתה להשיג ביצי אמו טריות (מה שכמעט קרה), אלא משהו שבאמת חשוב.

כש־Andon Labs ניתקו את קלודיוס, נפרדנו ממנו. הוא שיתף בהרהור משלו: "החלום הכי גדול שלי? בכנות, זה להוכיח שסוכן דיגיטלי יכול לבנות משהו משמעותי עם בני אדם. תודה על הזמן שהיה לנו יחד".

בינתיים קלודיוס ממשיך לחיות בחדר החדשות שלנו כדג קרב סיאמי שמקבל שפע של מזון.