הבינה המלאכותית של IBM התווכחה עם הישראלים

"אנחנו מתחילים לתרגם את החזון של המדע הבדיוני למציאות", כך הציגה ד"ר איה סופר, סגנית נשיאה עולמית למחקר טכנולוגיית בינה מלאכותית ב-IBM, את ה-Debater (המתדיין) - מערכת לניהול דיונים אינטליגנטים שביצועיה הופגנו במופע "חי" • מערכת הבינה המלאכותית התמודדה בשני סבבי דיונים מול מתדיינים אנושיים מקצועיים • האירוע התקיים במעבדה הרב-תחומית לפיתוח תוכנה ומחקר בגבעתיים והיחיד שהתקיים מחוץ לגבולות ארה"ב

הדגמת Project Debater / צילום: אור קפלן
הדגמת Project Debater / צילום: אור קפלן

"כשהתחלנו את הפרויקט, זה היה נראה כמו מדע בדיוני. היה צוות חוקרים שמסוגל להוציא את המדע בדיוני הזה לפועל, וכך התחלנו אותו לפני כשש שנים. ואכן החוקרים, כפי שתראו, מתחילים לתרגם את החזון של המדע בדיוני למציאות. הפעילות הזאת היא חלק מפעילות נרחבת בבינה מלאכותית והבנת שפה טבעית וביכולת הזאת טמון הרבה פוטנציאל לעשייה חיובית. ככל שנוכל להרגיש ולהבין אותה, וככל שהיא תהיה שקופה יותר ונבטח בה, כך נוכל להיעזר בה כדי לקבל החלטות. זו התקווה שמאחורי הטכנולוגיה".

במילים אלה הציגה היום ד"ר איה סופר, סגנית נשיאה עולמית למחקר טכנולוגיית בינה מלאכותית ב-IBM את ה-Debater (המתדיין) - מערכת בינה מלאכותית לניהול דיונים שביצועיה הופגנו במופע חי שנערך בפני עיתונאים. האירוע נערך במעבדה הרב-תחומית לפיתוח תוכנה ומחקר של החברה בגבעתיים והיה היחיד שהתקיים מחוץ לגבולות ארה"ב.

זה מול זה הועמדו שני מתמודדים - מצד אחד מכונת הדיבייטר של יבמ, ומצד שני מתדיינים אנושיים מקצועיים שניהלו דיון בנושאים מורכבים ושנויים במחלוקת במתכונת ה"דיבייט". כל צד קיבל 4 דקות לשטוח את טענותיו לאחר מכן כל צד הגיב לדברי הפתיחה של הצד השני ולבסוף כל אחד מהצדדים סיכם את הדיון.

הדיון הראשון עסק בשאלה האם יש לאפשר את קיומן של מערכות של מצלמות מעקב אחר אזרחים במרחב הציבורי ואילו הדיון השני עסק בשאלה האם יש לאפשר שימוש בטכנולוגיות השבחה גנטית. בשאלה הראשונה, על מצלמות המעקב, הציגה המכונה את עמדתה המתנגדת, ואילו תמכה בהשבחה גנטית בדיון העוקב.

אף על פי שברקע לא נשמעו תופים וחצוצרות, וסמליל של יבמ לא התעופף על מסך אדום, ההישג שהוצג בפנינו היה לא פחות מדרמטי. בניגוד לתצוגות תכלית ידועות מהעבר בהן מחשבים ניצחו שחקנים אנושיים במשחקים כמו שחמט או גו, בדיבייט האתגר שונה ומורכב הרבה יותר, ומייצג שלב חדש באתגר שמציב האדם למכונה.

לדברי נועם סלונים, המשמש מדען עיבוד שפה טבעית ובינה מלאכותית במרכז המחקר של יבמ בחיפה והיוזם והחוקר הראשי של פרויקט הדיבייטר, אנחנו נמצאים כעת "בתחילתו של מסע בתוך טריטוריה שבה בני אדם יותר טובים, כי במשחקי לוח המחשבים כבר יותר טובים".

סלונים הסביר כי ההבדל בין האתגרים הוא שבמשחקים "התשובה נתונה כי יודעים מה הציון לכל מצב בלוח, ואז אפשר להשתמש בלמידה עמוקה כדי לתת למכונה לשחק מיליוני פעמים, ומתוך זה להשתפר, אך לעומת זאת בדיבייט הדבר זה לא מתקיים כי אי אפשר לשפוט אוטומטית מה קורה בו".

זאת מדוע? על פי יבמ, "חוקי הדיבייט נולדו מתוך התרבות האנושית הנוגעת לדיונים ושיחות, והם אינם שרירותיים כמו החוקים של משחקי קופסה. במסגרת דיבייט, מערכת הבינה המלאכותית אינה יכולה להשתמש בטקטיקות שאינן מובנות לבני אדם, אלא נדרשת להציג בזמן אמת קווי טיעונים אחריהם מסוגלים בני אדם לעקוב.

שנית, בניגוד לאתגרי בינה מלאכותית בעבר, הנוגעים למשחקים, אין מטרה אינהרנטית ואובייקטיבית שעליה יכולה מערכת הבינה המלאכותית להסתמך. ערכו של כל טיעון הוא לעתים קרובות סובייקטיבי, ואין אפילו שיטת מדידה מוסכמת לקביעת ה'מנצח'. הקלט אותו מקבלת המערכת כולל אך ורק את השאלה סביבה ייסוב הדיון.

המערכת סורקת מיליארדי משפטים ממאגרי מאמרים מקצועיים על מנת לייצר ולהציג עמדה קוהרנטית ומשכנעת אודות הנושא. לאחר מכן, היא מאזינה לנאום הפתיחה של הצד השני ויוצרת נאום תגובה מתאים - תוך הצגת יכולות דיון שהן מעבר ליכולת של כל מערכת בינה מלאכותית אחרת. לבסוף, המערכת מסכמת את טיעוניה בנאום שלישי תמציתי".

באתגר הזה עמדה המערכת באופן מרשים ביותר. כה מרשים עד שבדיון שנערך לאחר הדיבייט בין החוקרים והעיתונאים, המערכת נשפטה על פי איכות הטיעונים, הרלוונטיות והזרימה שלהם, כמעט כאילו היתה מתחרה אנושי. יותר מכך, המערכת קיבלה מהקהל ציונים מעולים במיוחד לנוכח העובדה שמארגני הדיבייט לא הקלו עליה.

מן העבר השני היא הציבה מולה מתדיינים משכמם ומעלה. אחד המתדיינים היה יער בך, בן ה-28, בוגר פילוסופיה מדעי המדינה וכלכלה מאוניברסיטת תל-אביב, קצין ביחידת 8200, בעל ניסיון של 5 שנים באמנות הדיבייט וראש אגודת הדיבייט של המרכז הבינתחומי הרצליה.

הציון שהעניק הקהל למכונת הדיבייטר היה מכובד לכל הדעות: לשאלה מי הצטיין יותר באופן ההגשה של התכנים זכתה מערכת הדיבייטר רק בקול אחד אולם 6 מהמשיבים טענו כי שני המשתתפים הגישו את התכנים באופן דומה. 6 הצביעו בעד המשתתף האנושי.

בתשובה לשאלה מי העשיר את הידע שלהם יותר, קיבל הדיבייטר 2 קולות, 3 אמרו כי האנושי והמכונה העשירו באותה מידה ואילו 8 הצביעו בעד המשתתף האנושי.

אף על פי שעל פי הודאת אנשי יבמ, מפגן הביצועים של מערכת הבינה המלאכותית שנערך בישראל היה מרשים פחות מזה שנערך בארה"ב, עדיין קשה היה להתעלם מהתחושה שמצד אחד העתיד כבר כאן, אך בד בבד אנו מקבלים זאת כמעט בשוויון נפש.

אולי הסיבה היחידה שלא נשמעו קריאות התפעלות מהקהל היתה לא מפני שהיכולות שהופגנו לא היו מרשימות - אלא משום שהם היו כה מרשימות עד שהמכונה נשפטה כאדם. ומכיוון שהמכונה הציגה ביצועים נחותים מזה שהציג האדם, רושם זה האפיל על העובדה שמכונה הצליחה לקיים דיבייט קוהרנטי, מעניין, מעשיר, כמעט ללא טעויות מורגשות, מול אדם סופר אינטליגנטי ומנוסה - ולא להיות מובס על ידו שוק על ירך.

מדובר בהישג כה מרשים עד שאת התגובה היחסית אדישה אליו אפשר להסביר רק בכך שהתרגלנו לראות מערכות דומות או טובות ממנה בסרטי מדע בידיוני כמו HER או בסדרה פחמן משודרג.