הדור הבא של הבינה המלאכותית: אני חושב, משמע אני רובוט

סירי והמשקפיים של גוגל הם רק ההתחלה: ממחשבים שמחפשים חתולים ביוטיוב ועד רובוטים שיכולים ליהנות ממוזיקה - מה הם החידושים האחרונים בתחום הבינה המלאכותית , ואיך זה ישפיע על החיים של כולנו

ביום לוהט אחד לפני כחודשיים, מעט אחרי ארוחת הצהריים בקפיטריה של המרכז הבינתחומי בהרצליה, הוציא ד"ר גיא הופמן את טראוויס ממזוודה מרופדת והניח אותו על שולחן ישיבות ארוך. הופמן, שעומד יחד עם ד"ר אורן צוקרמן בראש המעבדה לחדשנות ומדיה בבית הספר לתקשורת שפועל במרכז האקדמי, רצה לבחון כיצד בני אדם מתנהגים במחיצתו של הרובוט שבנה. במבט ראשון טראוויס נראה כמו צעצוע משוכלל - רובוט חמוד שיודע לזוז ולרקוד על השולחן לפי קצב המוזיקה שמנגנים בסמארטפון שמחברים אליו.

אלא שטראוויס הוא הרבה יותר מזה, כי לגוץ הלבנבן עם אוזני הרמקולים יש מוח, ואפילו שכל. מספיק שתחברו אל טראוויס את הסמארטפון ותתופפו מקצב כלשהו על השולחן והוא ייכנס לפעולה: האלגוריתמים שרצים על המעבדים שלו יזהו את הדפיקות, ובתוך שבריר שנייה יבחרו את השיר בעל המקצב הדומה להם ביותר מספריית המוזיקה שעל הסמארטפון, ויתחילו לנגן אותו.

מכשירים כמו טראוויס, שמבינים אינטראקציות אנושיות ומגיבים אליהן בדרכם הכמעט אנושית, ייצאו בשנה-שנתיים הקרובות ממעבדות פיתוח באוניברסיטאות וינחתו על מדפי חנויות ברחבי העולם. בניגוד לאייבו, הכלב הרובוטי שפיתחה סוני לפני 13 שנים, המוצרים החדשים הללו - שהבולט שבהם הוא זוג המשקפיים החכמים של גוגל - יתבססו על אינטליגנציה מלאכותית גבוהה בהרבה, יכוונו אל ההמונים ויתומחרו בהתאם. כך שאם הכול יתקדם לפי התוכנית, מתישהו בשנה הקרובה אמור טראוויס להפוך למוצר מסחרי - מתנה גיקית אידיאלית לעונת חגי דצמבר 2013.

טראוויס אינו הרובוט הראשון של הופמן. המנורה הכסופה שהוא יצר במסגרת הדוקטורט שלו ב-MIT לפני חמש שנים הייתה סימן ראשון ליעד שאליו הוא שואף להגיע. המראה של המנורה מטעה. הברק, הצירים הרבים והצמצמים הצבעוניים שלה אמנם שידרו רושם של מכשיר שנמצא בחזית הטכנולוגיה, אולם רק כשהיא נכנסה לפעולה מול שותף אנושי ניתן היה להבין שהיא לא סתם מנורה יפה, אלא רובוט משוכלל: החיישנים שהופמן התקין בגוף המנורה יודעים לעקוב אחר תנועותיו של אדם בחלל החדר וללוות אותו באור הנכון ביותר. אם תעמדו עם מקדחה ליד קיר שנמצא בחדר חשוך, המנורה תזהה את תנועת ידיכם על-גביו ותמקד בו את האור כדי להקל עליכם את מלאכת הקדיחה; אם תשבו על כיסא ותרצו לכתוב משהו על פיסת נייר, היא תתמקד בו כדי לסייע לכם לכתוב.

הופמן (גילוי נאות: מדובר בחבר קרוב של כותב שורות אלה) מרותק כבר שנים לאינטראקציות המורכבות שבין בני אדם למכונות ועסוק בניסיונות לגרום לרובוטים לגרום לאנשים להרגיש נוח במחיצתם, אבל הוא אינו מסתפק בכך. המחקר שלו אינו מנסה לייעל תהליכים או לבצע באמצעות רובוטים משימות שבני אדם אינם מעוניינים לבצע, אלא הולך על הגביע הקדוש עצמו: הופמן רוצה שהרובוטים שלו יבצעו פעולות שכל מהותן הוא האנושיות שבהן. משום כך, המנורה הרובוטית שלו לא רק האירה חללים ומשטחים ועקבה אחר תנועותיו במעבדת המדיה בקיימברידג' שבמסצ'וסטס, אלא קיבלה על עצמה משימה גדולה בהרבה: בקיץ של 2007 היא גילמה דמות בהצגת התיאטרון הראשונה אי-פעם שבה השתתף רובוט כשחקן.

כמה חודשים לאחר מכן, כשהופמן היה בחופשה בישראל, הוא עבד במשך שבועות אחדים כטבח מן השורה במטבח של "נועה", הביסטרו של השף ניר צוק ביפו. הופמן עצמו אמנם חובב בישול, אבל הניסיון שהוא רצה לרכוש אצל צוק נועד לסייע לו להבין אם יוכל לבנות רובוט שמבצע פעולה מורכבת ורבת תשוקה כמו בישול עילי. אחרי כמה שבועות בין הסירים והמחבתות הופמן הגיע למסקנה שלעת עתה המשימה גדולה עליו ועל הטכנולוגיה שעומדת לרשותו. בעתיד, הוא מאמין, אפשר יהיה לעמוד במשימה.

הופמן שב לארצות הברית, הפעם לאוניברסיטת ג'ורג'יה-טק באטלנטה. שם, יחד עם ד"ר גיל ויינברג, שעומד בראש המכון למחקר מוזיקלי-טכנולוגי שאותו הקים, יצרו השניים את "שמעון", רובוט מוזיקלי בעל ארבע זרועות שניגן במרימבה (מעין קסילופון). אבל שמעון לא נועד רק ליצור רגעים קסומים מבחינה מוזיקלית, אלא גם להוסיף אליהם את האלמנטים של התנהגות אנושית: הוא יודע למשל להזיז את ראשו לפי הקצב ולהסתכל על המוזיקאים האנושיים שסביבו.

"כששמעון היה מורכב מזרועות בלבד הייתה תחושה של חוסר ודאות לגבי מה מתרחש בתוך מוחו של הרובוט", מסביר הופמן. "הראש - והדוגמה הפשוטה ביותר היא הנעת הראש לפי הקצב הפנימי של הרובוט - נותן לנגנים האחרים הרבה מידע לגבי מה הקצב שלפיו פועל הרובוט, ומאפשר להם להתכונן ולנגן באופן מורכב יותר ובאופן מתואם יותר". בנוסף, הוא אומר, "ישנו עניין ה'אישיות' שהרובוט משדר. כששמעון היה רק זרועות, האישיות שלו הייתה מוגבלת. הראש מאפשר לנו לשדר אישיות יותר מתוחכמת, דבר שגורם הן לקהל והן לנגנים אחרים להתייחס באופן שונה לנגינה שלו".

צפייה בשמעון מנגן עם בני אדם היא חוויה מפעימה לא רק בשל התנועות והמניירות האנושיות להפליא של הרובוט שעשוי ממתכת כסופה, אלא בעיקר משום שהמוזיקה שהוא מנגן נשמעת הרמונית מאוד, ובה בעת מסתורית מאוד. הבחירה לגרום לשמעון להתמחות בג'ז, ז'אנר מוזיקלי שמבוסס על אלתורים ומדגים בצורה מושלמת את הרוח האנושית, נראית לויינברג כמעט מובנת מאליה: "אנשים מוכנים לקבל את הרעיון שבתחומים מסוימים רובוט יהיה עדיף על בן אדם, כמו בבניית מכוניות או בכל סוג של אוטומציה של עבודה קשה, אבל יש תחומים שבהם קשה לנו לקבל את העובדה שרובוט יכול לסייע לנו.

התחומים האלה מבטאים את הרוח האנושית כמו שאנו מבינים אותה, ומוזיקה היא בהחלט תחום כזה. אני תוקף דווקא את התחום הזה בגלל שזה כל-כך מעניין, אבל אני לא מעוניין לחקות את הצורה שבה אנו, בני האדם, פועלים - אלא לחדש".

- איך עושים את זה?

ויינברג: "השתמשנו באלגוריתמים שהוכיחו את עצמם ככאלה שיכולים ליצור תוצאות אסתטיות מבחינה ויזואלית, כמו אלגוריתמים של פרקטלים, והבאנו אותם לעולם המוזיקלי. כשאתה עושה אנליזה של המוזיקה של בטהובן, אתה רואה זרעים מוזיקליים בסיסיים - מוטיבים או רעיונות מוזיקליים שבאמצעות מניפולציות הולכים ונבנים למשהו כמו הסימפוניה החמישית שלו. כמאזינים, מעניין אותנו לשמוע את הרעיון הזה הולך ומתפתח, והמלחין יוצר אצלנו ציפיות. לפעמים הוא עונה עליהן ולפעמים הוא מפתיע אותנו. כיום אני יכול, באמצעות אלגוריתם, ליצור רצפים שונים של בניית ציפיות ושל הפתעות".

מחשב אחרי בנאדם

בתחילת הקיץ חגג העולם המדעי ברוב הדר את יום הולדתו ה-100 של המתמטיקאי הבריטי אלן טיורינג, האיש שהניח את היסודות לתחומי מדעי המחשב והאינטליגנציה המלאכותית. גוגל הקדישה לו "דודל" יפה במיוחד, עיתונים אין-ספור בכל מקום בעולם פרסמו על-אודותיו כתבות ופרופילים, ומוזיאון המדע בלונדון פתח לכבודו תערוכה מרשימה. ולא סתם. טיורינג פיתח מבחן מהפכני כדי להגדיר מהי אינטליגנציה מלאכותית, באמצעות הצבת משתמש אנושי מול "יריב" בלתי נראה שאיתו הוא צריך לנהל שיחה. אם המשתמש האנושי אינו מצליח להכריע אם הוא משוחח עם אדם או שמא עם מחשב - משמעות הדבר היא שהמחשב עבר את המבחן האולטימטיבי לאינטליגנציה מלאכותית.

המצאת מבחן לאינטליגנציה מלאכותית היא החלק הקל בסיפור. התחום מבוסס על ההנחה שחלקי התפיסה האנושית ניתנים למדידה מדויקת מספיק עד כדי כך שמכונות יוכלו לשחזר אותם, אם רק יעמוד לרשותן כוח מחשוב חזק מספיק. כפי שמדגימים הרובוטים של ויינברג והופמן, בתחומים מסוימים המדענים הגיעו להישגים יפים. גם בלא מעט תחומים אחרים פועלים רובוטים שמבצעים עבודות אנושיות, מהרכבת מכוניות ועד תפירת מנותחים. עם זאת, כשמדובר בחיקוי התנהגויות אנושיות מורכבות יותר, כמו בתחום השפה המדוברת, שלא לדבר על היכולת לגרום למחשב לחקות את היכולת האנושית לדמיין או להשתמש באינטואיציה - מדובר באתגר מורכב בהרבה.

שלושה ימים לאחר חגיגות ה-100 לטיורינג דיווחה מחלקת המחקר של גוגל על פריצת דרך: כוחם המשולב של 16 אלף מעבדים סרק 10 מיליון תמונות מסרטוני YouTube על מנת ללמוד משהו חדש. לאחר שהמעבדים סיימו להזיע התברר שהתוכנה של גוגל למדה לזהות את תווי פניהם של חתולים בלי לדעת לפני כן מהו בכלל חתול. "המערכת למעשה המציאה לעצמה את הקונספט של חתול", אמר אחד מהחוקרים של גוגל לניו יורק טיימס.

פריצת הדרך הזו הושגה לא רק הודות לכוח המחשוב העצום (והזול יחסית) שעומד כיום לרשות מדענים, אלא גם מפני שמסדי הנתונים שעומדים לרשותם גדלים מאוד: במחקר של גוגל מוסבר ששיפור של 70% ביכולת זיהוי החתולים של המערכת הושג לאחר שהיקף המידע שעמד לרשותה זינק ב-900%. עם זאת, גם לאחר העלייה הזו, כשמפציצים את המערכת בתמונות רנדומליות, יכולת זיהוי החתולים שלה מגיעה רק ל-16% ממספרן של תמונות החתולים שבאמת נמצאות במסד הנתונים. עכשיו זה כבר נשמע מעט פחות מרשים.

ב-1991, אחרי ארבעה עשורים שבהם דנה הקהילה המדעית בדרכים לעבור את מבחן טיורינג, ארגן החוקר יו לובנר מהמרכז לחקר ההתנהגות בקיימברידג' שבמסצ'וסטס את התחרות הראשונה בתחום. הוא הציע פרס בסך 100 אלף דולרים (והרבה מאוד יוקרה) לצוות שייצור תוכנה שתצליח להתל במשתמשים אנושיים ולגרום להם לחשוב שהם מנהלים אינטראקציה עם יישות שנשמה בקרבה.

פרס לובנר כולל שלוש קטגוריות: מדליית הזהב מוענקת ליוצרי תוכנה שתצליח לבלבל יריב אנושי בדרכים ויזואליות-ווקאליות; מדליית הכסף מחולקת ליוצרי תוכנה שתצליח לבלבל יריב אנושי באופן טקסטואלי (כלומר שני הצדדים אמורים לנהל ביניהם אינטראקציה בצ'ט), ומדליית הארד ניתנת כפרס ניחומים לצוות המדענים שמצליחים ליצור תוכנה שמרשימה במיוחד את צוות השופטים, גם אם היא נחשפת על-ידי משתמשים אנושיים כישות שאינה "אחת משלנו". עד כה, במשך יותר מעשרים שנה, איש לא זכה במדליית הזהב או הכסף.

המשקפיים יחליטו בשבילך

הפרויקט המפורסם ביותר שנמצא בשלבי פיתוח מתקדמים הוא כמובן גוגל גלאס. המציאות שבה ייתקלו המשתמשים שיחבשו את המשקפיים החדשניים של גוגל תהיה מורכבת מרבדים ממוחשבים שיצטרפו למציאות הפיזית המוכרת לנו. קו הראייה שלהם ישובץ באייקונים של הודעות טקסט, מיילים, חצים שיורו להם לאן לצעוד, וגם שיחות וידיאו עם כמה חברים במקביל. כמו כן, ניתן יהיה לדבר אליהם ולקוות לקבל מהם פידבק מיידי.

בנוסף, אם המחקר ללמידה ממוחשבת שסיפק את סיפור החתולים ישיג תוצאות מרשימות יותר, יוכלו בעתיד המשקפיים לזהות חפצים שונים ולספק למשתמשים מידע על-אודותיהם. אדם שיחלוף על פניכם ברחוב עם גביע גלידה בידו יוכל לגרום למשקפיים להקפיץ מול פרצופכם הוראות הגעה לגלידריה הקרובה; טנדר שיוביל מקרר ברחוב מולכם אולי יגרום למשקפיים להזכיר לכם שאתם בעצם צריכים לתקן את הפריזר, או סתם לרכוש חלב.

בקשה לפטנט שגוגל הגישה לאחרונה מראה גם שמפתחי המשקפיים יכניסו בה אלמנטים שייצרו ממשקים שישתנו על-פי העדפותיהם של המשתמשים או על-פי תנאי הסביבה שבה הם יהיו. עם הזמן, ולפי דפוסי השימוש שינותחו שוב ושוב, המשקפיים ילמדו מה האדם שחובש אותם מעדיף, וישתדלו שלא להטריד אותו בהצעות שאינן לרוחו. במקביל, גילתה בקשת הפטנט שהמשקפיים יצוידו בפאנל צדי שבו תשעה כפתורים. נשמע לא נוח? כמובן, אבל לאנשי גוגל יש פתרון גם לכך. המשקפיים ינתחו את מידת הקרבה של האצבעות לכפתורים ויציגו את המידע על המשקף, כאילו בעל המשקפיים עומד לגעת בזכוכית שמול עיניו. כדי שהתהליך ירגיש טבעי יותר, תופיע על המסך הדמיה של יד אנושית, עם שיערות ועם טביעות אצבע.

סירי, העוזרת מפענחת הדיבור של אפל שכבר מוטמעת באייפון האחרון, הייתה בסך-הכול הסנונית הראשונה. תוכנות שמופעלות באמצעות דיבור של המשתמש, ינתחו לא רק את הדיבור הרגיל שלו, אלא ילמדו את דפוסי ההתנהגות שלו ויציעו לו לבצע פעולות כאלה ואחרות (למשל להזמין קפה או לשלוח הודעה לבן או לבת הזוג בשעה מסוימת)בהתבסס על התנהגותו בעבר. כל זאת מבלי לגעת במקלדת בכלל. המחשוב, אגב, לא יתבצע על-גבי המכשיר עצמו אלא על מחשבי החברה שהתקשורת עמם תהיה באמצעות האינטרנט. כך, ניתן לעשות את הפעולות הסופר מורכבות הללו מבלי ליצור מכשיר כבד, גדול ויקר.

לסלי ספרינג, מנכ"ל Cognitive Code שמפתחת את SILVA, אחת התוכנות הללו, אמר לאחרונה למגזין פורבס שהצלחתה של סירי בשוק הרחב סללה את הדרך עבור החברה שלו. לעת עתה, החברה משלבת את המערכת שלה במטוסים עתידיים של חברת התעופה נורתרופ-גרומן, וכן בדגמים של שלושה יצרני רכב שבשמם ספרינג לא הסכים לנקוב. "אנחנו מקבלים הרבה יותר פניות מיצרנים", הוא צוטט. ספרינג צופה שהמשקפיים של גוגל ירשמו הצלחה משמעותית וישנו את השוק, וכן את הצורה שבה כולנו נתקשר בשנים הקרובות עם המכשירים שבהם אנו משתמשים. לדבריו, "כל הרכיבים הטכנולוגיים נופלים כעת למקום כמו חלקים של פאזל".

תחום נוסף שעומד בפני שינוי הוא האינטראקציה שלנו עם מידע ברשת: ככל שהמידע הולך ומצטבר נוצר צורך ב"סוכנים אינטליגנטיים" - תוכנות קטנות שיבצעו את פעולות המחשוב שלהן על-גבי הענן - על מנת לסייע לנו למקד את החיפושים שלנו וללמוד את תחומי העניין שלנו. תוכנות כאלה יסייעו לצרכנים למצוא את המוצר שהם מחפשים בקלות רבה בהרבה, אבל זה כמובן רק חלק מהסיפור. יישומים אחרים של טכנולוגיה כזו יכולים לקצר תהליכים רפואיים; למשל, הסוכן ינתח את ההיסטוריה הרפואית של המטופל במהירות ויציע לרופא לבצע בו את הבדיקות המתאימות מבלי לבזבז זמן על בירורים רפואיים מיותרים.

אפלטון מתהפך במערה

בחזרה לחתולים של גוגל. היכולת של מחשבים לזהות חתולים מבלי שיהיה להם מושג מהם, במידה מסוימת מחסלת את תורת הצורות האפלטונית. כולנו הרי יודעים להבדיל בין חתולים לכלבים בשבריר שנייה, אף שגם לכלבים יש ארבע רגליים, שתי אוזניים, פרווה וזנב. במשל המערה המפורסם של אפלטון, האנשים השוהים במערה רואים רק את צלליותיהם שמרצדות על הקירות. רק אם יצאו מן המערה ויגיעו להכרה אמיתית יבינו שהצלליות שעד כה תפסו כמוחשיות הן רק ייצוג של אנשים אמיתיים. על-פי אפלטון, הניסיון והזיכרונות שאנשים צוברים במהלך חייהם גורמים לנו להבין בסופו של דבר שצל אינו יישות עצמאית. אבל למחשבים של גוגל לא היו זיכרונות של חתולים. האם זה אומר שהם נמצאים ברמה תודעתית גבוהה משלנו?

התשובה הפשוטה היא שעדיין לא, אבל השאלה המעניינת היא מה יקרה לנו כשיכולות מחשוב כאלה יהפכו לחלק אינטגרלי מהחיים שלנו, ואולי אף לחלק מגופנו ממש. הגוגל גלאס אמנם ניתנים להסרה, אבל אם הן אכן יהיו כל-כך מוצלחים, ייתכן שאנשים כלל לא ירצו להסיר אותם. ואם בעתיד הם ימוזערו לכדי עדשות מגע נוחות או אפילו לכדי צ'יפ שיושתל במוחנו (כמו למשל היכולת להקלטת כל מה שאנו רואים בכל רגע, שמתוארת בפרק השלישי בסדרה "מראה שחורה")?

אם רכיב זעיר עם יכולות אינטליגנציה מלאכותית יהיה חלק מהפק"ל היומיומי של כולנו, ויאפשר לנו לחשוב מהר יותר, לזכור יותר מידע ולהגיע לביצועים קוגניטיביים מרשימים יותר - האם דיון על אנושיות יהיה בכלל רלבנטי? האם נוכל עדיין לקרוא לעצמנו הומו סאפיינס, או שאולי היכולת הטכנולוגית שלנו תדלג בקלילות מעל להתקדמות האיטית של האבולוציה הביולוגית ותזניק אותנו לעתיד שבו היכולות החדשות שלנו יגדירו מחדש את תכונות המין האנושי?