האחראי על בינה מלאכותית בגוגל: "הופתענו שהטכנולוגיה מפיקה מידע שאף רופא לא מסוגל להפיק בעצמו"

ג'ף דין, שעובד בגוגל כמעט מיום הקמתה, מתאר בראיון ל"גלובס" את התפתחות הטכנולוגיה ומסביר למה גוגל נכנסה לפעילות השבבים • "נפתחות בפנינו אפשרויות חדשות - מהיכולת לאמן רובוטים באמצעות צפייה באדם ועד לשיפור תפוקת החלב של פרות"

ג'ף דין,/ צילום: תומר פולטין
ג'ף דין,/ צילום: תומר פולטין

"ב-2008 פרסמה האקדמיה האמריקאית להנדסה רשימה של 14 אתגרים הנדסיים גדולים למאה ה-21. הרשימה גובשה על ידי חבורת מומחים מתחומים שונים, וכללה נושאים שאם נתקדם בהם העולם יהיה מקום בריא יותר". כך פותח ג'ף דין, סגן נשיא בכיר בחברה ואחראי תחום הבינה המלאכותית בגוגל (Google.AI) בחמש השנים האחרונות, את ההרצאה שנשא בוועידת המפתחים האחרונה של גוגל שנערכה לפני כחודשיים בארה"ב.

דין (51) הוא אחד העובדים הוותיקים בגוגל ובעל דוקטורט במדעי המחשב מאוניברסיטת וושינגטון. הוא החל לעבוד בחברה ב-1999 כאשר משרדי גוגל היו ממוקמים, לדבריו, "בקומה מעל חנות של חברת התקשורת T-Mobile". בראשית ימי החברה היה זה דין שפיתח את הטכנולוגיה שאפשרה לחברה לגדול במהירות, ולכן נחשב לאחד מאבות הצלחתה.

לגוגל, על פי דין, יש פרויקטים שעוסקים בעשרה מאותם 14 אתגרים, ולארבעה מהמעניינים שבהם יש נגיעה ישירה לתחום הבינה המלאכותית, שעליהם הוא מפרט: שיקום ושיפור התשתית העירונית, קידום אינפורמטיקה בתחום הבריאות, הנדסת תרופות טובה יותר והנדסת הכלים המתאימים לתגליות מדעיות. גוגל היא אחת החברות המובילות בעולם בתחום הבינה המלאכותית, ויכולותיה בתחום כבר נמצאות בבסיס מוצרי החברה היומיומיים כמו גוגל טרנסלייט, גוגל מפות וזיהוי תוכן פוגעני ביוטיוב.

באחרונה הגיע דין לביקור במרכז הפיתוח של החברה בישראל. בראיון ל"גלובס" הוא סיפר על הפרויקטים החדשים של גוגל בתחום, ותיאר את האתגרים שניצבים בפניה בתחום הבינה המלאכותית, את המקום שתופסת פעילות זו בחברה ואת החשיבות של כניסתה של גוגל לעולם השבבים לבינה מלאכותית.

"מה שאנחנו רוצים זה להיות מסוגלים ללמד מכונות לעשות דברים שיועילו לבני אדם. יש הרבה יישומים פוטנציאליים שאנחנו לא יודעים איך לעשות היום, למשל יישומים ברפואה, כגון לעזור לרופאים לקבל החלטות. זה כולל ניתוח של תיקים רפואיים, הבנה של השיחות שבין החולה לרופא והיכולת לסכם אותם עבורם", אומר דין.

"כיום, כשהכלים הבסיסיים של זיהוי קול וראיית מכונה פועלים טוב יותר, נפתחות אפשרויות חדשות - בין אם זה אבחון מחלות אצל צמחים או לדאוג שפרות יעשו כושר". דין מתכוון בכך לאחד מהפרויקטים של גוגל, במסגרתו מוצר של החברה בשם "אידה" עוקב אחר התנהגותן ומצבן הבריאותי של פרות, מנתח אותם ומספק תובנות מעשיות לחקלאי - באופן ששיפר את תפוקת החלב ב-30%, לטענת גוגל. "אידה" עושה שימוש בתוכנת הבינה המלאכותית של גוגל, TensorFlow. "גוגל פיתחה את TensorFlow כדי שנוכל לבטא את רעיונות למידת המכונה שלנו, לחלוק אותם עם שאר העולם ולאפשר לחוקרי למידת מכונה לשתף רעיונות ולהפוך מודלים של למידת מכונה למעשיים במוצרים ובסביבות אחרות", הוא אומר.

פעילות הבינה המלאכותית בישראל נמצאת גם היא במגמת עלייה, ו"מוצרים שמפותחים בישראל נמצאים בחזית החדשנות של החברה ותורמים לה מאוד", לדברי דין. במרכז הפיתוח שבראשו עומד יוסי מטיאס, מועסקים כמאה אנשים רק בתחום הבינה המלאכותית. במרכז עובדים על מערכת לחיזוי שיטפונות, כמו גם על מיזם "גוגל דופלקס" - תוכנה שמאפשרת קיום שיחה בין אדם אמיתי לבין בינה מלאכותית, שמדברת בקול טבעי ומסוגלת לבצע משימות טלפוניות עבור האדם, כמו למשל בהזמנת תור מול מוקדן.

פיצ'ר נוסף שפותח בישראל הוא Call Screen, שמאפשר לסנן שיחות באמצעות שיחה מקדמית שמנהלת בינה מלאכותית עם המתקשר. פיצ'ר אחר שמפותח בארץ ממשיך את הקונספט ומרחיב אותו לקיום שיחה שלמה - כך שחירשים, למשל, יוכלו לקיים שיחות עם אנשים שומעים.

מבקרת משחקת עם רובוט בכנס המפתחים של גוגל/ צילום: רויטרס
 מבקרת משחקת עם רובוט בכנס המפתחים של גוגל/ צילום: רויטרס

"יש התפוצצות בתעשיית השבבים"

TensorFlow הוא חלק מבשורה רחבה ומשמעותית הרבה יותר של גוגל בתחום: פיתוח שבבי בינה מלאכותית ייעודיים, שמשמשים את גוגל עצמה, אך גם את הסטארט-אפים שמשתמשים בשירותי הענן שלה. מדובר באחד התחומים החמים והחשובים כיום בעולם הטכנולוגיה, שבו פועלות ענקיות שבבים כמו אנבידיה; סטארט-אפים כמו הבאנה, היילו ונורובלייד הישראליים; וגם ענקיות האינטרנט - אמזון, פייסבוק שהודיעה כי היא נכנסת לתחום (ייתכן כי תשתף פעולה עם אינטל) וכאמור גוגל.

"התחלנו לחשוב על חומרה ייעודית לבינה מלאכותית ב-2012, לאחר שהתחלנו לראות הצלחה בזיהוי קול ותמונה וניסינו לחשוב איך לשלב את היכולות הללו בכמה מהמוצרים שלנו", סיפר דין בהרצאה בתל אביב. "אז הגיע רגע מפחיד שבו הבנו שהמשמעות של 100 מיליון לקוחות שמשתמשים בפיצ'ר במשך שלוש דקות ביום - שזה היקף שימוש בלתי מופרך - היא שהיינו נאלצים להכפיל את מספר המחשבים במרכזי הנתונים של גוגל. זו מסקנה די מפחידה כשמדובר רק על פיצ'ר אחד, במוצר אחד. אז התחלנו לבנות מעבדים לאלגוריתמים של למידה עמוקה שרצינו להריץ.

"יש לכך השפעה רבה. לדוגמה, מהנדסי כימיה קוואנטית מנסים לחזות מאפיינים של מולקולות, למשל האם הן רעילות, באמצעות סימולטור. רשת נוירונים של בינה מלאכותית יכולה לעשות את זה, רק במהירות הגדולה פי 300 אלף, מבלי שקיימים הבדלים ברמת הדיוק".

אילו יתרונות, כחוקרים, מעניקה לכם העובדה שהחברה שלכם מעצבת בעצמה את שבביה? למה אנחנו יכולים לצפות בעתיד הקרוב?
"אני אוהב לדבר על תחום החומרה כי אני חושב שהוא סופר מרתק. אני סבור שהסיבה שאנו רואים את ההתפוצצות הזאת בהתעניינות בבניית חומרה מתמחה ללמידת מכונה, היא שמדובר בכלי שניתן לעשות בו שימוש במגוון רחב של בעיות, עד כדי כך שזה ממש סוג חדש של חישוביות שאנו רוצים לבצע. הסיבה שאנחנו בונים את השבב הייעודי לבינה מלאכותית (ה-TPU), היא שאנו מרגישים שהאצת חישוביות ללמידת מכונה, גם בשלבי האימון (Training) וגם בשלבי היישום (Inference), מאוד חשובה לעסקים שלנו.

"יש לנו אינטגרציה ורטיקלית - החומרה שאנחנו בונים, התוכנה שאנחנו מפתחים, ומעל זה ביצוע המחקר - ולכן אנו יכולים לומר מהם סוגי השבבים העתידיים שאנו רוצים לבנות, בהתבסס על שאלות המחקר שאנו סבורים שיהיו רלוונטיות בשנים הקרובות".

בנוסף, צוותי החומרה שלנו יכולים לומר לנו, החוקרים, 'אנחנו חושבים שאנחנו יכולים לעשות דבר כזה וכזה - האם זה יהיה שימושי?' ואז מתקיים דיאלוג בין חוקרי למידת המכונה לבין אנשי ארכיטקטורת החומרה, והם יענו 'ובכן הדבר הזה אמנם לא יהיה שימושי, אבל מה יקרה אם תוכלו לעשות כך וכך?'. למעשה, פעם בשבוע אני משתתף בפגישה שבה אנו מכנסים יחד קבוצה של מומחי ארכיטקטורת חומרה, אנשי תוכנה וחוקרי למידת מכונה ופשוט משוחחים. זה דבר נפלא.

"מה שאנו רואים בקהילה הרחבה, זה שיש התפוצצות של אנשים שונים עם תובנות שונות על אילו סוגי מאיצים הם רוצים לבנות ואילו סוגי עיצובים של מערכות מתאימים להם. הכול מאוד מרגש. אני חושב שמתרחש כאן פיצוץ קמבריוני (התקופה באבולוציה שבה הופיעה לפתע מאסה של צורות חיים מורכבות, א"ב) של ארכיטקטורות שונות ללמידת מכונה ורעיונות מחקר שרצים בקהילת ההון סיכון. הרבה סטארט-אפים מנסים דברים שונים וגם חברות גדולות עושות את זה. השנים הבאות עומדות להיות מאוד מעניינות".

איך בעצם נראית הדרך שעושה המחקר שלכם, מהמעבדה ועד למוצר שיכול לייצר לגוגל שווקים חדשים?
"במסגרת קבוצות המחקר שלנו אנו מבצעים ארבעה סוגי פעולות: סוג אחד הוא המחקר הבסיסי. שם אנו מצביעים על בעיה שנראית לנו מעניינת ואז אנו בודקים אם אנחנו מסוגלים לפתור אותה; המשימה השנייה היא פיתוח התוכנה שתאפשר לנו לבצע מחקר טוב יותר. כך נוצרים מוצרים כמו TensorFlow - מתוך השאיפה לפתח סט כלים שיאפשר לנו, מצד אחד, לבטא יותר בקלות רעיונות של למידת מכונה, ומצד שני יאפשר לקחת רעיונות ממחקרים על לימוד מכונה שכבר ביצענו, ובהמשך יאפשר לצוותים אחרים - בגוגל או מחוצה לה - לעשות בהם שימוש;

"המשימה השלישית היא לשתף פעולה עם צוותי המוצר של גוגל בנוגע לבעיות שהם חושבים שהן מעניינות ושיש להן היבטים מחקריים. אגב, לפעמים תוצאה של מחקר מהסוג הראשון היא שלאחר שהבנו שניתן לפתור בעיה מסוימת, אנו מגלים שיש לה שלושה שימושים נהדרים במוצרים שלנו, כמו למשל ג'ימייל; והמשימה הרביעית היא מחקר יישומי בתחומים שבהם לגוגל אין עדיין מוצרים. כך למשל תחום הבריאות, שעד לפני כמה שנים לא היו מוצרים בנמצא ועתה אנו מתחילים לפתח כאלה".

כמו לדוגמה ללמד רובוט לפתוח ידית של דלת, משימה שנחשבת לאחת המשימות המורכבות שיש?
"כן. הגישה המסורתית לעשות את זה הייתה לפתח אלגוריתם לפתיחת ידית. אבל הגישה החדשה, שאני סבור שהיא הרבה יותר הגיונית, היא שאתה חושף את המכונה לידיות שונות, והיא לומדת לשחק איתם, עד שהיא לומדת כיצד לפתוח הרבה סוגי ידיות. אבל היא עושה את זה בדרך של למידה עצמית, במקום לקודד את זה בצורה ידנית".

כיום כבר קל יותר קל לבנות רובוטים ש"עושים דברים אמיתיים בעולם", כפי שאמר דין בהרצאה, וכמו האדם - "אם הוא לא מסוגל לראות אז יותר קשה לו לעשות דברים. לכן רובוטים יכולים להשתמש בראייה ממוחשבת כדי לדעת איך להתנהג בעולם". דין הציג סרטון וידיאו של רובוטים המתאמנים בהרמת חפצים מתוך ארגז ולאחר שהצליחו להרימם הם משליכים אותם בחזרה לארגז וממשיכים להרים עוד דברים. "מה שנחמד ברובוטים הוא שאפשר לאסוף את הדאטה שהם קלטו על הסביבה מהסנסורים שלהם, ואז לאמן אותם בהתבסס על הניסיון המצטבר של רובוטים רבים בכדי לקבל מודל יותר טוב של איך לתפוס דברים. למחרת, הם כבר יוכלו להתאמן עם מודל תפיסה טוב יותר".

"ב-2015 שיעור התפיסה של 'דבר-מה שהרובוט לא ראה מעודו בעבר' עמד על 65%, והצלחנו להגדיל את זה ל-78% ב-2016 ול-98% בשנה שעברה. ההבדל הוא עצום, כי אם הרובוט לא מסוגל לבצע כמה תפיסות ברצף, אי אפשר לגרום לו לעשות דברים בעולם האמיתי". בגוגל גם לימדו את הרובוטים לבצע פעילויות באמצעות צפייה בבני אדם. דין מספר לדוגמה כי בפעולת מזיגה לכוס, לאחר 15 ניסיונות ו-15 דקות של אימון, הרובוט אמנם עדיין לא היה יכול למזוג טוב כמו ילד בן 8 - אבל כן הצליח לעשות זאת כמו ילד בן 4.

 מה עושים בלי הדאטה שקיים בפייסבוק?
אלא שהפרויקטים של גוגל קשורים לעולם האמיתי לא פחות מאשר רובוטים שמתאמנים בהרמת דברים ובמזיגה של קוביות קטנות מכד לכוס. בתחום קידום אינפורמטיקה בתחום הבריאות, עובדת גוגל על פרויקטים בתחום סרטן הריאות ומחלת עיניים בשם רטינופתיה סוכרתית.

מדובר במחלה ניוונית שעלולה להתפתח אצל חולי סוכרת, שלדברי דין היא גורם העיוורון שצומח בקצב המהיר ביותר, ויש בעולם 415 מיליון חולי סכרת. "אם מגלים אותה בזמן היא ניתנת לריפוי, אבל אם לא, לחולה עלול להיגרם עיוורון חלקי או מלא. כשנותנים לקבוצה של רופאים לאבחן את המחלה על סמך צילום של גלגל העין ולקבוע באיזה שלב נמצאת המחלה (מ-1 עד 5), הם מסכימים זה עם זה ב-65% מהמקרים. גם אם נותנים לרופא תמונה שהוא כבר ראה עשר שעות קודם לכן, הוא יסכים עם עצמו רק ב-60%. ההבדל הוא עצום, כי ההבדל בין דרגה 2 לדרגה 3 הוא ההבדל בין 'תבוא לבדיקה בעוד שנה' לבין 'מוטב שתגיע למרפאה תוך שבוע'. האתגר הוא בעצם של ראייה ממוחשבת, ואפשר לאמן את המערכת לשפר את דיוק האבחון".

דין מספר כי הם הצליחו גם לזהות באמצעות טכנולוגיית בינה מלאכותית את גילו ומינו של הנבדק על סמך התמונות של גלגל העין - דבר שאין באפשרותו של רופא לעשות. התוכנה הצליחה לזהות את זה ברמה של 80%. "הבנו לפתע שאפשר לזהות הרבה דברים מעניינים מתמונת גלגל העין. לא רק מין וגיל, אלא גם לחץ דם ואת רמת ההמוגלובין. אם משלבים את הכול, אפשר לחזות את הסיכון להתקף לב ברמת דיוק של בדיקת דם פולשנית".

 חלק מהשיפורים במוצרים נעשים "תחת מכסה המנוע" ופחות נראים לעין, משום שממשק המשתמש כמעט ולא משתנה. תוכל לספר על חלק מהשינויים הללו?
"בחמש-שש השנים האחרונות אנו משתמשים בלמידת מכונה כמעט בכל המוצרים שלנו, הרבה יותר מאשר השתמשנו לפני כן. בתחום החיפוש, לדוגמה, האלגוריתמים עצמם עושים שימוש בלמידת מכונה במגוון דרכים. במדדים הפנימיים שלנו אנו רואים שהתוצאות הרבה יותר טובות היום".

יכולת האלגוריתמים של בינה מלאכותית נגזרת מאיכות הדאטה. לגוגל יש גישה להרבה דאטה, אולם אין לכם גישה למידע שמייצרים מאות מיליוני בני אדם בפייסבוק. איך גישה לחומר שכזה הייתה משפרת את יכולות הבינה המלאכותית של גוגל, ומה בעצם אנחנו מפסידים?
"אתה צודק בקטע הזה שיש שוני בסוגי הדאטה השונים שיש לכל חברה ושבהם ניתן להשתמש כדי לשפר את מוצריה. לא באמת חשבתי על איך היינו משתפרים. אני חושב שדי ברור שסוגים שונים של דאטה יכולים לעזור לך בדרכים שונות. מה שאתה רוצה לעשות בתור חוקר של למידת מכונה שיוצא לדרך לקראת פתרון בעיה, זה לשאול איך למעשה אנו פותרים את הבעיה, אילו כלים זמינים לרשותנו ובאילו גישות אנחנו יכולים לנסות להשתמש. זו הדרך שבה אני ניגש לפתרון בעיות". 

"בינה מלאכותית לומדת את העולם כפי שהוא, ולא כפי שאנחנו רוצים שיהיה"

לצד ההתרגשות מהאפשרויות החדשות שטומנת בחובה ההתקדמות המטאורית ביכולות הבינה המלאכותית, קיימת גם לא מעט דאגה מסוגיות אתיות הקשורות לטכנולוגיה החדשה. לא מדובר בסוגיות פילוסופיות גרידא, אלא באתגר מעשי בעל פוטנציאל השפעה רב על האופן שבו משתמשי הטכנולוגיה החדשה יחוו את העולם. נושא האתיקה הוא אחד הנושאים המשמעותיים שנדונים כיום. לפייסבוק, מיקרוסופט, אמזון ו-IBM, וכן לענקיות טכנולוגיה אחרות, יש מסמכי מדיניות שמפרטים את העקרונות האתיים המנחים אותן בנושא.

ג'ף דין, סגן נשיא בכיר בחברת גוגל, שאחראי על תחום הבינה המלאכותית, התבטא בנושא בפודקאסט שעלה בתחילת יוני באתר הטכנולוגיה The Verge, בו הוא מודה שאכן מדובר באחת הסוגיות המרכזיות והחשובות ביותר בתחום. "העניין הוא שאת המודלים של למידת מכונה אנו מאמנים על בסיס דאטה שמשקף את העולם כפי שהוא - ולא את העולם כפי שאנו רוצים שהוא יהיה. לדוגמה, כשמנסים לאמן מודל למציאת מועמדים מתאימים לקבלת משכנתה, אפילו אם לא תזין למודל מידע כמו מין וגזע, עדיין המכונה תמצא דפוסים - למשל באמצעות כתובת המגורים. לכן נעשים מחקרים רבים על ידי הקהילה במטרה להסיר הטיות מסוימות אך להשאיר הטיות אחרות, כי בסופו של דבר אתה לא רוצה לעקר את המודלים מהטיות בכלל. ההטיות האלה הן הרי מלכתחילה חלק מסוד כוחה של הבינה המלאכותית".

דין נשאל כיצד הוא מתמודד עם האתגר בגוגל והשיב כי "הצעד החשוב הראשון הוא להכיר בבעיה, אך יש גם טכניקות אלגוריתמיות להנחות כך ששתי קבוצות שונות יקבלו את אותו סיכוי לקבל תוצאה מסוימת, בעוד כל שאר הפרמטרים יהיו זהים".

מנחי הפודקאסט העלו תהיות האם העיסוק בסוגיות האתיקה, הוועדות, ומסמכי המדיניות אינו אלא מעטה חיצוני יח"צני, שלציבור אין דרך לבדוק את הדיווחים של החברות והוא בעצם צריך לסמוך על המילה שלהן, ושאלו: "כמו שראינו במקרה של פייסבוק, האם אנו סומכים על החברות הללו שיקבעו לעצמן את הכללים?". 

ג'ף דין
גיל: 51
מצב משפחתי: נשוי + 2
השכלה: דוקטורט במדעי המחשב מאוניברסיטת וושינגטון
תפקיד: סגן נשיא בכיר ומנהל תחום בינה מלאכותית של חברת גוגל
תפקידים קודמים בגוגל: לקח חלק בתכנון תשתיות שמיושמות ב-50 מוצרים, פיתח את הגרסה הראשונית של מערכת הפרסום AdSense, היה מעורב בתכנון שירותי החדשות והתרגום