"אני לא יודעת אם אני רוצה שהמחשב יבין את כל הרגשות שלי"

חברות הטכנולוגיה עושות הכול כדי להבין מה אנחנו רוצים - בין השאר בעזרת זיהוי קולי ■ ד"ר נאוה שקד, שמתמחה בבינה מלאכותית וממשק אדם-מכונה, מדברת על העתיד והמכשולים בדרך

...
WOBI

מערכת היחסים בין בני האנוש לבין המחשבים שמקיפים אותם מתהדקת בשנים האחרונות בקצב מהיר. הדיאלוג שהתבסס בעבר על שימוש במקלדת ועכבר מתרחב בשנים האחרונות וכולל בין השאר שימוש נרחב בקול האנושי, תנועות, זיהוי פנים ותמונה ושילוב של סנסורים - למשל בתחום המיחשוב לביש. המחשבים סביבנו מנטרים כמויות עצומות של מידע, מבינים טוב יותר את הצרכים שלנו, מסוגלים לחזות מה הדבר הבא שנרצה לעשות ולומדים - בקצב מסחרר - לשוחח איתנו בשפה זורמת ואנושית.

קיראו עוד ב"גלובס"


הקשר בין אדם לבין מכונה מתבסס במקרים רבים על בינה מלאכותית. המכשירים שסביבנו נעזרים בכמויות עצומות של מידע מסוגים שונים (החיפושים שלנו בגוגל, דגימות קול, צילומי הדמיה רפואיים ועוד) שמתורגמים לסט של תובנות ותגובות.

אחד המוצרים שממחישים בצורה לא רעה את הפוטנציאל של הבינה המלאכותית הוא ה-Echo של אמזון - רמקול ביתי שמוכר יותר בתור אלקסה ומשתלב בטרנד הבית החכם. השירותים של אלקסה, שמבוססת על זיהוי קל, אינם זמינים בשלב זה בישראל - שוק זניח במונחים של אמזון, אבל למרות זאת יש מי שכבר התקינו את המכשיר בביתם.

אחת מהן היא ד"ר נאוה שקד, חברת סגל בפקולטה להנדסה ב-HIT מכון טכנולוגי חולון ומומחית בתחום של בינה מלאכותית וממשק אדם-מכונה. שקד החלה לעסוק בתחום הזיהוי הקולי לפני יותר משני עשורים. "תחום ה-Voice הוא כור מחצבתי", אומרת שקד בראיון ל"גלובס", "התחלתי לעסוק בזה לפני 25 שנה וכבר אז הבנו שהקול לא יכול לעמוד בפני עצמו".

לדבריה, "כדי להגיע לתוצאות אופטימליות צריך להשתמש גם בניתוח תמונה, באמצעי זיהוי ביומטריים, וכל ממשק שיכול להשתלב בדיאלוג. המכלול הזה יציע לאנשים טכנולוגיות חדשות של תקשורת ויתאים לסוגים שונים של משתמשים".

הרזומה של שקד כולל עבודה במעבדות המחקר של בל לאבס בארה"ב וביבמ חיפה. היא הייתה מעורבת בבניית מערכות לשימוש קולי אשר מוטמעות כיום, בין השאר, במערכת הבנקאית בארצות הברית.

"עובדת עם הרבה סטארט-אפים"

לפני חמש שנים היא בחרה לחזור לאקדמיה, "היום אני כותבת וחוקרת", היא אומרת, "אבל במקביל עובדת עם הרבה סטארט-אפים. אני מגשרת בין התעשייה לאקדמיה. ב-HIT מכון טכנולוגי חולון אני מנסה לשלב עבודה של סטודנטים מתחומים שונים, למשל, מדעי המחשב, עיצוב, הנדסה וטכנולוגיות למידה, כדי לדמות איך תיראה בפועל עבדה בתעשייה האמיתית, שבה אנשים מתחומים שונים פועלים בסינרגיה כדי ליצור טכנולוגיות פורצות דרך. עשינו פרויקטים מיוחדים בתחום המחשוב הלביש ובנוסף, במסגרת מחקר חדשני, אנחנו בונים עם הסטודנטים אוואטרים שישמשו אוכלוסיות מיוחדות. בכל הדמויות הווירטואליות האלה יהיה קיים גם ממשק קולי".

- זה נכון להגיד שהזיהוי הקולי נמצא היום רק בתחילת הדרך?

"התשובה היא כן ולא ואני אסביר. האקדמיה וגם התעשייה מתעסקות בנושאים של עיבוד וזיהוי דיבור כבר עשרות שנים. אני חושבת שזה עובד מצוין כל עוד מדובר בנישה ספציפית. אני מנסה להסביר לאנשים שהמערכות הקיימות כנראה לא יצליחו להבין את מכלול הדיבור האנושי. אנחנו רואים למשל שסירי של אפל נכשלת כאשר השפה מתחילה להיות מורכבת או שיש כפלי משמעות. מתי זה עובד טוב? כאשר יש התמקדות. בארה"ב אתה יכול למשל להזמין כרטיס למטוס או כרטיס רכבת - דרך זיהוי קולי. מאחר שהאלגוריתם מכיר את מבנה השיחה, נוצר דיאלוג מצוין.

"עניין אחר נוגע לאיך אנחנו מודדים הצלחה או כישלון. אם יש לי מערכת של שירות לקוחות שמצליחה לטפל רק בחמישים אחוז מהפניות - אבל חוסכת חמישה מיליון שקל - זאת הצלחה או לא?".

"למזלי המבטא שלי בסדר"

שקד היא כאמור מאמצת מוקדמת של טכנולוגיות. היא אחת מחמישה מיליון לקוחות שכבר התקינו את אלקסה, שנתיים אחרי שהמוצר הגיע לשוק, למרות שהיא מתגוררת במזרח התיכון.

- איך אלקסה יכולה לעזור לך בישראל - מעבר לגימיק?

"שמתי אותה בסלון ליד הטלוויזיה, וזה כיף לי. קודם היינו בבית שתי בנות ועכשיו אנחנו שלוש".

- היא מסתדרת עם המבטא שלך?

"היא מדברת רק אנגלית ולמזלי המבטא שלי בסדר. אם הוא היה חזק או בולט יותר, זה היה יותר קשה. מעבר לזה, היא משתפרת כל הזמן בעזרת חוכמת ההמונים".

- איך את משתמשת במערכת ביום יום?

"היא מתנהגת כאילו שהיא בארה"ב ולכן אם אני רוצה לשאול אותה מה מזג האוויר, אני צריכה לשאול מה מזג האוויר בתל אביב. מעבר לזה המערכת יכולה להשמיע לי כל סוג מוזיקה שאני רוצה, לספק לי מידע על החדשות ולענות על כל שאלה אינפורמטיבית שיש לי, דרך חיבור לאינטרנט.

"זאת מערכת שמאפשרת לך לשמוע מוזיקה חדשה ומתעדכנת כל הזמן. זה לא כמו דיסק שאתה קונה. בנוסף אתה יכול להכתיב לה את רשימת הקניות. אתה יכול להגיד 'אלקסה, תוסיפי אבקת כביסה'. בארץ זה כאמור לא מחובר - אם אני אזמין את זה המוצרים יגיעו לבת שלי בניו יורק, אבל אני יכולה לעדכן את הרשימה במקביל לדברים אחרים שאני עושה. אני לא צריכה אפליקציה לנייד או פתקים. המערכת יודעת גם מה קניתי בשבוע שעבר או מה אני קונה כל שבוע והיא יכולה להמליץ לי על דברים בהתאם".

בנוסף לאמזון פעילות בשוק הקול שורה של חברות נוספות בהן גוגל (שרכשה את יצרנית התרמוסטטים החכמים Nest), אפל, יבמ ועוד. "כל החברות האלה כל הזמן מקליטות את מה שאנחנו אומרים ומטייבות את השירות שלהן. בעצם השירות שאתה מקבל הוא אקטיבי. הדבר הגדול הבא בתחום הזה הוא הפרסונליזציה. כתוצאה מהמידע שהמחשב יקבל הוא ייתן לך עצות. הוא יגיד למשל - כל שבוע אתה קונה שני לחם ושני חלב והשבוע לא הזמנת. במקרה אחר המחשב יכול לנתח את הטעם המוזיקלי שלך ולהציע לך לשמוע שיר מסוים - על סמך מה שכבר הקשבת לו".

כל השירותים שהוצגו לעיל נופלים תחת הקטגוריה של בינה מלאכותית אולם שקד מציעה נקודת מבט אחרת על הדברים. "אנחנו קוראים לזה אמנם בינה מלאכותית - אבל חשוב לזכור שהיא נובעת מחוכמת ההמון. המערכת לוקחת ידע של המון אנשים ובעזרת סטטיסטיקה ואלגוריתמים מנסה לחזות מה אתה רוצה. זה בעצם מעגל של בינה מלאכותית שנוצרת מהבינה שלנו המשתמשים".

- נגיע ליום שבו רובוטים יבינו אותנו טוב יותר מאשר אנשים?

"יש שאלה פילוסופית שעומדת מעל לזה. אתה אומר איפה נגמר האדם ומתחילה המכונה? אני בן אדם טכנולוגי, אני מדענית ושאלות מוסריות מאוד מעסיקות אותי. אני לא יודעת אם אני רוצה שהמחשב יבין את כל הרגשות שלי. יש כבר היום יישומים של פסיכולוגים ויועצי נישואים שמתבססים על בינה מלאכותית אבל אני לא בטוחה בכלל שאני רוצה שהרובוטים יחליפו את בני האדם".