אפליקציות התרגום מתחילות להבין אותנו באמת

לפני כמה שנים, בביקור עבודה בסין, מצאתי את עצמי במלון עסקים קטן באחד מהחלקים הרחוקים והפחות מתיורים בבייג'ינג. בבוקר הראשון תהיתי היכן אפשר למצוא מקום לתיירים אובדים כמותי שמציע קפה. ניגשתי לפקידה בלובי, ובתמימותי ניסיתי לשאול באנגלית. היא התבוננה בי במבט מבולבל, הרימה את הטלפון וביקשה שאשאל שוב. בו במקום הטלפון חזר על גרסה מסוימת של דברי בסינית, והיא השיבה לי באמצעותה. האיכות היתה נוראית, לא היה לי מושג מה היא אמרה וקפה לא מצאתי. לא משנה עד כמה היינו צריכות לתקשר באותו רגע, האפליקציה שהייתה בידה לא היתה מספיק מוכשרת למשימה.

כבר עשרות שנים שחברות טכנולוגיה, כאלה שמתמחות בתרגום וגם אחרות, שופכות זמן וכסף על שכלול הטכנולוגיות בתחום, שיחליפו את הסרבול הכרוך במתרגם אנושי. המטרה היא להגשים חזון בן אלפי שנים: עולם שבו אין חסמי שפה, שבו היכולת לתקשר תלויה רק בנכונות הצדדים המשתתפים, אפילו לא בפערים תרבותיים או חברתיים. בפועל, מדובר באחת מהמשימות הקשות ביותר שחברות טכנולוגיה מתמודדות עמן. ההתקדמות נראית לעיתים כה איטית עד שגוגל תרגום - האפליקציה המפורסמת בתחום - נתפסה במשך שנים כסוג של בדיחה, שלא באמת מבינה את המבנים הלשוניים של השפות שהיא מתרגמת ביניהן, ובהתאם זכתה לכינוי "גוגל לתרגם".

אבל אל תתנו לניסיון העבר הזה להטעות אתכם. גוגל תרגום עוברת שינוי משמעותי בשנתיים האחרונות: החברה נעזרת בבינה מלאכותית כדי לאפשר לה "להבין" את המשפטים שמוזנים אליה, ולא רק לתרגם ישירות את המילים המופיעות בהן (עוד על כך בהמשך). היא, מיקרוסופטואמזון מציעות לעסקים שירותי תרגום מתקדמים ומבוססי ענן, מרוץ שאליו הצטרפה באפריל גם אמזון. וכמובן: גוגל, מיקרוסופט, אמזון ואפל משלבות יכולות תרגום בזמן אמת בעוזרות הווירטואליות שלהן - אסיסטנט, קורטנה, אלקסה וסירי בהתאמה.

החידושים של ענקיות הטק בתחום התרגום

ואלה כבר חדשות ישנות, כי בחודשים האחרונים כמעט כל ענקית טכנולוגיה יצאה בהכרזה גדולה שקשורה לפיצוח מחסום השפה. במרץ הכריזה מיקרוסופט כי תוכנה שפיתחה תרמה מאמרי חדשות מסינית לאנגלית ברמת דיוק של מתרגם אנושי. החודש היא הודיעה על שיתוף פעולה עם חברת שיתוף הנסיעות גראב, שאמור לסייע בשיפור התקשורת בין הנהגים לתיירים, שאינם דוברים את השפה. לא יהיה מדובר בהכרח בתרגום "סטנדרטי": הנוסע יוכל לצלם את המיקום שבו הוא נמצא, והתוכנה תדווח לנהג באיזו כתובת בדיוק מדובר.

פייסבוק לא נשארת מאחור גם היא. בחודש שעבר הכריזה הרשת החברתית כי צוות המחקר שלה, שעובד בשיתוף עם אוניברסיטת ניו-יורק, אוניברסיטת הבאסקים והסורבון, הצליח להביא לשיפור דרמטי באיכות התרגום באמצעות פיתוח טכניקת AI חדשה. אמזון, מצדה, רשמה באוגוסט פטנט שבאמצעותו תוכל לתרגם דוברים בעלי מבטא כבד, ואף "להתאים" את המבטא שלהם כך שיהיה זהה לזה של המאזינים.

וגוגל תרגום? עד סוף השנה היא תוכל לתרגם סימולטנית 40 שפות באופן ויזואלי. במילים אחרות, המשתמשים יוכלו לסרוק טקסטים ושלטים באמצעות שימוש במצלמת הסמארטפון, כמו עיתון או תפריט של מסעדה, ולקבל תרגום לשפתם בו במקום. היישום זמין גם לכל אביזר אחר שבו מותקן גוגל אסיסטנט, והאוזניות של החברה - גוגל באדס - יכולות לתרגם את אותן שפות גם בשמיעה. למרבה הצער, אף אחת מהשפות הללו אינה עברית.

לא מדובר על מרוץ אמריקאי בלבד: גם בסין, שבה התאכזבתי מהתרגום האוטומטי לפני שנים, חברות הטכנולוגיה מרכזות מאמץ בתחום. אחת מהן היא iFlytek, שנסחרת בבורסת שנזן לפי שווי של 7 מיליארד דולר, ונקלעה לאחרונה לפרשה מעניינת: החברה סיפקה את שירותי התרגום שלה לכנס רם דרג, וטענה שהם מבוססים על בינה מלאכותית. מתרגם אנושי זועם תבע אותה, בטענה שהוא ביצע את העבודה בפועל, והקרדיט נשלל ממנו וניתן לאלגוריתם. החברה מכחישה, והסיפור רק ממחיש עד כמה היכולות הממוחשבות בתחום התרגום מתקרבות לאלה האנושיות.

לפצח את האלגוריתם השמרן

לכאורה, כל זה היה אמור לקרות כבר מזמן. עוד ב-1954 אוניברסיטת ג'ורג'טאון ו-IBM בנו יחד את המתרגם הממוחשב הרציני הראשון: התוכנה ידעה לתרגם מרוסית לאנגלית, בכיוון אחד, והכירה 60 משפטים ו-250 מילים. החוקרים חזו אז כי הבעיות השונות הקשורות תרגום ייפתרו תוך חמש שנים. בפועל, הניסוי נחשב לכישלון והמימון לפרויקט נחתך.

עשרות שנים חלפו מאז, ושלל טכנולוגיות ניסו להטביע את חותמן על עולם התרגום, אך אף אחת מהן לא שינתה את העולם. ואז, ב-2001, התחילה גוגל לתקוף את הבעיה. חמש שנים אחר כך היא השיקה את גוגל תרגום, ואימצה פרדיגמה שאפשרה לו לפעול בהיקף רחב: ניתוח סטטיסטי (Statistical Machine Translation). לגוגל היה מאגר מידע אדיר על הדרך שבה הגולשים משתמשים בשפותיהם בפועל, והיא החליטה לנצל אותו. במקום לשבור את הראש כיצד ללמד את המחשב כללי דקדוק רבים, סבוכים ועתירי חריגים, הוא נדרש לבדוק, סטטיסטית, מהי המילה שבסבירות הגבוהה ביותר תהיה נכונה ומתאימה.

כיום, ברוב המקרים, תוכנות התרגום המתקדמות משתמשות במודלים של למידה עמוקה (Neural Machine Translation). מודל הסבירות הסטטיסטית הומר באלגוריתם שלומד כמויות מידע עצומות ומפתח מעין כללי תחביר משלו, שמאפשרים לו תרגום הלוך ושוב בצורה גמישה ומשכילה. התוצאות של השיטה הזאת טובות בהרבה, ומבחינת גוגל היא נכנסה לשימוש בדיוק בזמן.

במונדיאל האחרון שהתקיים ברוסיה והיה כולו בסימן טכנולוגיה, גוגל דיווחה על עלייה חדה בשירותי תרגום השפה המדוברת שפיתחה. היא ציפתה לשימוש גובר ביכולת הזאת, כמו בכל טורניר גדול שמושך מבקרים וצופים מכל העולם, אבל אפילו היא הופתעה מגודל התופעה. אנשים מכל העולם השתמשו בסמארטפונים כדי לדבר אחד עם השני, לא בשפת מחשב מגושמת אלא בשפות מדוברות שמעולם לא למדו או הכירו. המילים המבוקשות ביותר לפי גוגל היו, באופן לא מפתיע, "איצטדיון" ו"בירה".

ההתפתחויות האלה יוצרות בסיס לאופטימיות, אבל צריך לקחת אותה בעירבון מוגבל. לא במקרה התוכנות שמתמקדות בשפה ה"רשמית", שמופיעה במהדורות חדשות, מאמרים ותפריטים, הן אלה שנחשבות להצלחה. השפות שאנו דוברים מורכבות יותר מכפי שהן נראות. מילים רבות נהנות מכפל משמעות, או שהשימוש בהן משתנה בהתאם להקשר. יש ביטויים שממלאים פונקציה חברתית, ולא נועדו להעביר מידע, כמו השאלה "מה המצב?". שלא לדבר על כך שמרבית השפות משתנות ללא הרף בצורה ספונטנית, בלי כללים ברורים או יכולת לחזות את השינוי, ושתוכנות הבינה המלאכותית עדיין לא הצליחו להתגבר על דברים כמו סלנג או דיאלקט.

אף על פי שהאלגוריתם מוזן כל הזמן בכמויות מידע אדירות כדי להפוך אותו מיומן, יש לו נטייה אינהרנטית למצוא עקרונות חוזרים ותבניות, ולהתעלם מאנומליות. במובנים מסוימים הוא "שמרן" מדי כדי להדביק את הספונטניות שבשפה, ואת התמורות החברתיות שהיא עשויה לייצג. כמובן, זה לא אומר שהמשימה נכשלה. מדענים שוקדים כל העת לפתור בעיות אלו בדרכים יצירתיות.

בפייסבוק למשל החליטו לנקוט גישה חדשה, שלא נשענת על הצורך ביצירת "זיווגים" לשוניים בין מילים בשתי השפות המתורגמות. במקום זאת, צוות המחקר שלה נשען על הרעיון של פירוק וקידוד המילים לחלקים, אימון התוכנות לבנות משפטים נכונים, ותרגום לאחור. אם המערכת תרגמה נדרשת לתרגם משפט מאנגלית לעברית, היא תידרש לתרגם אותו נכונה גם בכיוון ההפוך, וכך "תבין" את שתי השפות טוב יותר.

לתרגם זה לא תמיד מספיק

ההסבר התיאולוגי המפורסם ביותר לריבוי השפות בעולם הוא עונש שניתן לבני האדם על התנהגותם, ובלבול שפתם. מכאן השם בבל, מגדל בבל, וכמובן דג בבל - הדג המפורסם מספרי "מדריך הטרמפיסט לגלקסיה", שמתרגם כל שפה בזמן אמת למי ששם אותו באוזן שלו. לא צריך להאמין באלוהים או בדאגלס אדמס כדי להבין עד כמה חשוב היה, מאז ומעולם, להתמודד עם מאות שפות שמערימות קשיים על יצירת קשרים בין בני אדם.

במציאות של ימינו, לא מדובר בבעיה מדעית תיאורטית, אלא בעניין קריטי. תנועת בני האדם קלה הרבה יותר מבעבר, ומעצבת מחדש את הדמוגרפיה העולמית. מלבד מהגרי עבודה, יש 244 מיליון פליטים ברחבי העולם, ומספרם רק גדל בכל שנה עקב מלחמות, רעב ובצורת קשה. לצדם, אי אפשר לשכוח את הסיבה העיקרית שבגללה ענקיות הטכנולוגיה רוצות כל כך לשלוט בשוק התרגום: ב-2017 לבדה חברות המספקות שירותי תרגום רב-לאומיים הכניסו סכום כולל של 40 מיליארד דולר.

אלא שחשוב לזכור שגם אם בעיית התרגום הסימולטני תיפתר, זה לא אומר שאנשים יתקשרו ביניהם. כששני אנשים רוצים לתקשר ברמה אנושית ומורכבת, לא מספיק רק שיחליפו מילים ומשפטים - מובנים לחלוטין - כדי שיבינו אחד את השני. התרבות שבה חיים האנשים; הקביעה הסובייקטיבית מה ראוי, מצחיק או מוזר, ואיזו מחווה היא פוגענית - אלה דברים שאובדים בתרגום. בשביל זה צריך ללמוד את השפה.

לתשומת לבכם: מערכת גלובס חותרת לשיח מגוון, ענייני ומכבד בהתאם ל קוד האתי המופיע בדו"ח האמון לפיו אנו פועלים. ביטויי אלימות, גזענות, הסתה או כל שיח בלתי הולם אחר מסוננים בצורה אוטומטית ולא יפורסמו באתר.

כלי חדש לניהול זמן:

מה שמעניין אותך. מתי שמענייין אותך

אודות גלובס

פרוייקטים ושיתופי פעולה

אפליקציות התרגום מתחילות להבין אותנו באמת

הדפסת כתבה זו זמינה למנויים בלבד

לפצח את האלגוריתם השמרן

לתרגם זה לא תמיד מספיק