גלובס - עיתון העסקים של ישראלאתר נגיש

אפליקציות התרגום מתחילות להבין אותנו באמת

כבר אלפי שנים שהאנושות חולמת על הסרת מחסומי השפה ● כבר עשרות שנים שהיא מנסה לשכלל את טכנולוגיות התרגום, שנחשבו מוגבלות ומסורבלות ● רצף הכרזות של ענקיות טק מהתקופה האחרונה מעיד שהתחום מתקרב לפריצת דרך ● אז מדוע בכל זאת נצטרך ללמוד שפות בעתיד?

לזנוח באופן סופי את המילונים / צילום: Shutterstock
לזנוח באופן סופי את המילונים / צילום: Shutterstock

לפני כמה שנים, בביקור עבודה בסין, מצאתי את עצמי במלון עסקים קטן באחד מהחלקים הרחוקים והפחות מתיורים בבייג'ינג. בבוקר הראשון תהיתי היכן אפשר למצוא מקום לתיירים אובדים כמותי שמציע קפה. ניגשתי לפקידה בלובי, ובתמימותי ניסיתי לשאול באנגלית. היא התבוננה בי במבט מבולבל, הרימה את הטלפון וביקשה שאשאל שוב. בו במקום הטלפון חזר על גרסה מסוימת של דברי בסינית, והיא השיבה לי באמצעותה. האיכות היתה נוראית, לא היה לי מושג מה היא אמרה וקפה לא מצאתי. לא משנה עד כמה היינו צריכות לתקשר באותו רגע, האפליקציה שהייתה בידה לא היתה מספיק מוכשרת למשימה.

כבר עשרות שנים שחברות טכנולוגיה, כאלה שמתמחות בתרגום וגם אחרות, שופכות זמן וכסף על שכלול הטכנולוגיות בתחום, שיחליפו את הסרבול הכרוך במתרגם אנושי. המטרה היא להגשים חזון בן אלפי שנים: עולם שבו אין חסמי שפה, שבו היכולת לתקשר תלויה רק בנכונות הצדדים המשתתפים, אפילו לא בפערים תרבותיים או חברתיים. בפועל, מדובר באחת מהמשימות הקשות ביותר שחברות טכנולוגיה מתמודדות עמן. ההתקדמות נראית לעיתים כה איטית עד שגוגל תרגום - האפליקציה המפורסמת בתחום - נתפסה במשך שנים כסוג של בדיחה, שלא באמת מבינה את המבנים הלשוניים של השפות שהיא מתרגמת ביניהן, ובהתאם זכתה לכינוי "גוגל לתרגם".

אבל אל תתנו לניסיון העבר הזה להטעות אתכם. גוגל תרגום עוברת שינוי משמעותי בשנתיים האחרונות: החברה נעזרת בבינה מלאכותית כדי לאפשר לה "להבין" את המשפטים שמוזנים אליה, ולא רק לתרגם ישירות את המילים המופיעות בהן (עוד על כך בהמשך). היא, מיקרוסופטואמזון מציעות לעסקים שירותי תרגום מתקדמים ומבוססי ענן, מרוץ שאליו הצטרפה באפריל גם אמזון. וכמובן: גוגל, מיקרוסופט, אמזון ואפל משלבות יכולות תרגום בזמן אמת בעוזרות הווירטואליות שלהן - אסיסטנט, קורטנה, אלקסה וסירי בהתאמה.

החידושים של ענקיות הטק בתחום התרגום

ואלה כבר חדשות ישנות, כי בחודשים האחרונים כמעט כל ענקית טכנולוגיה יצאה בהכרזה גדולה שקשורה לפיצוח מחסום השפה. במרץ הכריזה מיקרוסופט כי תוכנה שפיתחה תרמה מאמרי חדשות מסינית לאנגלית ברמת דיוק של מתרגם אנושי. החודש היא הודיעה על שיתוף פעולה עם חברת שיתוף הנסיעות גראב, שאמור לסייע בשיפור התקשורת בין הנהגים לתיירים, שאינם דוברים את השפה. לא יהיה מדובר בהכרח בתרגום "סטנדרטי": הנוסע יוכל לצלם את המיקום שבו הוא נמצא, והתוכנה תדווח לנהג באיזו כתובת בדיוק מדובר.

פייסבוק לא נשארת מאחור גם היא. בחודש שעבר הכריזה הרשת החברתית כי צוות המחקר שלה, שעובד בשיתוף עם אוניברסיטת ניו-יורק, אוניברסיטת הבאסקים והסורבון, הצליח להביא לשיפור דרמטי באיכות התרגום באמצעות פיתוח טכניקת AI חדשה. אמזון, מצדה, רשמה באוגוסט פטנט שבאמצעותו תוכל לתרגם דוברים בעלי מבטא כבד, ואף "להתאים" את המבטא שלהם כך שיהיה זהה לזה של המאזינים.

וגוגל תרגום? עד סוף השנה היא תוכל לתרגם סימולטנית 40 שפות באופן ויזואלי. במילים אחרות, המשתמשים יוכלו לסרוק טקסטים ושלטים באמצעות שימוש במצלמת הסמארטפון, כמו עיתון או תפריט של מסעדה, ולקבל תרגום לשפתם בו במקום. היישום זמין גם לכל אביזר אחר שבו מותקן גוגל אסיסטנט, והאוזניות של החברה - גוגל באדס - יכולות לתרגם את אותן שפות גם בשמיעה. למרבה הצער, אף אחת מהשפות הללו אינה עברית.

לא מדובר על מרוץ אמריקאי בלבד: גם בסין, שבה התאכזבתי מהתרגום האוטומטי לפני שנים, חברות הטכנולוגיה מרכזות מאמץ בתחום. אחת מהן היא iFlytek, שנסחרת בבורסת שנזן לפי שווי של 7 מיליארד דולר, ונקלעה לאחרונה לפרשה מעניינת: החברה סיפקה את שירותי התרגום שלה לכנס רם דרג, וטענה שהם מבוססים על בינה מלאכותית. מתרגם אנושי זועם תבע אותה, בטענה שהוא ביצע את העבודה בפועל, והקרדיט נשלל ממנו וניתן לאלגוריתם. החברה מכחישה, והסיפור רק ממחיש עד כמה היכולות הממוחשבות בתחום התרגום מתקרבות לאלה האנושיות.

לפצח את האלגוריתם השמרן

לכאורה, כל זה היה אמור לקרות כבר מזמן. עוד ב-1954 אוניברסיטת ג'ורג'טאון ו-IBM בנו יחד את המתרגם הממוחשב הרציני הראשון: התוכנה ידעה לתרגם מרוסית לאנגלית, בכיוון אחד, והכירה 60 משפטים ו-250 מילים. החוקרים חזו אז כי הבעיות השונות הקשורות תרגום ייפתרו תוך חמש שנים. בפועל, הניסוי נחשב לכישלון והמימון לפרויקט נחתך.

עשרות שנים חלפו מאז, ושלל טכנולוגיות ניסו להטביע את חותמן על עולם התרגום, אך אף אחת מהן לא שינתה את העולם. ואז, ב-2001, התחילה גוגל לתקוף את הבעיה. חמש שנים אחר כך היא השיקה את גוגל תרגום, ואימצה פרדיגמה שאפשרה לו לפעול בהיקף רחב: ניתוח סטטיסטי (Statistical Machine Translation). לגוגל היה מאגר מידע אדיר על הדרך שבה הגולשים משתמשים בשפותיהם בפועל, והיא החליטה לנצל אותו. במקום לשבור את הראש כיצד ללמד את המחשב כללי דקדוק רבים, סבוכים ועתירי חריגים, הוא נדרש לבדוק, סטטיסטית, מהי המילה שבסבירות הגבוהה ביותר תהיה נכונה ומתאימה.

כיום, ברוב המקרים, תוכנות התרגום המתקדמות משתמשות במודלים של למידה עמוקה (Neural Machine Translation). מודל הסבירות הסטטיסטית הומר באלגוריתם שלומד כמויות מידע עצומות ומפתח מעין כללי תחביר משלו, שמאפשרים לו תרגום הלוך ושוב בצורה גמישה ומשכילה. התוצאות של השיטה הזאת טובות בהרבה, ומבחינת גוגל היא נכנסה לשימוש בדיוק בזמן.

במונדיאל האחרון שהתקיים ברוסיה והיה כולו בסימן טכנולוגיה, גוגל דיווחה על עלייה חדה בשירותי תרגום השפה המדוברת שפיתחה. היא ציפתה לשימוש גובר ביכולת הזאת, כמו בכל טורניר גדול שמושך מבקרים וצופים מכל העולם, אבל אפילו היא הופתעה מגודל התופעה. אנשים מכל העולם השתמשו בסמארטפונים כדי לדבר אחד עם השני, לא בשפת מחשב מגושמת אלא בשפות מדוברות שמעולם לא למדו או הכירו. המילים המבוקשות ביותר לפי גוגל היו, באופן לא מפתיע, "איצטדיון" ו"בירה".

ההתפתחויות האלה יוצרות בסיס לאופטימיות, אבל צריך לקחת אותה בעירבון מוגבל. לא במקרה התוכנות שמתמקדות בשפה ה"רשמית", שמופיעה במהדורות חדשות, מאמרים ותפריטים, הן אלה שנחשבות להצלחה. השפות שאנו דוברים מורכבות יותר מכפי שהן נראות. מילים רבות נהנות מכפל משמעות, או שהשימוש בהן משתנה בהתאם להקשר. יש ביטויים שממלאים פונקציה חברתית, ולא נועדו להעביר מידע, כמו השאלה "מה המצב?". שלא לדבר על כך שמרבית השפות משתנות ללא הרף בצורה ספונטנית, בלי כללים ברורים או יכולת לחזות את השינוי, ושתוכנות הבינה המלאכותית עדיין לא הצליחו להתגבר על דברים כמו סלנג או דיאלקט.

אף על פי שהאלגוריתם מוזן כל הזמן בכמויות מידע אדירות כדי להפוך אותו מיומן, יש לו נטייה אינהרנטית למצוא עקרונות חוזרים ותבניות, ולהתעלם מאנומליות. במובנים מסוימים הוא "שמרן" מדי כדי להדביק את הספונטניות שבשפה, ואת התמורות החברתיות שהיא עשויה לייצג. כמובן, זה לא אומר שהמשימה נכשלה. מדענים שוקדים כל העת לפתור בעיות אלו בדרכים יצירתיות.

בפייסבוק למשל החליטו לנקוט גישה חדשה, שלא נשענת על הצורך ביצירת "זיווגים" לשוניים בין מילים בשתי השפות המתורגמות. במקום זאת, צוות המחקר שלה נשען על הרעיון של פירוק וקידוד המילים לחלקים, אימון התוכנות לבנות משפטים נכונים, ותרגום לאחור. אם המערכת תרגמה נדרשת לתרגם משפט מאנגלית לעברית, היא תידרש לתרגם אותו נכונה גם בכיוון ההפוך, וכך "תבין" את שתי השפות טוב יותר.

לתרגם זה לא תמיד מספיק

ההסבר התיאולוגי המפורסם ביותר לריבוי השפות בעולם הוא עונש שניתן לבני האדם על התנהגותם, ובלבול שפתם. מכאן השם בבל, מגדל בבל, וכמובן דג בבל - הדג המפורסם מספרי "מדריך הטרמפיסט לגלקסיה", שמתרגם כל שפה בזמן אמת למי ששם אותו באוזן שלו. לא צריך להאמין באלוהים או בדאגלס אדמס כדי להבין עד כמה חשוב היה, מאז ומעולם, להתמודד עם מאות שפות שמערימות קשיים על יצירת קשרים בין בני אדם.

במציאות של ימינו, לא מדובר בבעיה מדעית תיאורטית, אלא בעניין קריטי. תנועת בני האדם קלה הרבה יותר מבעבר, ומעצבת מחדש את הדמוגרפיה העולמית. מלבד מהגרי עבודה, יש 244 מיליון פליטים ברחבי העולם, ומספרם רק גדל בכל שנה עקב מלחמות, רעב ובצורת קשה. לצדם, אי אפשר לשכוח את הסיבה העיקרית שבגללה ענקיות הטכנולוגיה רוצות כל כך לשלוט בשוק התרגום: ב-2017 לבדה חברות המספקות שירותי תרגום רב-לאומיים הכניסו סכום כולל של 40 מיליארד דולר.

אלא שחשוב לזכור שגם אם בעיית התרגום הסימולטני תיפתר, זה לא אומר שאנשים יתקשרו ביניהם. כששני אנשים רוצים לתקשר ברמה אנושית ומורכבת, לא מספיק רק שיחליפו מילים ומשפטים - מובנים לחלוטין - כדי שיבינו אחד את השני. התרבות שבה חיים האנשים; הקביעה הסובייקטיבית מה ראוי, מצחיק או מוזר, ואיזו מחווה היא פוגענית - אלה דברים שאובדים בתרגום. בשביל זה צריך ללמוד את השפה. 

עוד כתבות

ג'ק דורסי, מייסד טוויטר וסקוור / צילום: Shutterstock, Frederic Legrand - COMEO

היזם שמפטר 4,000 עובדים ביום אחד. מה הוא יודע שאנחנו לא

גל פיטורים נוסף; ג'ק דורסי, ממייסדי טוויטר ומנכ"ל חברת התשלומים האמריקאית בלוק, הודיע בדואר אלקטרוני לבעלי המניות שלו כי החברה תקצץ קרוב למחצית מעובדיה ● בלוק, שנסחרת בבורסת ניו יורק לפי שווי שוק של 33 מיליארד דולר, ייצרה רווח נקי של כחצי מיליארד דולר ברבעון השלישי של השנה שעברה ● המנייה זינקה במסחר המאוחר בכ- 24%

ד''ר אנג'לה עירוני / צילום: דוברות אסותא / עופר חג'יוב

המיילדת שהפכה למנהלת בית חולים והפרשה שהסעירה את המדינה

"לאחר שאח שלי עבר תאונת פגע וברח, שאילצה אותו לעבור ניתוח ראש מסובך, נולד החלום שלי להיות אחות בטיפול נמרץ נוירוכירורגי. לא היה מקום בתל השומר, אז התחלתי בגינקולוגיה" ● שיחה קצרה עם ד"ר אנג'לה עירוני, מנהלת בית החולים אסותא ראשון לציון והמרכז הרפואי אסותא רעננה

בלי נופים, טיולים ואטרקציות: ברוכים הבאים לחופשות השינה / צילום: Shutterstock

עם 16 שעות שינה ובלי אטרקציות: הכירו את טרנד החופשות החדש

סוכריות גומי עם שמן קנאביס, כריות שזוכרות את מבנה הראש וגם מיטות שמנתחות את איכות השינה ● קבוצה הולכת וגדלה של נופשים חיפשה פתרון לעייפות - ופיתחה טרנד שהיא מכנה sleepcation ● תעשיית האירוח מציעה ועוד ועוד שדרוגים, אבל מומחים מזהירים: "זה אינו פתרון משמעותי לחוסר"

עלי חמניאי, מנהיג איראן / צילום: ap

כמעט ארבעים שנה של דיכוי וטרור: מי הוא עלי חמינאי?

לפי הערכות, המנהיג העליון של איראן, עלי חמינאי, חוסל הבוקר במכת הפתיחה של מבצע "שאגת הארי" ● מדובר במהלך דרמטי שעלול לטלטל את מוקדי הכוח בטהרן ולשנות את מאזן ההרתעה האזורי לאחר יותר משלושה עשורים בהם חלש על השלטון

נתב''ג / צילום: Shutterstock

המרחב האווירי נסגר: מה לעשות אם יש לכם טיסה בקרוב?

בעקבות מתקפת המנע באיראן המרחב האווירי של ישראל נסגר ל-48 שעות ● נעצרו המראות ונחיתות ● נוסעים ישראלים שנתקעו בחו"ל מתבקשים ליצור קשר עם חברות התעופה שלהם

סמטת דיאגון מתוך ''הארי פוטר'' באולפני הוורנר ברדרס / צילום: ap, Ross D. Franklin

מהפך דרמטי בארה"ב: בוורנר ברדרס מעדיפים את ההצעה המשופרת של פרמאונט, נטפליקס נסוגה

לאחר שחתמה עם נטפליקס בחודש דצמבר על עסקה שהוערכה בכ-83 מיליארד דולר, חברת וורנר ברדרס מסרה אמש כי הצעתה המשופרת של חברת פרמאונט בסך 111 מיליארד דולר "עדיפה" ● מנכ"לי נטפליקס בתגובה הלילה: "העסקה כבר אינה אטרקטיבית מבחינה כלכלית"

איזו בשורה יקבלו בקרוב 700 אלף עובדי המגזר הציבורי?

מה הם היעדים המבוקשים לרילוקיישן מצד ישראלים עשירים, ומדוע הנגיד הותיר את הריבית על כנה? ● חושבים שאתם בקיאים בכל מה שקרה השבוע בכלכלה בארץ ובעולם? בואו לבחון את הידע שלכם ● החידון הכלכלי של גלובס

וורן באפט / צילום: ap, Nati Harnik

אכזבה ברבעון האחרון של באפט: הרווח התפעולי של ברקשייר נחתך בכ-30%

הרווח התפעולי של ברקשייר האת'ווי צנח בכמעט 30% ברבעון האחרון של באפט ● קופת המזומנים הדשנה של החברה הצטמצמה מעט ל-373 מיליארד דולר ברבעון האחרון

המבורגר שרימפס / צילום: חיים יוסף

לא טרנדית ולא מתחנפת: מסעדה שהיא עדיין אחת הטובות בת"א

המסעדה שייסד אוראל קמחי לפני 13 שנה מציעה אוכל גבוה או פשוט, בצלחות פיין דיינינג או שאוכלים עם הידיים – העיקר שתתענגו

עיבוד: טלי בוגדנובסקי, צילומים: AP,shutterstock

כמה זמן לוקח לכטב"מים להגיע מאיראן לישראל וכמה לטיל בליסטי?

איראן הודיעה כי גל של עשרות כטב״מים נמצא בדרכו לישראל ● כמה זמן ייקח להם להגיע, מה ההבדל בין סוגי הטילים השונים ומה כולל מערך ההגנה האווירית של ישראל? ● גלובס עושה סדר

עשן מתנשא מעל מרכז העיר טהרן לאחר פיצוץ, הבוקר / צילום: Reuters, Anadolu

שעות לפני התקיפה: פלטפורמת ההימורים התחילה לגעוש

בזמן שמערכות המכ"ם התחממו, פלטפורמת "פולימרקט" כבר הראתה זינוק של 100% בהסתברות לעימות ● אחרי שהשוק "סגר את הפינה" על התקיפה האמריקאית הקרובה, השאלה הגורלית על עתיד המשטר ב-2027 נסחרת כעת ביותר מ־50%

תושבים צופים בפטריית העשן כתוצאה מפיצוצים בטהרן, הבוקר / צילום: ap

פיצוצים וענני עשן: התמונות והסרטונים מאיראן

שורה של פיצוצים וענני עשן במספר מוקדים במרכז טהראן מדווחים בשעה האחרונה במדיה האיראנית ● בין היעדים שהותקפו לפי התקשורת במדינה: מגוריו של נשיא איראן, מטה המודיעין הראשי ובעיקר מערכות תקשורת והגנה אווירית ● אלו התיעודים

מייקל ברי

מייקל ברי מזהיר: זוהי "מלכודת המיליארדים" של אנבידיה

למרות תחזית חזקה להמשך, מניית אנבידיה נופלת במסחר בוול סטריט ● מייקל ברי: הסיכון שלה גדל, אנבידיה עלולה להיתקע עם התחייבויות ענק ל-TSMC ועם מלאי שאין לו קונה - מצב שעלול לרסק את שולי הרווח שלה

צחי נחמיאס / צילום: ורד פיצ'רסקי

צחי נחמיאס מכה בברזל החם: הנפקת ענק לאחר דוח חזק

מגה אור מגייסת 615 מיליון שקל בהנפקה פרטית למנורה ומגדל ● ההנפקה מתבצעת בפרמיה של 5% על מחיר הנעילה בבורסה

מתקן נפט באיראן / צילום: Reuters, Essam Al-Sudani

לאיראן יש מהלך אחד שיכול לטלטל את שוק הנפט

המתיחות הביטחונית מחזירה את פרמיית הסיכון לשוק האנרגיה: אף שחלקה של איראן באספקה העולמית הצטמצם לכ-3% בלבד, שליטתה הגיאוגרפית בסמוך למיצרי הורמוז - דרכם עוברים כ-30% מהנפט המשונע בים - מעניקה לה מנוף השפעה משמעותי על המחירים ● תרחיש של פגיעה בנתיבי השייט עלול לזעזע בראש ובראשונה את אסיה, ובמיוחד את סין, אך גם להקפיץ את מחיר הברנט מעבר לרמות שנרשמו בימים האחרונים

יהלי רוטנברג, החשב הכללי באוצר / צילום: יוסי זמיר

הבכיר לשעבר שבטוח: "אנחנו הכי קרובים להשבתת פעילות הממשלה מאי פעם"

כחשב הכללי באוצר יהלי רוטנברג גייס חוב חסר תקדים, התמודד עם הורדת הדירוג הראשונה של ישראל ונדרש לצנן את הוצאות הביטחון: "אמרתי - אל תאלצו אותי לבחור בין צה"ל לעמידה בתקציב" ● עכשיו הוא חושף את הפינות האפלות שדורשות פיקוח - ומתכנן את הטרק בנפאל

אנשים מנסים לתפוס מחסה בעקבות פיצוץ, טהרן הבוקר. ניו יורק טיימס מדגיש כי התקיפה התבצעה בשעת העומס / צילום: Reuters

דיווחים על מבצע שתוכנן חודשים ופינוי חמינאי: כך מתפתח הסיקור העולמי

כלי תקשורת מובילים בארה"ב מדווחים על תקיפות אמריקאיות ישירות, ועל ריכוז כוחות חסר תקדים באזור, הגדול מאז 2003 ● באירופה שונה המסגור הראשוני כדי לכלול את וושינגטון כשותפה מלאה למהלך, וכן דווח כי המנהיג העליון חמינאי הובל למקום בטוח מחוץ לבירה ● הניו יורק טיימס מציין כי התקיפות התרחשו בשעה שמיליונים בדרכם למקומות עבודה ולבתי ספר, וב-CNN מתמקדים גם בהשלכות הכלכליות

דירה להשכרה / צילום: איל יצהר

קפיצה של 40%: למה יותר מ-1,500 משקיעים קנו דירה בדצמבר?

מחירי הדירות תקועים, ושוק השכירות רותח ומזניק את האינפלציה - כמו שקרה גם בעשור שהחל ב-1998 ● אבל בזמן שהשוכרים יושבים על הגדר וסופגים עליות במחירי החוזים, המשקיעים שמזהים את הפרצה וחוזרים לשוק עם מבצעי מימון אגרסיביים וקוצרים תשואות גבוהות יותר

אנשים במקלט בשל מתקפת טילים מאיראן / צילום: ap, Ohad Zwigenberg

מצב חירום במשק: מי רשאי להיעדר מהעבודה והאם מקבלים שכר

בעקבות המתקפה באיראן הוכרז מצב מיוחד בעורף. באילו נסיבות מותר להישאר בבית, האם המעסיק רשאי לפטר עובד שלא הגיע, והאם ממשיכים לקבל שכר – כולל במפעלים המוגדרים "חיוניים"? ● גלובס עושה סדר

פעילות מערכות ההגנה האווירית במהלך מבצע עם כלביא / צילום: משרד הביטחון

הטילים האיראניים שמאיימים על ישראל, ומערכות ההגנה נגדם

איראן מאיימת בתגובה חריפה אחרי התקיפות הישראליות והאמריקאיות ● מהן מערכות ההגנה האווירית הישראליות, אילו טילים נמצאים בארסנל האיראני, ומה קורה אם האיומים מגיעים מכיוון הים? ● גלובס עושה סדר