ג'נסיס רובינסון היא מבקרת היין הבכירה של בריטניה. בין טור שבועי לעיתון "הפייננשל טיימס" הלונדוני לייעוץ למלכה אליזבת על ניהול מרתף היינות הפרטי, רובינסון עורכת מדי שנה בבלוג שלה תחרות שנתית נחשבת למאמרים קצרים של 500 עד 2,000 מילה, על יין.
יואב שוהם, פרופסור למדעי המחשב וחובב יין נלהב בעצמו, החליט לשלוח בשנה שעברה מאמר משלו לתחרות של רובינסון. רק ששוהם לא התכוון לכתוב את המאמר בעצמו, או לפחות - לא לגמרי. שוהם כתב סך הכול שישה משפטים, שאותם הוא הזין אל המחולל "חיימק'ה" (HAIMKE) שפיתחה החברה שלו, AI21 Labs, ששמה לה ליעד לשנות באמצעות בינה מלאכותית את האופן בו האנושות כותבת. על בסיס ששת המשפטים האלו חיימ’קה המחולל יצר חיבור של 560 מילה, מספיק בדיוק להיכנס לתחרות של רובינסון.
המשפטים שהזין שוהם לחיימ’קה תיארו את השינוי שעבר עליו כחובב יין, מאהבתו המוקדמת ליינות אוסטרליים לחיבה המאוחרת שפיתח ליינות מהעולם הישן. "היום המרתף שלי כולל שילוב כמעט שווה של יינות מקליפורניה, בורדו ובורגונדי", כתב שוהם במשפט האחרון שלו. המחולל חיימ’קה הוסיף מצדו את המשפט "אתה יכול לבחור בין סוגים שונים, שיטות הכנת יין שונות ויינות שונים", ואחר כך חתם את החיבור כולו במשפט "לאורך הקריירה שלי למדתי להעריך את המגוון הרחב שמקיף אותנו. היום אני חושב יותר - ושואל יותר שאלות".
"האמת שבסוף זה יצא מאמר לא רע בכלל", אומר שוהם. "הפילוסופיה שלנו היא לא של ‘שגר ושכח’, אלא של שיתוף פעולה, לכן חיימ’קה הציע לי רעיונות ואני אמרתי לו מה מתאים לדעתי ומה לא. במקומות מסוימים ביקשתי ממנו לקצר, ובמקומות אחרים להאריך. היינו בדיאלוג".
המאמר שכתבו שוהם וחיימ’קה לא זכה בתחרות, ואם להודות על האמת - היה רחוק ברמתו מהחיבורים שיצרו כותבים אנושיים מיומנים. אך הוא היה טוב מספיק להפחיד את רובינסון, שתהתה אם מבקרי יין אנושיים כמוה הולכים והופכים למיותרים. חשש דומה התעורר אצל כותב שורות אלה לגבי עתיד המקצוע הפרטי שלו ככותב ועיתונאי. "חיימ’קה הוא רק גרסת דמו, והחלטנו שלא לשחרר אותו כמוצר", מרגיע שוהם, אבל מודה: "זה מראה לך את הכיוון שאנחנו הולכים בו".
"בשפה הכול קשור להכול"
שוהם (65), פרופסור למדעי המחשב מאוניברסיטת סטנפורד, נחשב לאחד המומחים המובילים בעולם בתחומי הבינה המלאכותית, וב-2019 זכה בפרס היוקרתי של כנס הבינה המלאכותית הבינלאומי על הצטיינות מחקרית. אולם לאורך השנים שוהם ממש לא הסתפק במחקר תיאורטי במגדל השן האקדמי, ובנה במקביל קריירה מצליחה כיזם, שבמהלכה רשם שורת אקזיטים.
החברה הראשונה שהקים שוהם בעמק הסיליקון ב-1998 הייתה טריידינג דיינמיקס (Trading Dynamics), שפיתחה מערכת לניהול מכירות פומביות אונליין. שנה לאחר היווסדה, החברה כבר נמכרה תמורת כ-450 מיליון דולר.
שתי החברות הבאות שייסד שוהם - קטנגו, שפיתחה אלגוריתם לשיפור האינטראקציה של משתמשים ברשתות חברתיות, וטיימפול לסיוע בניהול משימות (שהקים עם פרופ’ דן אריאלי) - נמכרו שתיהן לגוגל בעשרות מיליוני דולרים. בעקבות המכירה של טיימפול שוהם אף מונה למדען ראשי בגוגל.
אחרי שפרש מגוגל וסטנפורד וחזר להתגורר בישראל, הקים שוהם ב-2017 את AI21 Labs (חיבור של AI - בינה מלאכותית, ו-21, כלומר המאה ה-21) במטרה לפתח כלים אוטומטיים לשדרוג והעצמת תהליך הכתיבה. הוא הקים את החברה עם היזם אורי גושן, שגם ברקע שלו כבר יש אקזיט אחד של חברת CrowdX, והשניים מכהנים כמנכ"לים משותפים של החברה. שנה לאחר ההקמה הצטרף לשוהם וגושן משקיע ושותף עם שם גדול אפילו יותר - פרופ’ אמנון שעשוע, מייסד מובילאיי ואורקם (שמפתחת מכשיר סיוע לעיוורים ולקויי ראייה).
"אמנון הוא שותף מאוד פעיל. הוא לא רק משקיע כסף, אלא ממש בא לעבודה. הוא ידען גדול בתחום של למידה ממוחשבת, אז יש כאן שיתוף פעולה מאוד פורה", מבהיר שוהם.
"מבחינתי לא מדובר בעוד השקעה פיננסית, אלא בכניסה לתחום עשייה חדש שהוא מרתק ומהפכני", מאשר שעשוע. "תחום למידת שפה הוא החזית הבאה של בינה מלאכותית כללית, וההתקדמות בתחום בשנתיים האחרונות מראה סימנים שניתן יהיה לפצח את היעד של מחשב שמבין טקסט וכותב טקסט".
בעוד מובילאיי ואורקם של שעשוע מתבססות על טכנולוגיות של ראייה ממוחשבת ועיבוד תמונה, AI21 Labs מתמודדת עם אתגר של עיבוד שפה טבעית (NLP). לדברי שוהם זה הרבה יותר מורכב.
"הבעיה בראיה ממוחשבת היא זיהוי עצמים וקטגוריזציה. אתה צריך להחליט האם יש כאן הולך רגל או שאין, האם אלו הפנים שלי או לא. זה נכון שהפנים שלך שונות כשאתה חובש משקפיים או כשאתה פונה שמאלה וימינה, ועדיין מדובר בבעיה מקומית, כי כל מה שנמצא מסביב לפנים אינו רלוונטי", מסביר שוהם. "לעומת זאת לשפה אין תכונה כזו. בשפה הכל קשור להכל, וכדי להבין אפילו משפט פשוט אתה צריך להבין קשר סיבתי בין מאורעות ואת המצב המנטלי של הדוברים. זה לא מקרי ששפה היא דבר שייחודי למין האנושי וראייה משותפת לכל בעלי החיים. אני תמיד אומר שראיה ממוחשבת נותנת לך מבט אל העין האנושית, אבל שפה ממוחשבת נותנת לך מבט למוח האנושי".
כדי לפצח את האתגר השפתי גייסה AI21 עד היום כ-35 מיליון דולר בשני סבבים ממשקיעים כמו קרן פיטנגו, קרן TPY Capital ומשקיעים פרטיים, ובהם שלמה קרמר וכמובן שעשוע עצמו. כיום מעסיקה AI21 כ-50 עובדים במשרדיה במגדל המאה במרכז תל אביב. "היה לנו מזל לגייס צוות באיכות אחידה וגבוהה, שזה משהו שאני לא ראיתי כמותו עד היום. זאת סיירת שהיא העילית של העילית", מצהיר שוהם. "אני חייב להודות ששני שלישים מהעובדים שלנו הם יוצאי 8200, רבע הם בוגרי דוקטורט ורבע עם תואר מאסטר. אנחנו משעממים וסטנדרטים במובן הזה".
לא סתם מתקן שגיאות אוטומטי
ב-2019, AI21 שחררה שני מוצרי דמו ראשונים באתר שלה - "חיים" (HAIM), מחולל שמשלים טקסט על פי משפט פתיחה וסיום שמזינים אליו, ו"חיימ’קה", שכאמור בונה מאמר על סמך מספר משפטי מפתח שמזינים אליו. אלו היו רק מוצרים להדגמת היכולות ולמידה: המוצר המסחרי הראשון של AI21, וורדטיון (Wordtune), הושק רשמית רק בסוף 2020.
וורדטיון הוא תוסף לדפדפן שמציע הצעות לשכתוב טקסטים שנכתבים בגוגל דוקס, בג’ימייל, בפייסבוק או ביישומים אחרים. צריכים לנסח מייל לקולגה? לאחר שתכתבו משפט או פסקה יציע וורדטיון הצעות עריכה, חלקן דומות למקור ואחרות שלוקחות את המשפט קדימה ומרחיבות את המשמעות הראשונית. אם תכתבו למשל את המשפט "אני אוהב נערה שלא אוהבת אותי", תקבלו גם אפשרות לכתוב במקום: "זה מתסכל לאהוב נערה שאיננה מחבבת אותי", למשל.
וורדטיון / צילום: צילום מסך
וורדטיון תומך היום בטקסטים באנגלית, אך מאפשר להכניס גם מילים בשפות אחרות, כולל עברית, כשהתוכנה מתרגמת אותן אוטומטית ומשלבת בטקסט. וורדטיון מגיע בגרסה חינמית או באופציית פרמיום בתשלום של 9.99 דולר לחודש, שכוללת יכולת לשלוט על אורך המשפטים (אידיאלי למי שרוצה לדחוס מחשבות מורכבות לציוץ מוגבל בתווים בטוויטר) ועל מידת הפורמליות שלהם; להשוות את הניסוח לדוגמאות, ואפילו למצוא מילים שנמצאות "על קצה הלשון", ואתה פשוט לא מצליח להיזכר בהן במהלך הכתיבה.
"במשך שנתיים וחצי עבדנו על הטכנולוגיה ולא הוצאנו מוצר", מסביר שוהם. "בתקופה הזו בנינו מודל שפה מאוד עשיר שיודע לומר על סמך ההסתברות מה הסיכוי לקבל משפטים מסוגים שונים כמו ‘קמתי בבוקר ואכלתי ארוחת בוקר’ לעומת ‘קמתי בבוקר ואכלתי ארוחת ערב’. על זה בנינו אלגוריתמים מאוד עמוקים. אנחנו אמנם לא מפרסמים הרבה מאמרים, אבל נמצאים בשורה הראשונה של מעבדות המחקר בעולם. בכל מקרה לא רצינו להישאר רק מעבדת מחקר מובילה, אלא גם להביא ערך מסחרי לעולם, ולכן לפני שישה חודשים השקנו את וורדטיון, שהוא היישום הראשון של הטכנולוגיה שלנו ויהיו עוד בקרוב".
אם רוצים להעליב את שוהם, כנראה שאין דרך טובה יותר לעשות זאת מאשר לתאר את וורדטיון בתור מתקן שגיאות כתיב או דקדוק. "לתקן שגיאת כתיב פשוטה זה משהו שכל בר בי רב יכול לעשות, וגם אנחנו עושים אותו על הדרך, ודרך אגב עושים יותר טוב מהמתחרים, כי אנחנו מבינים את ההקשר הכולל של הטקסט", מבהיר שוהם. "אבל המטרה שלנו היא לא להיות רק השוטר הרע שבודק את הטעויות שלך, אלא לעזור לך להביע את המחשבות הכי כמוסות שלך בצורה הכי אותנטית.
"אם אנגלית היא לא שפת האם שלך, אתה מקבל כאן דרכים מאוד עשירות להביע את המחשבות שלך. גם אם אתה כן דובר אנגלית, וורדטיון יכול לעזור לך לדייק ולזקק את המחשבות שלך ולמצוא את המילים הכי נכונות שלא חשבת עליהם כדי להביע את מה שיש לך בראש. אנחנו שומעים מהרבה משתמשים שוורדטיון ניחשה בדיוק את מה שהם רצו להגיד".
וורדטיון הוא כלי מרשים, ואחד המאפיינים יוצאי הדופן שלו היא כמות אופציות העריכה שתקבלו על כל משפט שתכתבו. קחו לדוגמא את המשפט "אני חושב שלהיות מאוהב זה דבר נהדר", וורדטיון יציע תחילה שינוי תחבירי מינורי כמו "להתאהב זה נפלא", אך הוא גם ילך איתכם צעד קדימה ויציע אופציות כמו "להיות במערכת יחסים זה נפלא", "נישואים מאושרים גורמים לי להרגיש נהדר", או אפילו משהו כמו "הדבר הכי טוב לגבי אהבה הוא להרגיש מוערך", למקרה שלכך התכוונתם בעצם.
אתם נותנים המון אופציות לשכתוב הטקסט, למה לא להסתפק באלטרנטיבה אחת או שתיים?
"אנחנו לא השופט שמכריע איזו מילה נכונה. הכותב הוא אתה ואלו המחשבות שלך. אנחנו מנסים להציג לך את הדרכים השונות להביע את מה שאולי רצית לומר, אבל זה לא חד-ערכי. כדי ליצור מגוון כזה היינו צריכים לעבוד קשה, כי אחרת כל האופציות היו נראות אותו דבר עם שינוי של מילה פה ושם. אנחנו מנסים שהאופציה הראשונה או השנייה יהיו בעלות הסיכוי הכי טוב לפגוע, אבל לפעמים דווקא הרביעית והחמישית הן אלו שהכי יתאימו".
צייר לי אבטיח
הסטארט-אפ AI21 הוא רק חלק מהשקעות הענק שזורמות בשנים האחרונות לעולם של עיבוד שפה טבעית, תחום שכל ענקיות הטכנולוגיה העולמיות פועלות בו, כולל גוגל, פייסבוק ואמזון. עם כל הכבוד לענקיות, השם החם והסקסי ביותר בתחום זה הוא דווקא מעבדת OpenAI מסן פרנסיסקו, שאחד ממייסדיה הוא אלון מאסק. המעבדה קיבלה ב-2019 השקעה של מיליארד דולר ממיקרוסופט, ובשנה שעברה שחררה במהדורה מוגבלת את מודל השפה העדכני ביותר שלה, GPT-3, שהתקבל בהתלהבות שיא. GPT-3 אומן על לא פחות מטריליון מילים ממקורות שונים, ומקבל כל החלטה על פי 175 מיליארד פרמטרים שונים, פי מאה מהגרסה הקודמת.
משתמשים ברי מזל שזכו להיחשף ל-GPT-3 הציגו ברשתות החברתיות את היכולות יוצאי הדופן שלו. GPT-3 מבין פקודות מורכבות כמו "צייר כפתור שנראה כמו אבטיח", ומגיב בציור עיגול עם מילוי ורדרד ושוליים ירוקים שבמרכזו המילה אבטיח. GPT-3 מצליח לקבל הערות גסות ולהפוך אותן למנומסות, וגם להפך. GPT-3 מצטיין עד כדי כך בהבנת טקסט, עד שהוא מצליח לחלץ מספרי הארי פוטר אזכורים בהם הדמויות מבצעות מעשים הירואיים. המשורר האמריקאי אנדרו בראון צייץ כי נתן ל-GPT-3 הוראה לכתוב שיר מנקודת מבט של ענן שמסתכל על שתי ערים שנלחמות זו בזו. "אני חושב שאתחיל להוריד גשם, כי לא נראה לי שאסבול את הכאב, לראות את שניכם, נלחמים כמו שאתם", הייתה התוצאה.
אבל GPT-3 הוא הרבה יותר מקוריוז חביב, ומאז הושק לפני קצת פחות משנה כבר הוטמע במעל 300 אפליקציות בתחומים שונים. האפליקציות משמשות כדי להפיק תובנות מתוך פידבק של לקוחות, ליצור סיפורים אינטראקטיביים, ולחפש תוכן רלוונטי.
ב-AI21 השתמשו בתחילת הדרך במודל השפה של OpenAI לפני שפיתחו מודל עצמאי משלהם. ועל אף שהיא מתמודדת מול ענקיות ממומנות היטב, שוהם מאמין ש-AI21 יכולה לנצח. "גם אנחנו גייסנו כסף ויכולנו לגייס יותר אם היינו רוצים. אנחנו עובדים חכם, מאמנים את המודלים ביעילות, ומקבלים החלטות נועזות במהירות", אומר שוהם. "יש לי הרבה כבוד והערכה למתחרים שלנו אבל אין לנו רגשי נחיתות".
"אנחנו נמצאים רק בתחילת הדרך ומבחינתנו מדובר על ריצה למרחקים ארוכים", מוסיף גושן. "אנחנו מתכוונים להמשיך לפתח מוצרים נוספים ולהפיץ אותם בצורה מסיבית בשוק כך שכל קורא וכותב בעולם יוכל להיות מועצם על ידי בינה מלאכותית".
עד כמה וורדטיון זוכה כיום להצלחה? שוהם מסרב למסור את מספר המשתמשים שכבר נעזרים בה, אך לדבריו "מדובר במספרים מאוד יפים, גם מבחינת מספר המשתמשים וגם מבחינת רצינות השימוש, במיוחד שעדיין לא עשינו שיווק בכלל". לדבריו גם הוא עצמו הספיק להתמכר ליישום. "כמו שלפני שאני מוציא הודעה לעובדים או לעיתונאים, אני אבדוק שאין לי שגיאות כתיב, אז עכשיו אני אלך לוורדטיון שלי כדי לראות אם אולי יש משהו שאפשר להביע בצורה טובה יותר. זה לוקסוס שפתאום לכולנו יש עורך לשוני פרטי, כמו שיש בספרות ובעיתונות".
ומה הלאה, המחשב ייקח בהדרגה יותר ויותר מעבודת הכתיבה?
"אני חושב שזה קצת כמו עוזר חכם בהרבה תחומים אחרים, כשעם הזמן אתה לומד להאציל עליו יותר סמכויות ולהיעזר בו. זה נותן לך את הלוקסוס להתמקד בדברים שיש לך בהם ערך מוסף. הנושא של תיקון שגיאות כתיבה כבר נפתר, ולאט לאט עוד נושאים נפתרים. העוזר נהיה יותר חכם ואתה לומד לסמוך עליו. המכונה הגיעה היום לשלב שהיא יכולה להיות שותפה כזו לחשיבה שלך".
ובכל זאת לפני סיום אני לא יכול שלא לחזור לתהייה האישית-קיומית, האם בסופו של דבר המקצוע שלי ושל שאר האנשים שעוסקים בכתיבה נמצא בסכנה? האם בשלב מסוים מחשב יוכל להחליף אותנו ברוב או כל משימות הכתיבה?
"אני זוכר שכתבת אמריקאית שאלה אותי שאלה דומה, ואני אמרתי לה שהיא צריכה ליהנות מהמקצוע שלה כל עוד הוא קיים", צוחק שוהם אל מול פני הנדהמות. "אבל זה לא באמת. אני לא חושב שאתה תהפוך למיותר, אבל כן שהמקצוע שלך ישתנה. כבר היום יש כתבות רוטיניות בתחומי ספורט ופיננסים שאפשר לייצר ללא יד אדם, אז אוטומציה תוריד מאתנו את העול של הדברים היותר רוטיניים, וגם תעצים אותנו במשימות המעניינות. יש לי המון כבוד למין האנושי ולכן אני לא מצפה שהמכונה תחשוב במקומנו, אבל אני כן מצפה ומאמין שהמכונה תחלץ מחשבות מהראש שלי ותעזור לי לבדוק אם הסקיצה שכתבתי מסתדרת לוגית. הדברים האלה הם בהחלט בהישג יד. אני אכתוב ראשי פרקים והמכונה תיתן לי סיכום של הכל, שאותו אוכל לעדכן ולשפר".
אמנון שעשוע (60)
פרופסור למדעי המחשב עם התמחות בראייה ממוחשבת ולמידה חישובית. הקים את מובילאיי, שנמכרה ב־15.3 מיליארד דולר לאינטל, וכן את הסטארט־אפ חד־הקרן אורקם, שמפתח משקפיים ללקויי ראייה, ואת הבנק הדיגיטלי הראשון בישראל
יואב שוהם (65)
פרופסור למדעי המחשב מאוניברסיטת סטנפורד, אחד מהמומחים המובילים בעולם לתחומי הבינה המלאכותית. מכר שלוש חברות, שתיים מהן לגוגל, וכיהן כמדען ראשי בענקית הטכנולוגיה
אורי גושן (35)
בוגר 8200, יזם ואחד ממייסדי CrowdX, שפיתחה אפליקציה המנטרת את רמות הקרינה של מכשירי סמארטפון בעת שיחה, ונרכשה ב־2016 על ידי סלוויז באקזיט פנים־ישראלי