גלובס - עיתון העסקים של ישראלאתר נגיש

אם ה-AI כל כך חכמה, למה היא לא מבינה עברית

הכלים החדשים כבר יכולים לעשות כמעט הכול - משליחת מייל, דרך כתיבה של קורות חיים ועד דוקטורט ● אז למה כל כך קשה לעברת אותם? ● מהפכת הבינה המלאכותית

מתי הבינה המלאכותית תלמד עברית? / עיצוב: טלי בוגדנובסקי
מתי הבינה המלאכותית תלמד עברית? / עיצוב: טלי בוגדנובסקי

האפשרויות הגלומות בכלי הבינה המלאכותית נראות גדולות עד כדי כך שבעתיד הם יוכלו להחליף עובדים בתחומים רבים. עם זאת, הכלים שמצליחים לספק תוצר טוב שחוסך זמן ומשפר את הפרודוקטיביות, עובדים ברובם באנגלית או סינית, ולא בעברית. אפילו חברות ישראליות שמפתחות כלים כאלו מכוונות לשוק העולמי ומפתחות כלים בשפה אחרת. למה הבינה המלאכותית לא מבינה עברית מספיק טוב ומה צריך לקרות כדי שהטכנולוגיה שמשנה את העולם תעשה עלייה?

הבעיות: מעט מידע, מעט תמריצים

פרופ' אביב גאון, מבית ספר הארי רדזינר למשפטים באוניברסיטת רייכמן, אומר בשיחה עם גלובס: "למה בינה מלאכותית אינה פועלת בעברית? זו נקודה כואבת. הרי איך מערכות בינה מלאכותית עובדות? באמצעות מסדי נתונים שהמערכת מאומנת עליהם. היא מאומנת על מערכי מידע שכוללים גם עברית, ולכן ישנם כלים עם יכולות בעברית. הבעיה היא שהמערכות הללו לומדות על בסיס מידע קיים או על בסיס אינטראקציות ומעורבות. משמע, שפות עם מעט דוברים, כמה מיליונים בודדים, יהיו חלשות יותר משפות כמו אנגלית או סינית".

אז איך המודל אמור להשתפר? "ככל שיהיו יותר ויותר שאילתות, המודלים ילכו ויתקדמו. נכון לעכשיו יש פחות מערכי מידע בעברית ולכן איכות הדאטה נמוכה", מסביר פרופ' גאון.

מחלקת ייעוץ וחקיקה (אזרחי) במשרד המשפטים בראשות עו"ד כרמית יוליס פרסמה לאחרונה חוות דעת לגבי היקף הזכויות של מיזמי למידת מכונה לשימוש בתכנים מוגנים בזכויות יוצרים. חוות הדעת נכתבה על ידי עו"ד ד"ר ליטל הלמן, בליווי עו"ד הווארד פולינר, ראש אשכול קניין רוחני. למעשה, בעבודת המחקר שלהם התייחסו גם לחסמים שיש במדינת ישראל, מה שיכול להצביע על המצב הקיים.

ד"ר הלמן מפרטת בשיחה עם גלובס את החסמים שהם זיהו: "ראשית, קיים חסם מידע. דוברי השפה מעטים, ואין מספיק מידע כדי להתבסס עליו. שנית, יש חסם משפטי. להבדיל מאנגלית, שבה יש המון מידע שאפשר להתבסס עליו שאינו מוגן בזכויות יוצרים, בעברית אין לנו את האפשרות הזו. בעניין זה, חוות הדעת שלנו קובעת שמותר להשתמש במידע שמוגן בזכויות יוצרים למעט מצבים מיוחדים - כמו ניסיון חיקוי לסופר או למספק שירות".

החסם השלישי והאחרון הוא חסם התמריצים: "חברות ישראליות רוצות לעשות אקזיט או לגייס כסף, ולכן אין סיבה שהן יעבדו על מודלי שפה בעברית, אלא יעדיפו ללכת לאנגלית או לסינית".

הנה דוגמה מהשטח. לחברת AI21 Labs הישראלית יש שני מוצרים, אחד לכתיבה (שמציע פיצ'רים כמו שכתוב הטקסט והצעת חלופות), ואחד לקריאה (שמסכם טקסט ארוך לקטעים קצרים). אורי גושן, מנכ"ל משותף בחברה, מודה שגם במוצרים שלהם יש בעיה בשפה העברית. "מדובר בתכונה אינהרנטית של מודלי שפה ובדרך בה מאמנים אותם", הוא מסביר. "לוקחים את כל הקורפוס האינטרנטי (מאגר טקסטים המשמש לניתוחים ומחקר, נ"ט) ונותנים למערכת לחזות את המילה או רצף המילים הבאות. אנחנו חברה מסחרית, כך שרוב השוק בשפות אחרות ובלבד בשפה האנגלית".

תפקיד הממשלה: מי יביא את המהפכה לישראל

אם המגזר העסקי לא יביא את הבינה המלאכותית לדבר עברית, איך המהפכה הטכנולוגית תגיע לישראל במלואה? פרופ' גאון טוען שהממשלה חייבת להידרש לבעיה: "יש כאן כשל שוק. משרדי הממשלה נדרשים להשקיע כאן בצורה שתפצה על המוטיבציה החסרה של החברות, כדי שיהיה אפשר להנגיש את המוצרים לשוק הישראלי. למדינה צריך להיות אינטרס לסייע כאן בין אם בתקצוב, בתמריצים או בהשמשת מידע".

הפתרונות: המדינה לצד ענקיות הטק

עד היום, רוב פתרונות הבינה המלאכותית בעברית הגיעו מהשוק הפרטי, וליתר דיוק מענקיות הטק. אורי אליאבייב, יועץ בתחום ה־AI ומייסד קהילת MDLI, מבהיר כי חזון הבינה המלאכותית בעברית רחוק מלהתממש בקרוב. עם זאת, "אנחנו רואים בשנים האחרונות פיתוחים נוספים שכן כוללים עברית. החל ממודלי תרגום גדולים שתומכים ב־200 שפות ועברית היא אחת מהן, ועד ליכולות תמלול טקסט שהציגו ענקיות הטכנולוגיה. חברות אלה, באמצעות המשאבים הגדולים שלהן, מכניסות תמיכה בעברית 'על הדרך', בזכות כוח החישוב העצום שיש להן והדאטה שנגיש להן".

בתקופה האחרונה החלה גם המדינה לקדם מהלכים. בתוכנית הלאומית לבינה מלאכותית יש פרק משמעותי שעוסק בנושאי עיבוד שפה טבעית בעברית וערבית. התוכנית פועלת במסגרת פורום תל"מ (הפורום לתשתיות לאומיות למחקר ולפיתוח) המשלב את רשות החדשנות, מפא"ת במשרד הביטחון, אגף התקציבים במשרד האוצר וגופים נוספים.

זיו קציר, מנהל תוכנית הבינה המלאכותית הלאומית, מתאר כי "בתוכנית יש פרק שלם שעוסק ב־NLP (עיבוד שפה טבעית), שאוסף דאטה ומאמן את המודלים בכל אחת משתי השפות. הקו המנחה הוא שהממשלה תייצר תשתיות, את מודל השפה שכולל תמצות, הקשר, סנטימנט ועוד, ואז חברות מסחריות יוכלו להשתמש בו".

למעשה, התוכנית בונה כיום את המודל הסטטיסטי הראשוני לשפות העברית והערבית, ממנו יוכלו חברות לייצר תוכניות הקראה, ניווט, שירות לקוחות או כתיבת עבודות אקדמיות. קציר מוסיף: "אנחנו עושים משהו שהוא קרוב לקוד פתוח, יהיה זמין לכל מי שרוצה לבוא ולפתח".

ההשקעה במיזם עומדת על 180 מיליון שקלים, ולדברי קציר, "אנחנו מאמינים שנראה תוצרים בערך בתוך שנה. לצד המטרה לתמרץ את התעשייה, אנחנו רוצים להנגיש מאגרי מידע ייחודיים שיש בישראל, למשל בתחום הרפואה, שכיום אי אפשר להשתמש בהם כי הם בעברית".

מיזם נוסף מקדם מערך הדיגיטל הלאומי, שמנסה לסייע לחברות שרוצות מידע שאפשר להשתמש בו כדי לאמן את המודלים. החודש פרסם מערך הדיגיטל כי בשילוב האקדמיה ללשון העברית, הם משחררים קורפוס מתויג של עברית בת־זמננו בקוד פתוח ונגיש לתעשייה ולמחקר. גם כאן, המטרה היא לייצר תשתית לצורך אימון מודלים בעברית.

עוד כתבות

אלי כהן, מנכ''ל אוניברסיטת קריית שמונה והגליל בהקמה, בכנס שמים את הצפון במרכז / צילום: שלומי יוסף

מנכ"ל אוניברסיטת תל חי: "הכפלנו את המספר הבוגרים שנשארים בצפון, אבל היעדר התעסוקה מקשה"

"הגורם המרכזי שמקשה על הבוגרים שלנו להישאר הוא התעסוקה", כך אמר מנכ"ל האקדמית תל חי, אלי כהן, בכנס שמים את הצפון במרכז של גלובס ● עוד הוא ציין כי "יש אוניברסיטאות בחיפה, אבל חיפה זה לא באמת הצפון מבחינתנו, זה לא המטרופולין שלנו"

יהודה מורגנשטרן, מנכ''ל משרד הבינוי והשיכון, בכנס שמים את הצפון במרכז / צילום: כדיה לוי

מנכ"ל משרד הבינוי והשיכון על מחירי הדיור: "כופר בזה שיש עליות"

בכנס שמים את הצפון במרכז של גלובס אמר יהודה מורגנשטרן כי ההסכם המתגבש עם קריית שמונה הוא חלק מתוכנית השקעות של עשרות מיליארדי שקלים בצפון • עם זאת הוא התריע ש"אנחנו מאבדים את הצפון", וקרא להציב יעד ממשלתי ברור לאזור

ביל גייטס, וורן באפט, ביל אקמן, קתי ווד / צילום: ap, Brendan McDermid, Richard Brian,  Andres Kudack, Nati Harnik,

משקיעי העל חושפים את ההשקעות שלהם, לפחות על מניה אחת הם חלוקים

וורן באפט ודיויד טפר מכרו את אמזון, וביל אקמן כהרגלו חושב אחרת ● מגמות סותרות נרשמו גם במניות אלפאבית, אך על מטא נרשמה הסכמה גורפת ● קת'י ווד לא מפסיקה להאמין בקריפטו ● ומי שוב רוכש מניות של עיתון?

רעננה / צילום: Shutterstock, defotoberg

פסק הדין שמחייב את הרשויות המקומיות בתשלום מס חדש

עיריית רעננה תחויב במס רכישה בגובה 34 אלף שקל על שטחים ציבוריים שקיבלה במסגרת תוכנית יזמית, לאחר שוועדת ערר דחתה את טענתה להפקעה ● ההכרעה עשויה להשפיע על מחלוקות דומות המתנהלות מול רשויות נוספות בפרויקטים ברחבי הארץ, וברשות המסים מעריכים כי הסוגיה תתגלגל לבסוף לפתחו של העליון

משה דוידוביץ', ראש מועצה אזורית מטה אשר / צילום: שלומי יוסף

משה דוידוביץ: "צריך להפסיק לדבר על שיקום ולדבר על צמיחה"

בכנס שמים את הצפון במרכז של גלובס, דיברו ראש עיריית קריית שמונה אביחי שטרן וראש מועצה אזורית מטה אשר משה דוידוביץ’ על הצורך להפסיק להסתפק בשיקום בלבד ולפעול למימוש הצמיחה בצפון ● השניים הצביעו על הצורך בתמריצים למפעלים, השקעה בתשתיות והקמת עוגני צמיחה כמו מקומות תעסוקה, אוניברסיטאות ובתי חולים

כנס שמים את הצפון במרכז

שמים את הצפון במרכז: איך אפשר לשקם את הכלכלה?

הכנס, שמתקיים זו השנה השלישית בשיתוף בנק לאומי ושטראוס, עוסק בנושא כלכלת הצפון: תעשייה, עסקים מקומיים, בנייה ותשתיות ● בכירים ברגולציה ובשוק לצד נציגי הקהילות המקומיות דנים בפתרונות האפשריים

בשר בסופרמרקט / צילום: תמר מצפי

האסדרה בשוק הבשר שתוריד את המחירים ב-15%

במשך שנים הרגולציה במדינת ישראל אסרה על מכירת בשר טחון שהגיע טחון מהמפעל ברשתות השיווק ובקצביות ● בקרוב - בעקבות עבודת מטה משותפת בין משרד החקלאות, רשות האסדרה ומשרד הבריאות - זה הולך להשתנות

יעקב אטרקצ'י, מנכ''ל ובעלים אאורה, בכנס שמים את הצפון במרכז / צילום: שלומי יוסף

יעקב אטרקצ'י: "הנגיד צריך להוריד ריבית, עודף שמרנות זו פחדנות"

בכנס שמים את הצפון במרכז של גלובס הציג מנכ"ל ובעלי אאורה, יעקב אטרקצ'י, אופטימיות לגבי הבנייה בפריפריה וטען כי הביקושים מחוץ לגוש דן נותרו חזקים • לדבריו, "95% מהציבור לא יכול לקנות דירה בת"א", ולכן העתיד נמצא בצפון ובדרום • לצד זאת הוא מתח ביקורת חריפה על נגיד בנק ישראל: "במצב של צמיחה ואינפלציה מרוסנת – הוא עושה מעט מדי ומאוחר מדי"

אוניות מטען בנמל עקבה, ירדן / צילום: Shutterstock

עשרות מיליונים למשך 30 שנה: אבו דאבי מהמרת על נמל עקבה

חברת הנמלים AD Ports חתמה על הסכם תפעול ארוך טווח בנמל הירדני ● למרות הנחיתות מול נמלי הים התיכון והאיום הביטחוני, האמירתים מזהים פוטנציאל בעורק החיים הראשי של הממלכה

"האזור מת כלכלית": הקשיים אצל השכנה של ישראל

גלובס מגיש מדי יום סקירה קצרה של ידיעות מעניינות מהתקשורת העולמית על ישראל • והפעם: ארה"ב רוצה לצמצם את כמות הנפט שאיראן מוכרת לסין, מתיחות בגבול לבנון, ואיך נראות חגיגות הרמדאן בעזה • כותרות העיתונים בעולם

וול סטריט / צילום: ap, Mary Altaffer

עליות בוול סטריט; הישראלית שמזנקת, וזו שנופלת ב-40%

אנבידיה תספק למטא מיליוני יחידות עיבוד גרפי ● מחירי הנפט מזנקים, הדולר מתחזק מול סל המטבעות ● מניית גלובל אי מזנקת בעקבות הדוחות, סולאראדג' נופלת ● סקר של בנק אוף אמריקה: מספר שיא של משקיעים סבור כי ההשקעות ב-AI מופרזות ● פרוטוקול הפד: חברי הפד היו חלוקים לגבי המשך מדיניות הריבית, ייתכן שהן ימשיכו בהמשך השנה אם האינפלציה תתנהג בהתאם לציפיות

מטוס Ryanair / צילום: ryanair

החל מ-120 דולר: החברות שהסתערו על הקו הרווחי של החברה שנטשה את ישראל

בקיץ הקרוב היצע הטיסות לאיטליה יגדל בזכות תחרות גוברת של חברות התעופה על היעדים ● החברות זיהו את הפוטנציאל, בין היתר בזכות היעדרה של ריינאייר, והחלו בהשתלטות על הקווים ליעדים שהפעילה בעבר ● וגם: חברת הלואו קוסט שתגביר את התחרות בטיסות לגרמניה

מיכה קאופמן, מנכ''ל ומייסד פייבר ואור עופר, מייסד ומנכ''ל סימילרווב / צילום: יואב הורנונג, איל יצהר

שתי הישראליות שנופלות בוול סטריט אחרי פרסום הדוחות

סימילרווב אכזבה את השוק עם התחזיות שפרסמה בדוחותיה, והמניה נופלת בחדות במסחר המוקדם ● פייבר סיפקה תוצאות מעורבות, וגם המניה שלה מגיבה בירידות ● מנכ"ל פייבר: "אנו נמצאים בעיצומו של שינוי משמעותי באופן שבו ארגונים מאמצים AI"

מוצאים פתרונות לכלכלת הצפון: הרגעים והתמונות מכנס גלובס

כנס שמים את הצפון במרכז של גלובס חיבר בין כ-250 משתתפים מהקהילה העסקית, הרגולטורית והציבורית לדיון על כלכלת הצפון, תעשייה ובנייה ● בין ההרצאות והסדנאות התקיימו סיורים ביטחוניים וכלכליים בהובלת אמיר בר-שלום וניסן זאבי, שהמחישו את אתגרי הצפון ומנועי הצמיחה בו ● אירועים ומינויים

חברות הביטוח מוזילות את הביטוח המקיף לרכב / צילום: Shutterstock

מחירי הביטוח לרכב הוזלו בעיקר בדגמים הללו. האם הם יירדו עוד?

שבוע לדד–ליין של רשות שוק ההון, מרבית החברות צפויות להגיש תעריפים מוזלים על פי דרישתו — אחרת ייאסר עליהן לשווק פוליסות חדשות ● גורם בענף: "מרבית החברות הפנימו את המסר" ● על פי בדיקת גלובס, בשנה האחרונה ירדו מחירי הביטוח המקיף לרכב ב–17%

פיצוצים בעיר בנדר עבאס, איראן. ארכיון / צילום: Reuters

מתקפה קרובה באיראן? מה חושבים באתר ההימורים הפופולרי

נפח ההימורים באתר פולימרקט המבוסס על חוכמת ההמונים, ולעתים גם על מידע פנים, קפץ בשעות האחרונות, אולם הסיכויים למתקפה קרובה באיראן נותרו לפי גולשי האתר נמוכים ● איזה תאריך מסומן כעת עם הסיכויים הגבוהים ביותר?

אוניית צים LNG / צילום: Mr YC Chou

זכרונות מעסקת טאואר: הסיבה שמניית צים זינקה לפחות מהשווי במכירה

השווי של צים זינק אל פחות משווי העסקה בגלל החשש שזו לא תצא לפועל ● השגת האישורים הנדרשים לעסקה צפויה להימשך עוד חודשים ארוכים, והחששות כבר צפים על פני השטח

רחפנים של חברת אקסטנד / צילום: אקסטנד

חברת הרחפנים שמגיעה לוול סטריט וממחישה עד כמה התחום לוהט

כניסתה הצפויה של אקסטנד הישראלית לנאסד"ק לפי שווי של 1.5 מיליארד דולר אינה אירוע נקודתי ● תחום הרחפנים עובר מתמחור של טרנד חם לתמחור של תשתית אסטרטגית גלובלית

פרידריך מרץ, קנצלר גרמניה / צילום: Reuters, Nicolas Economou

אובדן של 120 אלף משרות בשנה: התעשייה הגרמנית במשבר עמוק

לפי דוח של EY, התעשייה הגרמנית השילה 124 אלף משרות בשנה שעברה, בקצב מהיר פי שניים מזה שנרשם בשנה שלפניה ● מחירי האנרגיה בגרמניה זינקו פי שלושה לפחות עבור לקוחות עסקיים, בשל הפסקת הזרמת הגז הרוסי בצינור "נורד–סטרים", והעתיד אינו ידוע, למרות ניסיונות של הממשלה להבטיח סובסידיות בתחום

שוקי ניר, מנכ''ל סולאראדג' / צילום: באדיבות סולאראדג'

"עוברים להתקפה": סולאראדג' ממשיכה להציג שיפור בתוצאות

לאחר שמניית חברת הטכנולוגיה לתחום האנרגיה הסולארית זינקה ב-120% בשנה האחרונה, היא מציגה עלייה של 71% בהכנסות הרבעון וצמצום ההפסד ● המנכ"ל: "נתמקד בצמיחה רווחית"