גלובס - עיתון העסקים של ישראלאתר נגיש

אם ה-AI כל כך חכמה, למה היא לא מבינה עברית

הכלים החדשים כבר יכולים לעשות כמעט הכול - משליחת מייל, דרך כתיבה של קורות חיים ועד דוקטורט ● אז למה כל כך קשה לעברת אותם? ● מהפכת הבינה המלאכותית

מתי הבינה המלאכותית תלמד עברית? / עיצוב: טלי בוגדנובסקי
מתי הבינה המלאכותית תלמד עברית? / עיצוב: טלי בוגדנובסקי

האפשרויות הגלומות בכלי הבינה המלאכותית נראות גדולות עד כדי כך שבעתיד הם יוכלו להחליף עובדים בתחומים רבים. עם זאת, הכלים שמצליחים לספק תוצר טוב שחוסך זמן ומשפר את הפרודוקטיביות, עובדים ברובם באנגלית או סינית, ולא בעברית. אפילו חברות ישראליות שמפתחות כלים כאלו מכוונות לשוק העולמי ומפתחות כלים בשפה אחרת. למה הבינה המלאכותית לא מבינה עברית מספיק טוב ומה צריך לקרות כדי שהטכנולוגיה שמשנה את העולם תעשה עלייה?

הבעיות: מעט מידע, מעט תמריצים

פרופ' אביב גאון, מבית ספר הארי רדזינר למשפטים באוניברסיטת רייכמן, אומר בשיחה עם גלובס: "למה בינה מלאכותית אינה פועלת בעברית? זו נקודה כואבת. הרי איך מערכות בינה מלאכותית עובדות? באמצעות מסדי נתונים שהמערכת מאומנת עליהם. היא מאומנת על מערכי מידע שכוללים גם עברית, ולכן ישנם כלים עם יכולות בעברית. הבעיה היא שהמערכות הללו לומדות על בסיס מידע קיים או על בסיס אינטראקציות ומעורבות. משמע, שפות עם מעט דוברים, כמה מיליונים בודדים, יהיו חלשות יותר משפות כמו אנגלית או סינית".

אז איך המודל אמור להשתפר? "ככל שיהיו יותר ויותר שאילתות, המודלים ילכו ויתקדמו. נכון לעכשיו יש פחות מערכי מידע בעברית ולכן איכות הדאטה נמוכה", מסביר פרופ' גאון.

מחלקת ייעוץ וחקיקה (אזרחי) במשרד המשפטים בראשות עו"ד כרמית יוליס פרסמה לאחרונה חוות דעת לגבי היקף הזכויות של מיזמי למידת מכונה לשימוש בתכנים מוגנים בזכויות יוצרים. חוות הדעת נכתבה על ידי עו"ד ד"ר ליטל הלמן, בליווי עו"ד הווארד פולינר, ראש אשכול קניין רוחני. למעשה, בעבודת המחקר שלהם התייחסו גם לחסמים שיש במדינת ישראל, מה שיכול להצביע על המצב הקיים.

ד"ר הלמן מפרטת בשיחה עם גלובס את החסמים שהם זיהו: "ראשית, קיים חסם מידע. דוברי השפה מעטים, ואין מספיק מידע כדי להתבסס עליו. שנית, יש חסם משפטי. להבדיל מאנגלית, שבה יש המון מידע שאפשר להתבסס עליו שאינו מוגן בזכויות יוצרים, בעברית אין לנו את האפשרות הזו. בעניין זה, חוות הדעת שלנו קובעת שמותר להשתמש במידע שמוגן בזכויות יוצרים למעט מצבים מיוחדים - כמו ניסיון חיקוי לסופר או למספק שירות".

החסם השלישי והאחרון הוא חסם התמריצים: "חברות ישראליות רוצות לעשות אקזיט או לגייס כסף, ולכן אין סיבה שהן יעבדו על מודלי שפה בעברית, אלא יעדיפו ללכת לאנגלית או לסינית".

הנה דוגמה מהשטח. לחברת AI21 Labs הישראלית יש שני מוצרים, אחד לכתיבה (שמציע פיצ'רים כמו שכתוב הטקסט והצעת חלופות), ואחד לקריאה (שמסכם טקסט ארוך לקטעים קצרים). אורי גושן, מנכ"ל משותף בחברה, מודה שגם במוצרים שלהם יש בעיה בשפה העברית. "מדובר בתכונה אינהרנטית של מודלי שפה ובדרך בה מאמנים אותם", הוא מסביר. "לוקחים את כל הקורפוס האינטרנטי (מאגר טקסטים המשמש לניתוחים ומחקר, נ"ט) ונותנים למערכת לחזות את המילה או רצף המילים הבאות. אנחנו חברה מסחרית, כך שרוב השוק בשפות אחרות ובלבד בשפה האנגלית".

תפקיד הממשלה: מי יביא את המהפכה לישראל

אם המגזר העסקי לא יביא את הבינה המלאכותית לדבר עברית, איך המהפכה הטכנולוגית תגיע לישראל במלואה? פרופ' גאון טוען שהממשלה חייבת להידרש לבעיה: "יש כאן כשל שוק. משרדי הממשלה נדרשים להשקיע כאן בצורה שתפצה על המוטיבציה החסרה של החברות, כדי שיהיה אפשר להנגיש את המוצרים לשוק הישראלי. למדינה צריך להיות אינטרס לסייע כאן בין אם בתקצוב, בתמריצים או בהשמשת מידע".

הפתרונות: המדינה לצד ענקיות הטק

עד היום, רוב פתרונות הבינה המלאכותית בעברית הגיעו מהשוק הפרטי, וליתר דיוק מענקיות הטק. אורי אליאבייב, יועץ בתחום ה־AI ומייסד קהילת MDLI, מבהיר כי חזון הבינה המלאכותית בעברית רחוק מלהתממש בקרוב. עם זאת, "אנחנו רואים בשנים האחרונות פיתוחים נוספים שכן כוללים עברית. החל ממודלי תרגום גדולים שתומכים ב־200 שפות ועברית היא אחת מהן, ועד ליכולות תמלול טקסט שהציגו ענקיות הטכנולוגיה. חברות אלה, באמצעות המשאבים הגדולים שלהן, מכניסות תמיכה בעברית 'על הדרך', בזכות כוח החישוב העצום שיש להן והדאטה שנגיש להן".

בתקופה האחרונה החלה גם המדינה לקדם מהלכים. בתוכנית הלאומית לבינה מלאכותית יש פרק משמעותי שעוסק בנושאי עיבוד שפה טבעית בעברית וערבית. התוכנית פועלת במסגרת פורום תל"מ (הפורום לתשתיות לאומיות למחקר ולפיתוח) המשלב את רשות החדשנות, מפא"ת במשרד הביטחון, אגף התקציבים במשרד האוצר וגופים נוספים.

זיו קציר, מנהל תוכנית הבינה המלאכותית הלאומית, מתאר כי "בתוכנית יש פרק שלם שעוסק ב־NLP (עיבוד שפה טבעית), שאוסף דאטה ומאמן את המודלים בכל אחת משתי השפות. הקו המנחה הוא שהממשלה תייצר תשתיות, את מודל השפה שכולל תמצות, הקשר, סנטימנט ועוד, ואז חברות מסחריות יוכלו להשתמש בו".

למעשה, התוכנית בונה כיום את המודל הסטטיסטי הראשוני לשפות העברית והערבית, ממנו יוכלו חברות לייצר תוכניות הקראה, ניווט, שירות לקוחות או כתיבת עבודות אקדמיות. קציר מוסיף: "אנחנו עושים משהו שהוא קרוב לקוד פתוח, יהיה זמין לכל מי שרוצה לבוא ולפתח".

ההשקעה במיזם עומדת על 180 מיליון שקלים, ולדברי קציר, "אנחנו מאמינים שנראה תוצרים בערך בתוך שנה. לצד המטרה לתמרץ את התעשייה, אנחנו רוצים להנגיש מאגרי מידע ייחודיים שיש בישראל, למשל בתחום הרפואה, שכיום אי אפשר להשתמש בהם כי הם בעברית".

מיזם נוסף מקדם מערך הדיגיטל הלאומי, שמנסה לסייע לחברות שרוצות מידע שאפשר להשתמש בו כדי לאמן את המודלים. החודש פרסם מערך הדיגיטל כי בשילוב האקדמיה ללשון העברית, הם משחררים קורפוס מתויג של עברית בת־זמננו בקוד פתוח ונגיש לתעשייה ולמחקר. גם כאן, המטרה היא לייצר תשתית לצורך אימון מודלים בעברית.

עוד כתבות

קופסאות מזון התינוקות נוטרילון של טבע / צילום: טלי בוגדנובסקי

צעד אחד צעד: כך פוספס רעלן הצרוליד בנוטרילון

ועדת הכנסת חשפה את השתלשלות האירועים - ממועד זיהוי הרעלן בעולם ועד הריקול בישראל ● המסקנה: משרד הבריאות פעל מהר, אך מדינת ישראל לא הייתה בעדיפות על שולחן הרגולטורים האירופאים, ומערכת המעקב מצריכה חיזוק

"האזור מת כלכלית": הקשיים אצל השכנה של ישראל

גלובס מגיש מדי יום סקירה קצרה של ידיעות מעניינות מהתקשורת העולמית על ישראל • והפעם: ארה"ב רוצה לצמצם את כמות הנפט שאיראן מוכרת לסין, מתיחות בגבול לבנון, ואיך נראות חגיגות הרמדאן בעזה • כותרות העיתונים בעולם

מוצאים פתרונות לכלכלת הצפון: הרגעים והתמונות מכנס גלובס

כנס שמים את הצפון במרכז של גלובס חיבר בין כ-250 משתתפים מהקהילה העסקית, הרגולטורית והציבורית לדיון על כלכלת הצפון, תעשייה ובנייה ● בין ההרצאות והסדנאות התקיימו סיורים ביטחוניים וכלכליים בהובלת אמיר בר-שלום וניסן זאבי, שהמחישו את אתגרי הצפון ומנועי הצמיחה בו ● אירועים ומינויים

נתב''ג / צילום: Shutterstock

לקראת סגירת השמיים? הוכרז סכסוך עבודה בענף התעופה

הסכסוך יחול על למעלה מ-11 אלף עובדים בחברות התעופה אל על, ארקיע, ישראייר ואייר חיפה וכן על רשות שדות התעופה ● הרקע לסכסוך הוא הכוונה להקים בסיס פעילות של וויזאייר בישראל ללא היוועצות עם נציגות הכובדים בענף התעופה

רעננה / צילום: Shutterstock, defotoberg

פסק הדין שמחייב את הרשויות המקומיות בתשלום מס חדש

עיריית רעננה תחויב במס רכישה בגובה 34 אלף שקל על שטחים ציבוריים שקיבלה במסגרת תוכנית יזמית, לאחר שוועדת ערר דחתה את טענתה להפקעה ● ההכרעה עשויה להשפיע על מחלוקות דומות המתנהלות מול רשויות נוספות בפרויקטים ברחבי הארץ, וברשות המסים מעריכים כי הסוגיה תתגלגל לבסוף לפתחו של העליון

מפעל רשף טכנולוגיות של ארית בשדרות / צילום: יח''צ

מי קיבל מידע פנים על מניית הפלא של ת"א? החשד שבודקת רשות ני"ע

זינוק חסר תקדים הפך את מניית ארית לכוכבת של הבורסה ● כעת חושדת הרשות בעבירות מידע פנים, על פי הערכות בשוק, ע"י בכיר בבית השקעות ● ארית: "בטוחים שהעניין יסתיים בלא כלום"

שוקי ניר, מנכ''ל סולאראדג' / צילום: באדיבות סולאראדג'

"עוברים להתקפה": סולאראדג' ממשיכה להציג שיפור בתוצאות

לאחר שמניית חברת הטכנולוגיה לתחום האנרגיה הסולארית זינקה ב-120% בשנה האחרונה, היא מציגה עלייה של 71% בהכנסות הרבעון וצמצום ההפסד ● המנכ"ל: "נתמקד בצמיחה רווחית"

אלי כהן, מנכ''ל אוניברסיטת קריית שמונה והגליל בהקמה, בכנס שמים את הצפון במרכז / צילום: שלומי יוסף

מנכ"ל אוניברסיטת תל חי: "הכפלנו את המספר הבוגרים שנשארים בצפון, אבל היעדר התעסוקה מקשה"

"הגורם המרכזי שמקשה על הבוגרים שלנו להישאר הוא התעסוקה", כך אמר מנכ"ל האקדמית תל חי, אלי כהן, בכנס שמים את הצפון במרכז של גלובס ● עוד הוא ציין כי "יש אוניברסיטאות בחיפה, אבל חיפה זה לא באמת הצפון מבחינתנו, זה לא המטרופולין שלנו"

מיכה קאופמן, מנכ''ל ומייסד פייבר ואור עופר, מייסד ומנכ''ל סימילרווב / צילום: יואב הורנונג, איל יצהר

שתי הישראליות שנפלו בוול סטריט אחרי פרסום הדוחות

סימילרווב אכזבה את השוק עם התחזיות שפרסמה בדוחותיה, והמניה נפלה בחדות בוול סטריט ● פייבר סיפקה תוצאות מעורבות, וגם המניה שלה הגיבה בירידות ● מנכ"ל פייבר: "אנו נמצאים בעיצומו של שינוי משמעותי באופן שבו ארגונים מאמצים AI"

אשקלון. ''אנשים רוצים איכות חיים טובה'' / צילום: Shutterstock

הבטיחו לישראלים שהנטו שלהם יגדל אם יעברו לפריפריה, אז למה הם לא באים

בנק ישראל פרסם לאחרונה מחקר שהראה כי הטבות המס שניתנו לפריפריה עלו למדינה מאות אלפי שקלים לכל תושב, ולא שינו דרמטית את מאזן ההגירה ● החוקרת עדי פינקלשטיין: "ההטבות האלה לא מספיקות כדי למשוך אנשים ליישובים החלשים באמת"

משה דוידוביץ', ראש מועצה אזורית מטה אשר / צילום: שלומי יוסף

משה דוידוביץ: "צריך להפסיק לדבר על שיקום ולדבר על צמיחה"

בכנס שמים את הצפון במרכז של גלובס, דיברו ראש עיריית קריית שמונה אביחי שטרן וראש מועצה אזורית מטה אשר משה דוידוביץ’ על הצורך להפסיק להסתפק בשיקום בלבד ולפעול למימוש הצמיחה בצפון ● השניים הצביעו על הצורך בתמריצים למפעלים, השקעה בתשתיות והקמת עוגני צמיחה כמו מקומות תעסוקה, אוניברסיטאות ובתי חולים

מטוס Ryanair / צילום: ryanair

החל מ-120 דולר: החברות שהסתערו על הקו הרווחי של החברה שנטשה את ישראל

בקיץ הקרוב היצע הטיסות לאיטליה יגדל בזכות תחרות גוברת של חברות התעופה על היעדים ● החברות זיהו את הפוטנציאל, בין היתר בזכות היעדרה של ריינאייר, והחלו בהשתלטות על הקווים ליעדים שהפעילה בעבר ● וגם: חברת הלואו קוסט שתגביר את התחרות בטיסות לגרמניה

הקונסול הכללי בניו יורק, אופיר אקוניס בנימיני וגואטה, כאן ב', 11.02.26 / צילום: דוברות הכנסת

האם לאיראן יש טילים שמאיימים על ארה"ב?

הטווח המקסימלי של הטילים שבידי איראן רחוק מלהגיע לארה"ב, והוא יכול להגיע רק עד מזרח ודרום אירופה ● המשרוקית של גלובס

תנובה / צילום: שלומי יוסף

המחוזי: תנובה עשתה דין לעצמה והחזיקה בשטח שאינו בבעלותה

ביהמ"ש קבע כי תנובה אינה בעלת זכויות בשטח בבאר שבע שהחזיקה במשך עשרות שנים ● בנוסף נמתחה ביקורת על התנהלות החברה: איך תאגיד עתיר-משאבים, המלווה ביועצים משפטיים צמודים, שוכח לחתום על הסכם לקבלת מקרקעין?

ניסים פרץ, מנכ''ל נתיבי ישראל, בכנס שמים את הצפון במרכז / צילום: כדיה לוי

מנכ"ל נתיבי ישראל: "תהיה רכבת לקריית שמונה, נקודה"

בכנס שמים את הצפון במרכז של גלובס אמר ניסים פרץ, מנכ"ל נתיבי ישראל, כי "סיימנו את התכנון של הרכבת לקריית שמונה, אנחנו נמצאים בשלב קידוחי הקרקע, ובשנה הבאה נצא למכרזים הגדולים" ● בנוסף התייחס פרץ ליוזמת סמוטריץ' להעניק מעין ארנק דיגיטלי לתושבי קו העימות: "שהממשלה תפסיק לחלק תופינים. אני לא צריך 2,500 שקל, זה מעליב"

אוניית צים LNG / צילום: Mr YC Chou

זכרונות מעסקת טאואר: הסיבה שמניית צים זינקה לפחות מהשווי במכירה

השווי של צים זינק אל פחות משווי העסקה בגלל החשש שזו לא תצא לפועל ● השגת האישורים הנדרשים לעסקה צפויה להימשך עוד חודשים ארוכים, והחששות כבר צפים על פני השטח

חנות בגדים / צילום: Shutterstock

שוק האופנה בישראל מגלגל 25 מיליארד שקל, אבל נתון אחד חושף משבר שקט

תעשיית האופנה הישראלית מתמודדת עם שורת אתגרים לא פשוטים, בין השאר בגלל התחזקות האונליין ומבנה השוק ● מבדיקת גלובס עולה כי מדד ההלבשה צנח ב־34% בעשור החולף

נושאת המטוסים ג'רלד פורד, עמוסה במטוסי קרב ובכלי טיס אחרים / צילום: Reuters, Christopher Drost/ZUMA Press Wire

עם 75 מטוסים ו-4,500 חיילים: זה כלי המלחמה היקר ביותר בעולם והוא בדרך לכאן

במקביל להתנהלות המו"מ בין ארה"ב לאיראן, ספינת המלחמה ג'רלד פורד - שתג המחיר שלה עומד על 13.3 מיליארד דולר - עושה את דרכה למרחב הים התיכון ● גלובס עושה סדר בכל הקשור ליכולות, תפעול ועלויות נושאת המטוסים המתקדמת של ארה"ב

חיילי מילואים / צילום: דובר צה''ל

הנתונים חושפים: כ־60% מהבקשות לפטר מילואימניקים מאושרות

שנתיים לתוך המלחמה, נתוני משרד הביטחון ל–2025 חושפים חולשה משמעותית במעטפת ההגנה התעסוקתית של המשרתים ● כ–60% מבקשות המעסיקים לפיטורים חריגים התקבלו, ומנגד שיעור גבוה מהתלונות על פגיעה בזכויות המילואימניקים נדחו

ביל גייטס, וורן באפט, ביל אקמן, קתי ווד / צילום: ap, Brendan McDermid, Richard Brian,  Andres Kudack, Nati Harnik,

משקיעי העל חושפים את ההשקעות שלהם, לפחות על מניה אחת הם חלוקים

וורן באפט ודיויד טפר מכרו את אמזון, וביל אקמן כהרגלו חושב אחרת ● מגמות סותרות נרשמו גם במניות אלפאבית, אך על מטא נרשמה הסכמה גורפת ● קת'י ווד לא מפסיקה להאמין בקריפטו ● ומי שוב רוכש מניות של עיתון?