האוניברסיטאות כבר ערוכות: זהו המקצוע החדש והמבוקש במשק

כמויות המידע העצומות שהטכנולוגיה מאפשרת לאסוף הולידו מקצוע חדש: מדעני נתונים • השוק משווע למאות עובדים בתחום, וגם האוניברסיטאות נערכות לפתיחת מסלולים יעודיים • "קשה לשווק את המקצוע, אבל מדובר ממש במהפך"

מדענות / צילום: shutterstock
מדענות / צילום: shutterstock

רשתות חברתיות, ערים חכמות עמוסות סנסורים ואפילו כמות תמונות הסלפי שאנחנו שומרים - נראה שהאנושות אוספת על עצמה ועל העולם הסובב אותה כמויות מידע גדולות מאי פעם. ההבנה כי ניתן לנתח את המידע הזה ולהפיק ממנו תובנות וערך הולידה מקצוע חדש יחסית בשם "מדעי הנתונים" (Data Science) והדרישה למקצוע הולכת וגוברת בארץ ובעולם.

לפי נתוני חברת ההשמה להייטק אתוסיה, בשנת 2016 נפתחו 380 משרות חדשות למדעני נתונים בישראל. ב-2018 הנתון כבר עמד על 480, ובינואר 2019 בלבד נפתחו 55 משרות, ו-320 משרות שנפתחו קודם לכן נותרו לא מאוישות. כלומר, מאות מדעני נתונים חסרים היום בשוק. זאת בנוסף למספר המשרות המאוישות של מדעני נתונים, שעמדו על 2,350 בינואר האחרון, לעומת 1,905 ב-2016.

כמה מרוויח מדען נתונים מנוסה וכמה עובדים חסרים בשוק? / לפי נתונים של חברת ההשמה להייטק אתוסיה
 כמה מרוויח מדען נתונים מנוסה וכמה עובדים חסרים בשוק? / לפי נתונים של חברת ההשמה להייטק אתוסיה

נראה שבאקדמיה מכירים בצורך הגובר בהכשרת מדעני נתונים, והדבר משתקף בתוכנית הרב שנתית של המועצה להשכלה גבוהה לשנים 2022-2017. לקראת השלמת גיבוש התוכנית, מוסדות אקדמיים מגישים למועצה להשכלה גבוהה (מל"ג) את תוכניות הלימודים שברצונם לפתוח בשנים הקרובות, ואלה נשקלות בהתאם לקריטריונים כמו צורך לאומי ושיקולים תקציביים. מדעי הנתונים היה התחום שבו המספר הגבוה ביותר של תוכניות אושרו להגשה ע"י המל"ג - 19 תוכניות לתואר ראשון ושני. המוסדות האקדמיים עדיין צריכים לקבל אישור סופי, אך הנתון מראה על מגמה ברורה לגבי מעמדו של התחום החדש. 

"מדעי הנתונים הפכו בשנים האחרונות לתחום רב השפעה בעולם ההייטק ובמחקר האקדמי. היכולת להתמודד עם נתוני ענק מצריכה כישורים במתמטיקה, בסטטיסטיקה ובמחשבים, ועל כן אנו רואים חשיבות רבה בהכשרתם של כמה שיותר בוגרים בתחום", אומרת פרופ' יפה זילברשץ, יו"ר הוועדה לתכנון ותקצוב של מערכת ההשכלה הגבוהה. 

פרופ' יפה זילברשץ/ צילום: דוברות מל"ג
 פרופ' יפה זילברשץ/ צילום: דוברות מל"ג

"מי השחקן הטוב במגרש?"

מדעני נתונים משתמשים באלגוריתמים של למידת מכונה כדי להפיק באופן אוטומטי תובנות ותחזיות מנתונים מגוונים - ממידע גנטי, דרך נתונים כלכליים ועד למאמרים אקדמיים. הטכניון היה המוסד האקדמי הראשון בישראל שהחל ללמד את התחום, לפני שלוש שנים, וכיום פועלות בו כמה תוכניות לימודים. גם באוניברסיטה העברית מציעים מספר תכניות לימודים לתואר ראשון ושני במדע הנתונים, ביניהם תואר בסטטיסטיקה ומדע הנתונים, ואוניברסיטת בן גוריון שבבאר שבע כבר הודיעה שבשנה הבאה תפתח מסלול ללימודי תואר ראשון בהנדסת נתונים. זאת בנוסף למספר תכניות עם התמחות במדעי הנתונים שכבר מוצעות לסטודנטים באוניברסיטה, כמו לימודי מדעי המחשב עם התמחות במדעי הנתונים.

פרופ' אביגדור גל, ראש התוכנית למדע נתונים בטכניון, שמכהן גם כיו"ר הוועדה המקצועית של המל"ג בתחום מדעי הנתונים, אומר כי "כבר שנים שלא פותחים תוכניות לימודים בתחומים חדשים לגמרי, ומדובר ממש במהפך. זה תחום שונה מהתחומים שאנחנו מכירים".

לדבריו, "התחום משלב יכולות משני תחומים עיקרים - מדעי המחשב וסטטיסטיקה ובנוסף יש אוסף של יכולות שנובעות מאופטימיזציה, תורת המשחקים ואפילו פסיכולוגיה, כי אם למשל הנתונים נאספו מטפסים באינטרנט צריך להביא בחשבון גם את אופן ניסוח השאלה", אומר גל.

גל מסביר כי "לנתונים יש מחזור חיים עם ארבעה שלבים. השלב הראשון הוא איסוף, השלב הבא הוא ניהול - שנוגע לשמירת הנתונים, והשלבים הבאים הם ניתוח באמצעות למידת מכונה וויזואליזציה, כדי להציג את הנתונים לבעלי עניין כמו מנהלים בחברות. אחר כך אוספים עוד נתונים, כדי להבין עוד דברים, ולכן זה מחזור חיים. מדען נתונים יודע לטפל בכל מחזור החיים מההתחלה עד הסוף. בפרויקט הגמר בתואר הראשון אנחנו נותנים לסטודנטים כמות עצומה של נתונים והם נדרשים להבין מה חסר להם, מאיפה אוספים את הנתונים, להגדיר כמה מקום הם צריכים בענן כדי לשמור אותם, לשפר אלגוריתמים לניתוח וכו'. אנחנו קוראים לבוגר התוכנית 'מהנדס בלי פחד' - הוא יודע לבוא, ייתנו לו נתונים, שום דבר לא יפחיד אותו".

למי מומלץ ללמוד את התחום הזה?

"היום כשאני מגיע לתלמידי תיכון באמת קשה לשווק להם את התוכנית כי הם לא יודעים מה זה. הפרופיל הטיפוסי למדען נתונים יהיה מישהו שטוב במתמטיקה, שאוהב לעבוד עם מחשבים ושהסיפור מאחורי הנתונים יכול לסקרן אותו. כי בכל מאגר דאטה יש סיפור, והמטרה שלנו היא לגלות אותו. מישהו שמגיע לעולם של ערים חכמות ורוצה לדעת מה הנתונים שנאספים מהאוטובוס, או אפילו למגרש כדורגל ורוצה לדעת אם יש משהו שיכול להגיד מי השחקן הטוב ביותר".

גל אומר כי את המחזור הראשון בתוכנית התחילו 25 סטודנטים בלבד, ובמחזור השלישי שהתחיל השנה המספר כבר עמד על פי שלושה. "עבדנו בזהירות כי תוכנית מהסוג הזה דורשת המון משאבים. יש קורסי נתונים שבהם הסטודנטים עובדים עם המון נתונים ועם טכנולוגיות ענן".

בעוד שקיימים היום גם קורסים אינטרנטיים שמלמדים את התחום, גל מדגיש כי הלימודים האקדמיים מעניקים ערך מוסף גדול בהרבה. "היום להשתמש בכלי למידת מכונה זה פשוט, אבל בלי להבין מה עומד מאחורי הכלים האלה, או הבנה לגבי הנתונים שמשתמשים בהם, אי אפשר לדעת כמה איכותית התוצאה. אני כן בעד קורסים להמונים כמו קורס למידת המכונה של סטנפורד שאפשר לעשות באינטרנט, כי אז אנשים פחות יפחדו מהטכנולוגיה, אבל כדי להיות מדען נתונים טוב צריך הכשרה עמוקה במתמטיקה".

בנוסף ללימודים עצמם, גל אומר כי בטכניון מסייעים לסטודנטים גם להשתלב בתעשייה. "גם התעשייה עוד לא מבינה מה זה להיות בוגר מדעי הנתונים, אז אנחנו עוזרים להם ומוצאים להם התמחויות קיץ ביחידות בצבא, חברות הייטק וסטארט-אפים. אנחנו גם מאתרים בשלב מוקדם סטודנטים מצטיינים כדי לעודד אותם להמשיך למחקר".

גל צופה כי הדרישה למקצוע תמשיך לעלות ואומר כי "לדעתי רק נגענו בקצה הקרחון של מה שנתונים יכולים לתת לנו. למשל בתחום התעשייה 4.0, הסנסורים שבפס הייצור יכולים לתת היום תחזיות טובות ממה שעשו איתם פעם ולשפר את הביצועים, שלא נדבר על כל הסנסורים שאנחנו הולכים לקבל מערים חכמות וברפואה, אנחנו נצטרך הרבה יותר מדעני נתונים כדי לתת ערך מוסף לעסקים".

פרופ עירד בן גל, אוניברסיטת ת"א / צילום: באדיבות אוניברסיטת תל אביב
 פרופ עירד בן גל, אוניברסיטת ת"א / צילום: באדיבות אוניברסיטת תל אביב

"חתך קבלה גבוה מאוד"

גם באוניברסיטת תל אביב מעוניינים להשיק בקרוב תוכנית בתחום לתואר ראשון ושני. פרופ' עירד בן-גל מהמחלקה להנדסת תעשייה מסביר את התהליכים שהביאו לעליית התחום. "יש היום תשתית שמאפשרת לארגונים לקבל כמויות מידע עצומות מסנסורים, מערכות IoT (אינטרנט של הדברים) וגורמים רבים נוספים. לצד זאת, מהפכת הענן הביאה לכך שניתן גם להחזיק ולנהל את כמויות הנתונים האלה. בנוסף, המעבדים הגרפיים החדשים מאפשרים כוח חישוב גדול בהרבה לארגונים. כל אלה מאפשרים כוח חישוב גדול בהרבה לארגונים ומאפשרים לקבל תובנות שפעם אי אפשר היה לקבל. חברות יכולות להפיק מהתובנות האלה רווח אדיר.

"נוצר הצורך באנשים שיבינו מה הבעיה העסקית, מה הנתונים שנוגעים לאותה בעיה, ולחבר אותם לאלגוריתמים שיכולים לענות על הבעיות העסקיות. ישראל הפכה למרכז (hub) שבו ארגונים בינלאומיים פותחים את מרכזי מדע הנתונים שלהם, בגלל כוח האדם, האופי של היזמות והחדשנות ויכולת העבודה העצמאית שחלק מהאנשים פיתחו בצבא. זה מקצוע יחסית חדש וצעיר והיכולות לחקור ולפתח פתרונות חדשים היא מאוד גדולה. פתחו תוכניות כאלה ב-MIT, סטנפורד, קולומביה, באוניברסיטאות מובילות באירופה ובמזרח", אומר בן-גל.

לגבי תוכנית הלימודים העתידית באוניברסיטת תל אביב, בן-גל אומר כי "ננסה לפתוח את התוכנית בשנה-שנתיים הקרובות. זו תהיה תוכנית תלת שנתית ייחודית וקטנה, כרגע אנחנו מתכננים שיהיו בה 50-40 סטודנטים בשנה. התוכנית תהיה קשה ושאפתנית, עם חתך קבלה מאוד גבוה. שמיועדת לאנשים עם יכולת למידה מהירה ורצון לכבוש את השוק מהר, ומי שירצה לקבל תואר מהנדס או להשלים תואר שני יוכל לעשות זאת בתוספת שנת השלמה בלבד. התוכנית תשלב רקע תיאורטי עמוק במתמטיקה, קורסים אפליקטיביים בתחום מדע הנתונים כמו תחומי מערכות מידע בעידן הביג דאטה, והרבה קורסי בחירה ייחודיים כמו יישומי למידה עמוקה בתעשייה, ויזואליזציה של נתונים, פרטיות ואתיקה".

בן-גל מסביר כי השאיפה בתוכנית היא להכין את הסטודנטים להשתלבות בשוק. "נשלב את מדע הנתונים עם ראייה תהליכית ארגונית, כך שהבוגרים לא רק יהיו מתכנתים טובים שיודעים לעבוד עם הכלים לניתוח נתונים אלא יידעו לשנות את המיקוד העסקי של ארגון כדי להביא תועלת ורווח. הגישה האקדמית המסורתית תהיה לבחור את האלגוריתם שמביא עוד שני אחוזי דיוק, אבל גישה ריאלית לתחום נוגעת לדוגמה ליישום אלגוריתם שאולי פחות מדויק באחוז אחד אבל יותר אפקטיבי מבחינת גמישות, יכולת להכיל נתונים חיצוניים ויחס עלות-תועלת. הבוגרים שלנו צריכים לדעת להקים צוות מדעני נתונים, וגם להעביר את המשימות לדרגים גבוהים שאינם מדעני נתונים כך שיבינו אותן. גם סגל התוכנית מגיע מרקע אקדמי תיאורטי, אבל ברובו גם מחובר לעולם העסקי. בנוסף, אנחנו באינטראקציה עם הצבא כדי להכניס גם עתודאים ואנשי צבא שיבואו ללמוד את התחום". 

ומה למדו מדעני נתונים עד היום, לפני שהיו קיימות הכשרות אקדמיות רשמיות בנושא? לפני נתוני אתוסיה, 31% ממדעני הנתונים בישראל הגיעו מתחום הנדסת התוכנה, 15% הגיעו מתחום מערכות המידע ו-14% בוגרי תארים בתחומי המדעים המדויקים. 6% מהם דווקא הגיעו מתחום מדעי החברה, ו-4% בכלל למדו ביולוגיה.