גלובס - עיתון העסקים של ישראלאתר נגיש

חמישה מיתוסים על מדע הנתונים - שצריך לנפץ

ככל שהתחום הופך יותר ויותר נפוץ ונדרש - כך גוברים העיוותים לגביו ● הגיע הזמן לתאם ציפיות מול לקוחות, עובדים, מעסיקים ומשקיעים

מרכז נתונים בארה"ב / צילום: shutterstock, שאטרסטוק
מרכז נתונים בארה"ב / צילום: shutterstock, שאטרסטוק

בעשור האחרון חשיבותו של המידע וההשפעה שלו על הצלחת הארגון הפכה ברורה לכול. עם זאת, ארגונים רבים עדיין אינם מנצלים היטב את הפוטנציאל הגלום במידע הזמין להם. בסקר שנערך ע"י גרטנר ב-2019, נמצא כי פחות מ-50% מהתוכניות האסטרטגיות של ארגונים גלובליים מכילות דאטה כרכיב מרכזי. אחת הסיבות העיקריות לכך היא חוסר ההבנה ששורר לעיתים בארגונים בנוגע לתחום מדע הנתונים (Data Science) ולדרכים השונות להפיק תועלות ממנו.

על מדעני הנתונים מופקדת המשימה החשובה של חילוץ תובנות ממידע בעזרת אוסף של שיטות ואלגוריתמים שונים, כמו הבנת ההעדפות של הלקוחות לצורך הצעת מוצרים מותאמים אישית. תפקיד זה תופס תאוצה בשנים האחרונות, וכבר זמן רב אינו בשימוש בלעדי של חברות מובילות וגדולות (כדוגמת פייסבוק וגוגל), אלא גם של חברות בסדר גודל קטן יותר, כולל חברות שלא מוגדרות במהות שלהן "חברות מבוססות טכנולוגיה".

בשנים האחרונות שמעתי כמה מיתוסים בנוגע למדע הנתונים, חלקם רחוקים מהמציאות. הגיע הזמן לרסק את הפופולריים שבהם.

1. יותר מידע שווה יותר דיוק

בזמן שארגונים אוספים ושומרים כמויות עצומות של מידע, רובם עדיין לא מנצלים אותו לתובנות משמעותיות שיקדמו אותם. עם זאת, מידע רב לאו דווקא מוביל לדיוק רב יותר או ליותר תובנות.

בתהליך יצירת הערך ממידע ישנם מספר שלבים. שלב איסוף המידע הוא רק ההתחלה. השלבים הבאים כוללים בדיקה ובחירה של מערכי הנתונים (Datasets) המתאימים לעולם הבעיה העסקית, ואותם אנו צריכים לנתח. לאחר מכן אנשי הדאטה בארגון ישתמשו בכלי הניתוח השונים כדי לחלץ תובנות ויבנו את המודלים. תוך כדי התהליך יעברו מספר שלבי טיוב שנועדו לשיפור איכות הנתונים. כלומר, נקבל מודל מדויק יותר ככל שנשקיע בתהליכים אלו. המודל לא יהפוך למדויק יותר גם אם ישנן כמויות גדולות מאוד של מידע.

2. השקעה תמיד מובילה לתוצאה בעלת ערך

"השקענו משאבים תשתיתיים, בנינו צוותים של אנשי דאטה שונים, כולל מדעני נתונים, קנינו כלים ומערכי נתונים - ועכשיו הגיע הזמן לקבל תוצרים. ומהר". אני בטוח שכמעט כל מי שמתעסק בדאטה שמע אמירה דומה לזו.

איסוף וניתוח נתונים וחילוץ תובנות מהם הוא קריטי לכל ארגון מודרני. בשימוש במדע נתונים ארגונים מצפים לקבל ערך, אך לא כל תהליך כזה מייצר תמיד תוצאה בעלת ערך. במדע הנתונים מנסים לזהות דפוסים במידע, אולם לא מובטח שתמיד נמצא אותם. ישנם מצבים שכלל לא ניתן למצוא תובנות, ויותר מכך - לעיתים מוצאים תובנות שאינן בעלות ערך עסקי.

נניח שאנו מנהלים חברה למכירת שואבי אבק מדלת לדלת. יש לנו נתונים בנוגע לפעילות אנשי המכירות שלנו: האם המכירה הצליחה, מועד/תקופה בשנה, דגם המוצר, מיקום ואפילו מזג האוויר באותה עת. כעת, החלטנו להעסיק מדען נתונים ונתנו לו את המשימה למצוא דפוסים למכירות מוצלחות. לאחר מחקר רחב, עשוי מדען הנתונים להגיע למסקנה שבנתונים שלנו אין מאפיינים חד משמעיים שמשפיעים בצורה מובהקת על הצלחת העסקה.

לכן חשוב שאנשי הדאטה יעבדו בצמוד עם גורמים עסקיים, כדי לצמצם ככל האפשר מקרים כאלו, אך הם כאמור עדיין עשויים לקרות מסיבות שונות, כגון: מידע מועט, חלקי או "רועש".

3. מדע נתונים לא מתאים לארגונים קטנים

אם יש רק דבר אחד לזכור מהמאמר - ארצה שהוא יהיה הפרכת המיתוס הזה.

המון ארגונים קטנים ובינוניים מאמינים שלא יוכלו לשלב יכולות מדע נתונים בארגון, מאחר שאין להם משאבים להשקיע בתשתיות דאטה גדולות ומורכבות. בפועל ישנם היום כלים (חלקם חינמיים ככלי קוד פתוח) שניתן להטמיעם בקלות יחסית ובשילוב צוות קטן יחסית של אנשי דאטה.

ניקח למשל עסק המוכר מוצרים ושירותים אונליין. העסק חשוף לפרטים רבים על פעילות הלקוחות: באילו דפים הם מבקרים, על מה הם לוחצים, מה נמצא בעגלת הקניות וכו'. ע"י גיוס של מדען נתונים ובעזרת שימוש בכלים פשוטים יחסית, נוכל לבנות מודל המציע מוצרים המתאימים לטעמי הלקוח בהתבסס על נתוני השימוש שלו.

4. חייבים להיות עילוי כדי להפוך למדעני נתונים

ישנה הילה גדולה סביב מקצוע מדע הנתונים והוא אחד המבוקשים בהייטק. אבל, חשוב לציין שבעולם המידע ישנם מקצועות נוספים וחשובים, המוסיפים ערך רב לאורך כל שרשרת המידע: מנתחי מידע, מהנדסי נתונים, אנשי בינה עסקית ואחרים.

יש לי בשורה טובה למי שמבקש להיות מדען נתונים - אתם לא חייבים להיות גאוני הדור. כשחיפשתי לגייס מדעני נתונים לפני כמה שנים, עברתי בתחילה על דרישות משרה של חברות רבות מחפשות תארים מתקדמים ואכן הבנה עמוקה בסטטיסטיקה ובאלגוריתמיקה, למשל, חשובה מאוד למקצוע. אולם בצוות מאוזן של מדעני נתונים, אין צורך שכולם יהיו ד"ר. זהו מקצוע שאפשר ללמוד ולהתפתח אליו ממקצועות שונים בעולמות מדעי המחשב בכלל והדאטה בפרט.

5. מדע נתונים הוא מונח נרדף לבינה מלאכותית

לצערי אני שומע אמירה זו לעיתים יותר תכופות ממה שהייתם מצפים. מדע הנתונים ובינה מלאכותית קשורים ומכילים כמה אזורי השקה, אך אינם זהים.

בהגדרה פשטנית, מדע נתונים הוא תחום שמטרתו ניתוח נתונים ומציאת דפוסים לצורך חילוץ תובנות ממערכי נתונים בעזרת שיטות ניתוח מתקדמות ומגוונות. מטרתו של תחום הבינה מלאכותית (שהוא יותר מונח שיווקי מטכנולוגי) היא לבצע אמולציה של הבינה האנושית דרך שימוש באלגוריתמים שונים על מנת להגיע למצב אוטונומי שלהם ככל האפשר. בהקשר של מדע נתונים, בינה מלאכותית יכולה להיחשב ככלי עבור מדע הנתונים. כלומר, במסגרת עבודתו מדען הנתונים עשוי להשתמש בשיטות מבוססות בינה מלאכותית כמו למידה עמוקה על מנת לחלץ תובנות מתקדמות ממידע.

מידע הוא כאמור קריטי להצלחה של הארגון וחשוב שנבין בצורה נכונה את העקרונות העומדים בבסיסו, כולל הפרכת האמירות המוטעות. הבנה זו יכולה להפוך אותנו לסוכני שינוי שיקחו קדימה את הארגון בו אנו עובדים.

מנהל מחלקת מידע ותובנות וממונה על אסטרטגיית המידע בחטיבת הטכנולוגיה של הפועלים

עוד כתבות

החוק שיאשר לסנן את הבוס אחרי העבודה / אילוסטרציה: גלובס, חומרים: Shutterstock

החוק שיאסור על הבוס להתקשר לעובד אחרי שעות העבודה והסיכוי שיגיע גם לישראל

שוק העבודה בעולם ממשיך להתאים את עצמו לצרכיהם של דור המילניום וה–Z: הקנדים יעגנו בחוק התקציב את "הזכות להתנתק" ● גם מדינות אחרות מקדמות מהלכים שמגדירים מתי נגמר יום עבודה ומתי מותר לפנות לעובדים ● האם יש סיכוי לחקיקה דומה גם בישראל?

שוטרים פורצים לבניין המילטון באונ' קולומביה / צילום: ap, Cliff Owen

המשטרה משחררת את אוניברסיטת קולומביה, וטראמפ משחרר את לשונו

כיבוש קמפוס האוניברסיטה הניו יורקית בידי פרו–פלסטינים הסתיים, לאחר שבין המוחים התגלתה נוכחות של "מהפכנים מקצועיים" ● האלימות בקמפוסים תועיל לדונלד טראמפ, המוביל בסקר האחרון בהפרש ניכר, וחושף בגלוי את הבוז והטינה שלו כלפי ישראל וכלפי נתניהו

בניין סופר מיקרו בקליפורניה / צילום: Shutterstock

שתי מניות שבבים פרסמו אתמול דוחות. איך הגיבו המשקיעים?

יצרנית השרתים סופר מיקרו לא עמדה בתחזיות האנליסטים ופרסמה הכנסות נמוכות מהצפוי ● גם חברת השבבים AMD פרסמה תוצאות מעורבות לרבעון הראשון וספגה הורדה דרמטית במחיר המניה

אוניברסיטת UCLA / צילום: Associated Press, Jae C. Hong

עימותים אלימים בין פרו-פלסטינים ותומכי ישראל באוניברסיטת UCLA

באוניברסיטת UCLA שבקליפורניה הוחרפו העימותים בין המפגינים וכוחות הביטחון הגיעו על מנת להפריד בין הניצים ● באוניברסיטת קולומביה הגיעו אמש השוטרים מצוידים ברימוני הלם ופשטו על הבניין בו התבצרו המפגינים הפרו-פלסטינים

הבורסה בוול סטריט / צילום: Unsplash, Ahmer Kalam

נעילה מעורבת בוול סטריט; תשואות האג"ח הממשלתיות בארה"ב צללו

הנאסד"ק ירד ב-0.3% ● AMD וסופר מיקרו צללו בעקבות הדוחות ● מחירי הנפט ירדו במעל ל-3% ● הפד הותיר את הריבית ללא שינוי ופאוול שלל העלאות ריבית נוספות ● וגם, המניות המומלצות של גולדמן סאקס

אילוסטרציה: טלי בוגדנובסקי / צילומים: Shutterstock

מעלים מחירים: מפת ההתייקרויות המלאה

מהחלב המפוקח ועד הדלק: חג הפסח הסתיים, ושורת עליות מחירים צפויה להיכנס לתוקף החל מהיום ● אלה מצטרפות למספר גלי התייקרויות שפקדו את המשק בחודשים האחרונים ● גלובס מציג את המוצרים והשירותים שהתייקרו עד כה ב־2024, כשהסוף עוד לא נראה באופק

קיבוץ בארי ההרוס / צילום: תמונה פרטית

"חוק מסוכן שאין לאשרו": ארגוני סביבה ומחקר נגד חוק חבל התקומה

שורה של ארגונים הגישו הסתייגויות לחוק, וכולם מתנגדים לוועדת התכנון האזורית שאמורה לקום עבור החבל: "מגרש משחקים לממשלה" ● חדשות הנדל"ן

שדה התעופה בדובאי / צילום: Shutterstock

הטיסות של ארקיע נדחו, ועשרות ישראלים תקועים בשדה התעופה בדובאי

עיכובים חריגים בטיסות ארקיע וישראייר מדובאי הביאו לכך שעשרות נוסעים תקועים בשדה התעופה מעל 24 שעות ● הסיבות לעיכוב: תקלות במטוסים שהובילו לשיבוש בלוח הזמנים ● עיכובים גם בטיסות לארץ מיעדים נוספים מאירופה

אקסל / אילוסטרציה: Shutterstock

כך הבינה המלאכותית תעזור לכם להשתמש באקסל

מיקרוסופט החלה להכניס כלי AI לתוכנת האקסל ● בקרוב תוכלו לקבל ניתוחי מגמות ותובנות על הנתונים שלכם, לייצר נוסחאות בקלות בעזרת טקסט, ולקבל דגש על מה שחשוב לכם

רחפן של חברת DJI הסינית / צילום: ap, Shizuo Kambayashi

אחרי טיקטוק, ארה"ב בדרך לחסום את פעילות ענקית הרחפנים הסינית

הצעת חוק חדשה קוראת לחסום את הגישה של חברת DJI הסינית לתשתיות התקשורת בארה"ב, מחשש לריגול ● הערכה: המהלך יקפיץ את מחירי הרחפנים בארה"ב, המשמשים בעיקר חקלאים

אילוסטרציה: טלי בוגדנובסקי / צילומים: עומר וידר, כדיה לוי

התקדים של רשות התחרות: הציטוטים שסיבכו את אייל רביד, ומי עשויים להיות הבאים בתור?

שנתיים לאחר שנחשפה פרשת תיאום המחירים, רשות התחרות החליטה לזמן את אייל רביד, מנכ"ל ויקטורי, לשימוע לפני הגשת כתב אישום ● לראשונה ובאופן תקדימי, קמעונאי מועמד לדין על בסיס התבטאויות בתקשורת ● בשבועות הבאים צפויות להתקבל החלטות לגבי עוד בכירים

סניף של שופרסל / צילום: Shutterstock

רגע אחרי הפסח: שופרסל שלחה לכמאה עובדים מכתבי פיטורים

לא מדובר בהפתעה מבחינת העובדים, שלא מעט מהם תיארו בתקופה האחרונה כי הם חוששים למשרותיהם ● רק אתמול הודיע המשנה למנכ"ל ניצן גולדברג על עזיבתו את החברה

משרדי אמזון / צילום: Shutterstock

אמזון הכתה את צפי הרווח וההכנסות אבל מורידה תחזית; המניה מזנקת במסחר המאוחר

הכנסות אמזוןעמדו על 143 מיליארד דולר, מעל הצפי ● הרווח למניה זינק ב-216% לעומת הרבעון המקביל ● החברה מצפה לצמיחה של 7%-11% ברבעון הבא, לעומת צפי של 12% ● המניה מזנקת בכ-4% במסחר המאוחר

גילעד אלטשולר / צילום: איל יצהר

שלושה מימושים גדולים: אלטשולר שחם בדרך לצמצם בחצי חשיפה למניות בישראל

באפריל הפסיק בית ההשקעות להיות בעל עניין בלאומי ובהפועלים, ומכר את מניות פוקס בכ–100 מיליון שקל ● כיום מתחלקות החזקותיו במניות ל–80% בחו"ל ו–20% בישראל, ובכוונתו להמשיך לממש, בעיקר נוכח האיום הגיאופוליטי ● גורמים בשוק: המכירה - גם בשל עזיבת הלקוחות

מודעה המציגה נשק איראני ברחוב בטהרן, השבוע / צילום: Reuters, Majid Asgaripour

לא בעזרת הצבא: כך יכולה ישראל להכריע את איראן

התקיפה האיראנית הכושלת נגד ישראל יצרה חלון הזדמנויות נדיר לסיכול התחמשותה הגרעינית של איראן ● במקום לפתוח בעימות צבאי, מהלך בעל השפעה מוגבלת, לו מתנגדת הקהילה העולמית, ישראל צריכה לגבש כוח משימה בין־לאומי שמטרתו לחנוק את איראן במישור הכלכלי

הרמטכ''ל הרצי הלוי / צילום: חדשות 12

הרמטכ"ל: המתקפה בעזה תלך חזק, מכינים גם מתקפה בצפון

הרמטכ"ל קיים הערכת מצב בגבול לבנון יחד עם מפקד פיקוד צפון • שני בתים נפגעו ישירות מנ"ט בשתולה שבגליל המערבי, נזק כבד נגרם • ישראל פתחה מחדש את מעבר ארז להעברת סיוע הומניטרי, 30 משאיות הוכנסו לצפון הרצועה • שר הביטחון גלנט נפגש עם שר החוץ האמריקני בלינקן בכרם שלום: "מחויבים לשחרור החטופים, ונערכים לפעולה ברפיח" • עדכונים שוטפים

אלי עזור / צילום: ניב אהרונסון-וואלהnews, עיבוד: טלי בוגדנובסקי

זכיות הלוטו של אלי עזור: אקזיט טכנולוגי ענק בוול סטריט והשקעת גז בבורסה בת"א

בשבוע שבו ניצח עזור במאבק שניהל על זהות הדירקטורים בחברת תמר פטרוליום - השקעה שבה הוא מורווח מאות מיליוני שקלים - הושלמה מכירתה של חברת טכנולוגיות הלוטו נאוגיימס, בעסקה שהזרימה לכיסיו 178 מיליון דולר ● נאוגיימס תימחק מנאסד"ק שבה הונפקה ב־2020

גלנט, נתניהו והלוי / עיבוד: טלי בוגדנובסקי, צילומים: עמוס בן גרשום-לע''מ, AP

צווי מעצר בינלאומיים לראש הממשלה והרמטכ"ל: האם התרחיש הזה אפשרי ומה המשמעויות

בישראל מביעים חשש שבית הדין הפלילי הבינלאומי בהאג יוציא צווי מעצר נגד בכירים בשלטון הישראלי, ובראשם ראש הממשלה, שר הביטחון והרמטכ"ל ● מהן הסכנות שבהוצאת צווים כאלה, באילו מדינות הם עלולים להיעצר, ומי ההרכב שיקבל את ההחלטה ● גלובס עושה סדר

טים קוק, מנכ''ל אפל / צילום: ap, Achmad Ibrahim

ההמלצה שהזניקה את השווי של אפל ב־70 מיליארד דולר ביום אחד

בית ההשקעות ברנשטיין פרסם בסוף השבוע האחרון המלצת קנייה אופטימית על אפל, שהזניקה את המניה המדשדשת וביקשה לנפץ את התחזיות הקודרות לגביה ● האם זה סימן להתאוששות?

טל–אור כהן מונטמאיור, מנכ''לית CyberWell / צילום: הגר בדר

גילויי האנטישמיות ברשתות החברתיות זינקו מאז המתקפה האיראנית

דוח חדש של ארגון CyberWell, שנלחם באנטישמיות ברשת, מצביע על כך ששיעור ההסרה של תוכן שטנה בערבית נמוך לעומת אנגלית ● המנכ"לית: "האכיפה חייבת להיות יותר אפקטיבית"