משרד האוצר | ניתוח

כששר האוצר הולך לבדוק בנתונים של גוגל מה שיעור האבטלה

שר האוצר ישראל כ"ץ טוען שהאבטלה עומדת על 16% "לפי נתוני גוגל" • הנתונים הרשמיים גבוהים יותר • החשש: נתונים לא נכונים ישמשו לאימוץ מדיניות שגויה

ישראל כ"ץ / צילום: עדינה ולמן, דוברות הכנסת
ישראל כ"ץ / צילום: עדינה ולמן, דוברות הכנסת

שר האוצר ישראל כ"ץ מתייחס בימים האחרונים לא פעם לחברת גוגל כאל מקור מידע מרכזי שממנו ניתן לקבל נתונים לגבי מצב הפעילות הכלכלית של המשק. בראיון לערוץ 12 ציין כ"ץ כי "לפי גוגל 90% מהעובדים במשק חזרו לעבודה רגילה". בדיון בוועדת הכספים ציין שר האוצר כי "לפי הערכות גוגל שיעור האבטלה במשק עומד על 16%". גם ראש הממשלה בנימין נתניהו הציג את נתוני הניידות, המבוססים על עיבודים של גוגל ואפל, באחת ממסיבות העיתונאים שערך. ההערכות הן ש-16% מייצגים כ-640 אלף מובטלים.

נתונים שפורסמו בתקופה האחרונה מצביעים על מציאות הרבה פחות אופטימית. הלמ"ס פרסם בחודש מאי שיש 684 אלף עובדים בחל"ת, שירות פרסם שמספר דורשי העבודה במשק עמד בחודש על מאי על 960 אלף ואילו הביטוח לאומי פרסום לפני כעשרה ימים שהוא מטפל ב-738 אלף תביעות. שיעור האבטלה האחרון, שפורסם ב-26 באפריל ועמד על 27.4%. כולם מסכימים שהמצב השתפר מאז, בעקבות ההקלות בסגר, אבל אין נתון רשמי בנושא.

האם הנתונים של גוגל מספקים תמונת מצב אמינה של חזרת המשק לפעילות כלכלית? לא ממש. הנתונים אכן מציגים תמונת מצב לגבי הניידות של הישראלים, אך האלגוריתם סובל מבעיות מתודולוגיות והדוגמה הבולטת ביותר לכך היא מחוז תל אביב: לפי מדד הניידות החזרה למקומות העבודה באזור תל אביב היא הנמוכה ביותר בארץ.

ההיגיון אומר שבאזור תל אביב יש שיעור גבוה במיוחד של עובדים בענפים כמו הייטק שממשיכים לעבוד מהבית - רק שהטכנולוגיה שבשימוש גוגל ואפל מזהה אותם בטעות כמי שלא חזרו עדיין לעבודה. מהיכן נלקחה הערכתו של כ"ץ לגבי שיעור האבטלה? זה כבר הרבה פחות ברור. "זה יהיה די מסוכן להסיק ממידע על הניידות מסקנות לגבי שיעור האבטלה או העובדים בחל"ת", אמר ל"גלובס" חוקר המכיר את שיטות האיסוף והעיבוד של הנתונים.

בנתוני הניידות של הישראלים אפשר לצפות באתר בנק ישראל בדף שמכונה "אינדיקטורים מהירים נבחרים למצב הפעילות הכלכלית במשק בזמן משבר הקורונה". מדובר בפרויקט מעקב של חטיבת המחקר של הבנק, שיצא לדרך בתחילת משבר הקורונה. הרעיון היה לעקוב באופן שוטף אחר מצב הפעילות הכלכלית במשק תוך הסתמכות על מקורות מידע שונים. את נתוני הצריכה הפרטית מספקת חברת שבא שמרכזת את נתוני השימוש בכרטיסי אשראי. את נתוני הניידות מספקים האלגוריתמים של גוגל, אפל, אפליקציית ווייז ואת נתוני צריכת החשמל מספקת חברת החשמל. בנק ישראל מעדכן את הנתונים כל כמה ימים.

המטרה היא להציג את נפח הניידות הנוכחי ביחס לנפח הניידות לפני משבר הקורונה. הנתון המעודכן האחרון מתייחס ל-14 ליוני - נפח הניידות באותו יום היה נמוך בכ-12% מהנפח לפני המשבר. זה נתון גבוה ביחס לממוצע ה-OECD שהיה נמוך יותר נכון לאותו יום בכ-34% ביחס לרמה שלפני המשבר.

הבעיות המתודולוגיות מתחילות לצוץ כשבודקים ממה מורכבים נתוני הניידות. מדובר בנתונים שמגיעים משלושה מקורות שונים. גוגל אוספת אותם מהמשתמשים באנדרואיד, שמאשרים ליישומונים שלה לקבל גישה למיקום שלהם. אפל מנתחת את השאילתות של המשתמשים במכשירי האייפון שלה. המקור השלישי הוא אפליקציית ווייז שמנתחת את הנסועה של המשתמשים באפליקציה שלה. לא צריך להתאמץ כדי לחשוב על דוגמאות להטיות בנתונים האלה. השימוש בווייז למשל מושפע מכמות הפקקים. כשנפח התנועה נמוך שיעור השימוש בווייז מצד נהגים יורד - וכך מתקבלת תמונה שמטה כלפי מטה את היקף הנסיעה בכבישים. 

מידע מהסוג שאוספת גוגל מורכב יותר: מדובר בשיטת איסוף שמבוססת על נתוני המיקומים של המשתמשים שלה בהתאם לסוג המקומות שבהם שהו. שהות של מסוים במקום המסווג כמשרד או מקום עבודה אחר יכולה להביא לסיווגו של אותו משתמש כמי שחזר לעבוד. לחברה אין אפשרות לדעת האם מקום העבודה שבו שהה המשתמש הוא אכן מקום העבודה שלו ולאיזו מטרה שהה באותו מקום - האם חזר לעבוד כרגיל או שאולי הלך לראיון עבודה במקום עבודה חדש משום שפוטר מעבודתו הקודמת. ומה באשר למי שמקום עבודתו בקניון או במרכז קניות? על פי ההיגיון של האלגוריתם הוא עשוי להיות מסווג כמי שיצא לקניות ולא כמי ששב למקום עבודתו.