מה קרה כשהלמ"ס עברה משאלוני נייר למחשב ועיוותה את נתוני השכבות החלשות

לפני מספר שנים שינתה הלמ"ס את שיטת המדידה בסקריה, בין השאר בעקבות המעבר לשיטה ממוחשבת וחוסר שיתוף־פעולה מהציבור, שהביא לאמידה מחדש של כל מגזר • כעת גם שם מבינים שאולי נוצרו על הדרך עיוותים לא מתוכננים, שעלולים להשפיע על מדיניות הממשלה • חורים בנתונים

כשהלמ''ס עברה משאלוני נייר למחשב ו''ניפחה'' נתוני השכבות החלשות / אילוסטרציה: טלי בוגדנובסקי
כשהלמ''ס עברה משאלוני נייר למחשב ו''ניפחה'' נתוני השכבות החלשות / אילוסטרציה: טלי בוגדנובסקי

בסיסי נתונים מהימנים ועדכניים הם תנאי סף לקבלת החלטות מושכלת. אלא שגם בעידן עתיר מערכות מידע, חלק גדול מהנתונים הכלכליים והדמוגרפיים המשמשים לקביעת מדיניות, אינו מספק - אם בשל קשיים באיסוף מידע, בעיות מדידה או סילופים סטטיסטיים. סדרת הכתבות "חורים בנתונים" צוללת לעומק הדאטה שעל בסיסה נקבעת מדיניות במגוון תחומים כלכליים, ובוחנת כיצד אי דיוק בנתונים עלול להוביל למסקנות שגויות ולהחלטות מוטעות

שינוי מתודולוגי שביצעה הלשכה המרכזית לסטטיסטיקה (למ"ס) בסקריה עלול לייצר עיוותים בנתונים ובמגמות העולות מהם, ולהציג מצג לא מדויק של נתונים עבור מקבלי ההחלטות הנשענים עליהם. כתוצאה מההטיות, לגלובס נוגע כי הלמ"ס תבצע שינוי נוסף בניתוח ובהצגת חלק מהנתונים לשנת 2023.

דוח מרכז טאוב: ישראל המדינה היקרה במערב
ירושלים הפכה לעיר הראשונה בישראל עם יותר ממיליון תושבים

בשנת 2019, לאחר שהתקשתה להביא אנשים להשיב לסקר ההוצאות שהיא עורכת, החליטה הלמ"ס לשנות את שיטת האמידה. מאוחר יותר, לאחר שהתפרסם (באיחור גדול) סקר ההוצאות, הסבירה לנו הלמ"ס כי "עד כה לא פורסמו נתוני סקר הוצאות משקי הבית לשנים 2019-2020 המעודכנים, בשל צניחה משמעותית בשיעורי ההשבה לסקר". לכן, ציינו שם, "עבדנו על פיתוח שיטת אמידה חדשה שתייצר אומדנים מהימנים". מדובר בעיקר בשימוש באומדנים חדשים בנוגע לגודלו של כל מגזר, בין השאר מתוך הכרה בכך שלא כולם משתפים פעולה עם הלמ"ס באותה מידה. על אחת כמה וכמה לאחר שהלמ"ס החליפה את השיטה הידנית (שאלוני נייר) בשיטה ממוחשבת, שלא מתאימה עדיין לכולם.

על פניו, מדובר במהלך חיובי ומתבקש. חשוב להבין שסקר ההוצאות של הלמ"ס הוא בעל משקל קריטי במדיניות הממשלתית. הסקר מנתח את ההתנהגות הכלכלית של משקי הבית, ומתוך כך נוצרות המשקולות של מדד המחירים לצרכן, ונתונים רשמיים נוספים כמו הכנסה מעבודה, שיעור לקיחת המשכנתאות ונתונים נוספים הנדרשים לכל החלטה.

"הנתונים אינם בני השוואה"

אלא שייתכן ודווקא הפתרון הזה - שינוי שיטת המדידה - יצר בעיות חמורות עוד יותר, ודי לראות את התופעות המשונות שנוצרו בעקבות השינוי. לא בכדי, השבוע פרסמה הלמ"ס את התפלגות הכנסות משקי בית לפי עשירונים מאז שנת 1997, אולם ציינה בהערת אגב כי "בשנת 2019 שונתה שיטת האמידה, ולכן הנתונים אינם בני השוואה לנתוני שנים קודמות". כלומר, אל תנסו להסיק ממה שקרה פה בשנת 2018 או לפניה, למצב היום.

כך למשל, כאשר סוכמים את מספר משקי הבית לפי חמישון הכנסה לאורך השנים, מגלים עליה מתמדת שדומה בקירוב לגידול באוכלוסייה. אבל החל מ־2019, על רקע השינוי במודל, הגרף השתנה דרמטית. חמישונים 1 ו־2 (הנמוכים) זינקו, בזמן שהחמישונים 4 ו־5 (הגבוהים) צנחו. לכאורה, על פי הלמ"ס, זה נועד לפצות על ירידה בשיעורי ההשבה לסקר של השכבות החלשות, כך שהם יקבלו משקל גבוה יותר בהשוואה לשכבות הגבוהות יותר. אך כך, עלול להיווצר "פיצוי יתר" שמרחיק אותנו מהאמת.

במקביל, השכר הממוצע לפי הנתונים המנהליים שבידי ביטוח לאומי היה כ־11,500 שקל בחודש בשנת 2018. במקביל, על פי סקר ההוצאות "הישן" של הלמ"ס, השכר הגיע לכ־11,000. זה אינו הבדל משמעותי, ולא ניתן לצפות ששתי השיטות יגיעו לאותו מספר. אך על פי השיטה החדשה, הפער גדל משמעותית: ב־2018, לפי השיטה החדשה, השכר הממוצע צנח ל־10,400 בלבד. ככל שהזמן עובר, הפער מחריף: אם ב־2018 (שיטה ישנה) הפער היה 4% בלבד, ב־2021 הוא כבר מגיע ל־12% מהשכר. זה אינו פער זניח כלל, והוא עלול להביא לקבלת מידע שגוי - וממילא לגיבוש צעדי מדיניות שנשענים על מידע מוטה.

ד"ר איתן רגב, סמנכ"ל מחקר במכון החרדי למחקרי מדיניות, מציין ש"ישנם מצבים שבהם מסיבות שונות חלק מהאנשים אינם מדווחים אמת בסקרים וקשה מאוד להתמודד עם זה. כך לדוגמה, גילינו לאחרונה ששיעורי התעסוקה האמיתיים של נשים ערביות גבוהים בכ־40% ממה שהן מדווחות בסקרים, ודיווח החסר נובע כנראה מסיבות תרבותיות וחברתיות. באופן דומה, מעבר לסקר ממוחשב יכול להשפיע על נכונותם של חלק מהחרדים לענות ועל תשובותיהם של העונים".

"כל בחירה בעייתית והסיכוי לטעות גדול"

סקר ההוצאות, בניגוד למפקד האוכלוסין שנערך פעם במספר שנים בהשקעה כספית גדולה, אינו יכול להקיף את כל או אפילו חלק ניכר מאזרחי ישראל. לכן, סוקרים כמות קטנה יחסית של משקי בית, שאמורים לייצג את כלל משקי הבית בישראל. עושים זאת על ידי "ניפוח" של משקי הבית במקדמים שונים בהתאם למאפיינים כמו מגזר, גיל, וישוב מגורים. כך שלמעשה, כל משק בית מייצג משקי בית רבים נוספים הדומים לו.

"חישוב המקדמים הוא פעולה מאתגרת מאוד" אומר צביקה דויטש, בעל תואר שני בכלכלה ובסטטיסטיקה שעובד היום במחלקת המחקר בעמותת "יוצאים לשינוי". לדבריו, "כל תקנון של משקי הבית בהתאם למאפיין מסוים - יוצר שינוי בשכיחות של המאפיינים האחרים של משקי הבית, שלא נעשה להם כיול. כל בחירה היא בעייתית והסיכוי לטעות במשהו גדול.כל פעם שמשנים את השיטה בשביל לתקן גורם אחד, עלולות ליצר תופעות לוואי אחרות בלתי צפויות"

לעיוות בנתוני הלמ"ס עלולות להיות השלכות דרמטיות, בשל ההסתמכות הנרחבת שיש לגורמי קבלת ההחלטות בממשלה ולמחקר הכלכלי כאחד. החל ממדד המחירים לצרכן, ועד כמה הוא מייצג את ההתייקרויות בפועל, עד רמת ההשתלבות של החברה החרדית והתמורות הכלכליות העוברות על החברה הישראלית ככלל. ייתכן שהפערים אינם דרמטיים, אך כל פער ועיוות בנתונים הרשמיים של מדינת ישראל הוא בעייתי, וזה דורש בחינה מעמיקה של המתודולוגיה החדשה, ואם צריך - גם תיקון שלה. נראה שגם הלמ"ס מודעים לכך, שכן בתגובתם הם מדגישים שהחל מ־2023 ההכנסות מעבודה ומקצבאות (שהושפעו במיוחד מהמתודולוגיה החדשה) ייזקפו מקבצים מנהליים בלבד - ולא מתוצאות הסקר עצמו.

בלמ"ס אמרו לנו בתגובה, כי "השינוי המתודולוגי בוצע בעקבות ירידה בשיעורי ההשבה, אך גם בשל ניתוח נתונים שהדגים קשר בין הכנסות הפרטים להסתברות ההשבה". כך למשל, הם מציינים כי "ניכר שאחוזי השבה בקרב בעלי שכר מנהלי באחוזונים העליונים גבוהה מהתפלגותם באוכלוסייה, כך למשל בקרב גברים ביישובים יהודיים ומעורבים 8.9% מהנדגמים בשנת 2019 שייכים לאחוזון העליון לעומת 7.3% באוכלוסייה. הקשר בין הסתברות ההשבה למשתנה המטרה של הסקר יוצר הטיה מעלה של הנתונים הלא משוקללים. שיטת הכיול החדשה, בה מתאימים את התפלגות המדגם להתפלגות האוכלוסייה לפי עשירוני ההכנסה, באה להתמודד עם הטיה זו".