בעזרת 8200: מאגרי הנתונים שהממשלה פרסמה על הקורונה

קבצי אקסל עם נתונים על כמאה אלף בדיקות, ועל מספר המבודדים, עלו לאתר מאגרי המידע הממשלתיים • איסוף המידע והנגשתו מבוססים בין היתר על שיתוף הפעולה של הממשלה עם יחידת המודיעין 8200 • גורמים בתעשייה שבדקו את המאגר: "לא מספיק אבל התחלה טובה"

צעירות עם מסכות בת"א / צילום: Oded Balilty, AP
צעירות עם מסכות בת"א / צילום: Oded Balilty, AP

כמה בדיקות קורונה בוצעו בישראל? באילו תאריכים הן בוצעו ומה היו התוצאות של כל בדיקה ובדיקה? כמה אזרחים בישראל נמצאים בבידוד? כמה מבודדים נוספו בכל יום לרשימת המבודדים? - את כל המידע הזה, בטבלאות אקסל מפורטות, פרסמה השבוע הממשלה בצעד יוצא דופן באתר מאגרי המידע data.gov.il המופעל על ידי רשות התקשוב הממשלתי.

המידע המפורט, הוא אחד מפירות עבודת איסוף וארגון של יחידת המודיעין 8200 שהחלה לסייע למשרד הבריאות במאבק בקורונה כבר בחודש שעבר. במסגרת שיתוף הפעולה גויסו היכולות של היחידה הצה"לית כדי לספק למשרד הבריאות את המידע הדרוש להם לביסוס קבלת החלטות במלחמה במגפת הקורונה. עתה חלק מהמידע הזה מתפרסם באופן גלוי ופתוח לציבור, על מנת שיוכל לשמש חוקרים ומפתחים הזקוקים לו לצורך מחקר ופיתוח מוצרים רלוונטיים למשימה הלאומית.

נכון למועד השקת עמוד המידע תחת הכותרת "מאגר COVID-19" מופיעים בו קבצי אקסל עם פרטים על כמות הבדיקות והבידודים, אולם בקרוב יתווספו אליו מאגרי מידע נוספים עם חלוקה גיאוגרפית וכן מידע מפורט לגבי מצב החולים ומיקום אשפוזם. המידע לא כולל פרטים אישיים על נבדקים ומבודדים. לצד קבצי האקסל מוצעת גישה למידע גם דרך API מקוון וכן קבצי PDF עם הסברים מפורטים וברורים גם למי שאינם אנשי מקצוע.

בעזרת המאגר יוכלו חוקרים לראות את כל הבדיקות שבוצעו בישראל על ציר הזמן וכך, למשל, לבצע ניתוחים מקיפים על כל ההתקדמות של הבדיקות בישראל ולקבל תמונת מצב מלאה.

לדברי מקור בכיר בהייטק הישראלי שבחן את המאגר, מדובר בצעד יוצא דופן של ממשלת ישראל שמשתפת מידע שדרוש לקהילת החוקרים, וזאת בשונה ממדינות רבות אחרות שלא ממהרות לשתף דאטה מסוג זה. לדבריו, "זו אחח האנומליות בעולם - ממשלות כמעט לא משתפות מידע". המקור ציין בהקשר זה מאגר נתונים של הונג קונג שמדגימה מדיניות שיתוף מידע נדיבה. יחד עם זאת ציין המקור כי המידע שמפורסם עתה בישראל הושג בשיטות ידניות ואיטיות, וזאת בשונה ממדינות רבות בעולם, שמחזיקות תשתית שיתוף מידע שמתעדכנת באופן שוטף ואוטומטי. לדבריו, המאגר המדובר בסיסי, אך מדובר ב"התחלה טובה".

מקור נוסף שבדק את המאגרים לבקשת "גלובס" טען כי לפי שעה הנתונים שהתפרסמו אינם בעלי תועלת רבה והביע תקווה שבקרוב יפורסמו נתונים נוספים ובראשם מספר החולים החדשים בכל יום, מספר המתים החדשים בכל יום, מספר המחלימים, מספר מחלימים וככל שניתן גם נתונים על גיל, ישוב, ודירוג של מחלות רקע.

המקור הסביר כי "במשרד הבריאות אמנם מבטיחים נתונים על מספר החולים, המחלימים והנפטרים החדשים בכל יום ומאיזה ישוב הגיעו, וזה טוב, אבל השאלה היא את מי המידע נועד לשרת. כדי שהוא ישרת את הציבור יש להוסיף, לפי המודל של הונג קונג למשל, את כתובות הבניינים שבהם התגלו נשאים ב-14 הימים האחרונים ומרכולים שבהם ביקרו בימים מסוימים - אם מידע כזה קיים. אם המטרה היא לשרת את קובעי המדיניות, ראשי הערים והרופאים, אז יש להוסיף את הגילאים ואת המצב הבריאותי המקדים של החולים, ולו רק לציין אם היו או לא היו להם מחלות רקע".

עוד טען המקור כי "מעל הכל, יש להעלות את הקבצים האלו למאגר נתונים ולייצר מהם גרפים שיתנו למחליטים הבנה חזותית מיידית לגבי המגמות בכל ישוב וישוב: האצה או האטה, מגמות לגבי גילאים של נפטרים ולגבי מצבם של הנפטרים: האם זקנים נדבקים יותר או פחות מאשר חלקם היחסי באוכלוסייה". הוא הסביר כי למידע זה חשיבות בהחלטה האם אפשר יהיה להוציא אנשים בגילאי עבודה לשוק, אם למשל יתברר שבמספרים גדולים של הדבקה המונית הם עלולים למות במספרים משמעותיים, או שכתוצאה מכך זקנים נדבקים יותר".