בינה מלאכותית של מיקרוסופט ישראל סייעה לאו"ם בזיהוי פעילי דעאש

צוות האו"ם לתיעוד פשעי מלחמה של דאעש בעיראק נעזר בכלי כחול לבן שפותח לניתוח ארכיוני וידאו בתעשיית המדיה • עד כה זוהו יותר מ-1,400 חשודים בפשעים נגד הקהילה היזידית

דגל דאעש בתיכרית / צילום: Associated Press, Khalid Mohammed
דגל דאעש בתיכרית / צילום: Associated Press, Khalid Mohammed

בינה מלאכותית מבית מיקרוסופט ישראל מחקר ופיתוח, המסייעת לניתוח ארכיוני וידאו, עזרה לאו"ם לזהות יותר מ-1,400 פעילי דאעש החשודים בפשעים נגד הקהילה היזידית בצפון עיראק. "מעל לפיתוחים שלנו, ישנה עוד שכבה של האו"ם שבודקת האם הפרצוף של החשוד זוהה במערכת, ומחברת את זה כמובן עם נתונים נוספים, כמו די-אן-איי ועוד", מסבירה ענבל שגיב, ראש קבוצת מוצר Azure Video Analyzer for Media, שמספרת בגאווה על שיתוף הפעולה.

כשראש ממשלת עיראק, חיידר אל-עבאדי, הכריז כי עיראק הביסה את דאעש והשיבה את השטחים הגדולים שהיו בשליטת המדינה האסלאמית - המערכה לא הסתיימה. בין השנים 2014-2017 דאעש ביצעה עבירות חמורות של חוקי זכויות האדם הבינלאומיים, המשפט הפלילי הבינלאומי ומשפט ההומניטרי הבינלאומי. זה מה שהוביל בשנת 2017 את ממשלת עיראק לקרוא לקהילה הבינלאומית שתסייע להבטיח שפעילי דאעש יישאו באחריות.

מועצת הביטחון באו"ם הקימה אז צוות חקירה שיהיה אחראי על איסוף, שימור ואחסון ראיות בעיראק - שיוכיחו קיום של פשעי מלחמה, פשעים נגד האנושות ורצח עם שבוצעו בעיראק. לצוות קוראים UNITAD, צוות החקירות של האו"ם לקידום האחריות לפשעים שבוצעו על ידי דאעש (ר"ת: Investigative Team to Promote Accountability for Crimes Committed by Da’esh).

בצוות הבינו שיש להם כמויות אדירות של ראיות שצילם ארגון הטרור בעצמו לצורכי תעמולה. אלא שבסרטונים לא ניתן לבצע חיפוש מבוסס טקסט פשוט - נדרשה היכולת לחפש את המטא-נתונים מסרטונים - משמע, פנים של אנשים, חפצים, מושגים מדוברים ועוד. כדי להשיג את הנתונים, החליטו בצוות המיוחד להושיב קבוצת חוקרים, שיצפו בסרטונים - שיטה שהוכחה מהר מאוד כלא יעילה והובילה אותם לחפש פתרון טכנולוגי שיסייע במשימה.

זיהוי פנים ונושאי שיחה

החוקרים בצוות המיוחד ביצעו סקר שוק כדי למצוא את הטכנולוגיה שתעזור להם לעבד את העדויות בצורה יעילה ומהירה. במשך שנה, הם בנו מערכת לניהול ראיות מקצה לקצה בשם ELMS, או בשמה המלא: Evidence Lifecycle Management System. למעשה, בתוך המערכת הזו, שיתפו פעולה עם חברת מיקרוסופט, ובעזרת כמה טכנולוגיות שעברו אדפטציה לטובת השימוש של האו"ם, הצליחו לייעל את המערכת הזו. אחד מהכלים שייעלו את המערכת משמעותית הוא כלי של מיקרוסופט שפותח בישראל בשם Azure Video Analyzer for Media.

מדובר בטכנולוגיית בינה מלאכותית מבית מיקרוסופט ישראל מחקר ופיתוח המסייעת לניתוח ארכיוני וידאו, כפי שמסבירה שגיב בראיון מיוחד לגלובס, מנהלת קבוצת המוצר במיקרוסופט מחקר ופיתוח: "קח איזשהו קובץ וידאו, קובץ אודיו, תעלה אותו לענן, מאחורי הקלעים אנחנו מריצים אלגוריתמיקה מאוד עשירה שמבוססת machine learning, כ-30 מודלים שונים של בינה מלאכותית רצים ומעבדים את הקבצים האלה, שומרים אותם בענן ובעצם מאפשרים לייצא מתוך קבצי אודיו או קבצי וידאו תובנות". המערכת מזהה מילות מפתח, מיקומים, פרצופים, סצנות, רגשות, זיהוי נושאי שיחה, תמלול ותרגום אוטומטי ועוד.

"הפתרון נועד לכתחילה לתעשיית המדיה והבידור. הפתרון קיים בענן האז'ורי של מיקרוסופט והייעוד שלו זה לנתח תובנות מקבצי קול ו-וידיאו. כל ארגון המחזיק ספריות וארכיונים של וידיאו וצריך לשלוף מידע במהירות וביעילות - יוכל להשתמש בכלי הזה", אומרת שגיב. משמע - גם תעשיות כמו ערים חכמות ומצלמות שקיימות בכל מיני מקומות. לדוגמה - המערכת תדע לומר מי הם הסלבריטיז שהופיעו בסרט, מה הן מילות המפתח שהופיעו בסרט, מתי נשמע קול של פיצוץ, מתי היו מחיאות כפיים? איזה לוקיישנים הוזכרו שם? וכן הלאה. 

לפי דוח ההתקדמות של הצוות המיוחד של האו"ם מחודש מאי, זוהו עד כה 1,444 פעילי דאעש פוטנציאליים, כש-469 זוהו ככאלו שתקפו בעיר סינג'אר ו-120 בתקיפה על הכפר קוג'ו. וגם - זוהו 20 חשודים ברצח המוני בתיכרית. הממצאים מתבססים על כמויות מאגר נתונים אדיר: 34 אלף קבצי וידאו ו-175 אלף פרופילים של אנשי דעאש.

שיתופי פעולה חסויים

שגיב (37), היא אם לשלושה 3 ילדים ומתגוררת בכפר סבא. היא הצטרפה למיקרוסופט לפני כשנה וחצי בתחילת תקופת הקורונה, לאחר 15 שנים בתחום הענן, בעיקר בחברת התוכנה הגרמנית SAP. כיום היא עומדת בראש קבוצת המוצר Azure Video Analyzer for Media. "היופי כאן שזה באמת טכנולוגיה כחול-לבן", מתארת שגיב. "המוצר הזה פותח במיקרוסופט ישראל מחקר ופיתוח לפני ארבע שנים כאיזשהו רעיון של מישהו. מיקרוסופט מאפשרת אינקובציה, אינקובציה זה בעצם חממה שמאפשרת לרעיונות ספציפיים, מאפשרת להם איזשהו תקציב ואיזושהי מסגרת של זמן ואז בדיוק כמו שיש בסטארט-אפים יש לך איזשהו סטארט-אפ בתוך ארגון גדול".

איך מתאימים את הכלי לשימושים השונים?
"במיקרוסופט יש גוף בשם Customer Engagement שיושב ועובד עם לקוח מסוים ותופר לו את הפתרון המותאם לו. שיתוף הפעולה עם האו"ם התחיל לפני שנה. שמענו מה הם צריכים, לדוגמה אנחנו צריכים זיהוי של שפה טורקית באופן אוטומטי".

שגיב מוסיפה, כי "מעכשיו לא רק החוקרים של UNITAD, אלא עוד גורמים בתוך האו"ם הולכים לחבק את הטכנולוגיה הזו ולהשתמש בה גם עבור חקירות נוספות שיש להן את אותו הסגנון ומצריכות את אותה טכנולוגיה".

ענבל שגיב, מיקרוסופט ישראל / צילום: תמונה פרטית
 ענבל שגיב, מיקרוסופט ישראל / צילום: תמונה פרטית

האם ישנם שיתופי פעולה אחרים? אולי ישראל או מדינות אחרות?
"רק אגיד שיש לנו המון שיתופי פעולה עם גורמים שאני לא יכולה להזכיר כרגע. החבר'ה של המכירות שלנו בארץ מאוד אוהבים את המוצר הזה, והחזר ההשקעה מאוד מהיר".

סיוע לאח הגדול ההולנדי

עם זאת, שגיב מזכירה לקוחות בתחום המדיה כמו חברת Media Valet. דוגמה נוספת ללקוח גדול היא חברת ההפקות ההולנדית Endemol Shine, שחתומה בין היתר על האח גדול. "במקום שיהיה אדם שיישב ויצפה בכל חומר הגלם של התוכנית, המערכת תדע לציין שב:01:47 דיברו על נושא כזה וכזה ולטייב את זמן הצפייה של אנשי ההפקה".

איך מוודאים שכלי כזה לא יעבור לשימוש הרעים?
"יש לנו קבוצה שנקראת Ethical AI וכל מוצר שאנחנו מוציאים עובר תהליכים מאוד רחבים כדי לוודא שאנחנו עושים את הדבר הנכון. אנחנו מגדירים את הסטנדרטים על מה אנחנו צריכים לאכוף ואיך. לדוגמה, אתה לא יכול לעלות שום קובץ וידאו לתוך המערכת מבלי לאשר שאתה משתמש בו למטרות כאלה ואחרות, וזה מעוגן אצלנו בתנאי השימוש של המוצר. מלכתחילה, אנחנו נשתף פעולה רק אחרי שנוודא את הלקוח".

ומה השלבים הבאים?
לשאלה הזו, שגיב עונה באמצעות דוגמה. בגלל שהכלי מסייע לתעשיות המדיה, הם יושבים עם צוותי ההפקה והבימוי כדי לבחון מה חסר להם במוצר ומה היה יכול לעזור להם עוד. "הרבה מהדאטה הגולמי של אנשי ההפקה, מכיל את הקלאפרים בתחילת הסצנות - שכתוב עליהם מספר השוט. הם אומרים תני לי באופן אוטומטי אלגוריתם כזה שידע לזהות את השוט וידע לזהות את הטקסט שכתוב עליו. בנוסף, אנחנו מאפשרים חיפוש על ארכיון של וידיאו - זיהוי פעולות של אנשים ומסלולים. אנחנו לא מספיק טובים בזיהוי האדם שלובש חולצה אדומה. אז אנחנו עובדים על מה שאנחנו קוראים לזה person attributes, כלומר לדעת להוסיף עוד תכונות כשהבן אדם גם לובש כובע, הבן אדם מחזיק מזוודה, הבן אדם לובש חולצה אדומה", מסבירה שגיב.

היעד של שגיב? לעשות שיתופי פעולה עם השחקנים הגדולים ביותר בתעשיית המדיה הבידורית בכל העולם. לצד זאת, הם לא פוסלים התרחבות לתחומים נוספים בשנת 2023. "כרגע אנחנו מאוד סביב מדיה בידורית, ויהיו לנו גם הכרזות של אלגוריתמים נוספים בעוד כחצי שנה", חותמת שגיב.