"אמנון המתמלל": המיזם של הישראלי שמאס בהודעות קוליות בוואטסאפ

לשילה מגן נמאס מההודעות הקוליות בוואטסאפ, והוא ניסה למצוא פתרון שיהפוך אותן לטקסט • הפתרון שלו הוא בוט שמופיע כאיש קשר באפליקציה וממיר את ההקלטה להודעה כתובה • לרוב השירות מספק את הסחורה, אך מומחי פרטיות מזהירים: שימו לב לאותיות הקטנות

אפליקציית וואטסאפ / צילום: Shutterstock, Wachiwit
אפליקציית וואטסאפ / צילום: Shutterstock, Wachiwit

התרחיש בו מקבלים הקלטה בוואטסאפ ובדיוק אי אפשר לשמוע אותה הוא מצב מוכר ונפוץ בקרב משתמשי האפליקציה. יזם ומפתח ישראלי מעוניין לפתור את הבעיה, ולכן המציא את "Amnon The Transcriber" - בוט שיקבל את ההקלטה, ויהפוך אותה לטקסט בפשטות. בימים האחרונים העמדנו את אמנון המתמלל לבדיקה, ובחנו אם כדאי להשתמש בו.

המטרה: נוחות, ויותר חשוב - הנגשה לכבדי שמיעה

הבוט הוא מעין איש קשר שנשלח בוואטסאפ, ללא צורך לשמור אותו בנייד - אליו מעבירים את ההודעה הקולית, ומקבלים בחזרה תמלול של ההקלטה אחרי כמה שניות. מי שעומד מאחורי הבוט הוא שילה מגן, אחד המפתחים שפורסם לפני כמה שבועות כששחרר את הבוט לקביעת תורים לדרכונים, שבסופו של דבר נחסם.

נכון לעכשיו, הבוט מוגבל לרשימה מצומצמת של אנשים שבוחנים את הכלי. בין המגבלות שמגן החליט להציב בבוט: יהיה אפשר לשלוח אליו הקלטה של עד דקה, ובעברית. "אנחנו לא רוצים שאנשים יעשו שימוש לרעה, כמו לדוגמה להעלות פרקים שלמים של פודקאסטים וספרי אודיו. אני לא רוצה שאנשים ישתמשו בפלטפורמה לשימושים רעים", הוא אומר. בנוסף, הפרויקט נועד לשימוש ישראלי בלבד, ולא נועד להיות סטארט-אפ בינלאומי חדש או פרויקט גדול, אלא רק לפתור לישראלים בעיה ברורה.

"בעיקרון, התחלתי את זה בשביל עצמי. ראיתי שאני בפגישות כל היום ואני לא יכול להקשיב להודעות קוליות תוך כדי פגישה", מציין מגן. כחלק מתהליך הפיתוח, הוא גילה שימוש הרבה יותר חשוב בבוט הזה - כבדי שמיעה. "תוך כדי הפיתוח של הדבר הזה, ראיתי שהייתה אפליקציה שנקראת "תכתוב אחי" וזו הייתה אפליקציה חיצונית שנסגרה. כשהסתכלתי על עמוד הפייסבוק שלהם, ראיתי חירשים וכבדי שמיעה ששואלים מדוע האפליקציה נסגרה, ואומרים 'הייתם המוצא האחרון שלי'". לכן פרסמתי בטוויטר שלי שכל כבד שמיעה שרוצה להצטרף לבטא, יקבל גישה מלאה בלי הגבלות", סיפר מגן.

לדבריו, הוא לא עושה זאת כדי להתעשר או להקים חברה גדולה: "אני עושה את זה כשירות לציבור, אני עושה זה בשביל הכיף. הקוד פתוח לחלוטין וכל מי שרוצה יכול לראות. אני רוצה שאנשים ילמדו מהקוד או יעירו הערות".

ביצועים: הבוט עובד טוב, אך יש מקום לשיפור

בימים האחרונים, הכלי נבחן באמצעות הקלטות שונות. מן הבדיקה עלה כי אמנון בסך הכל עושה את עבודתו בצורה טובה, אם כי הוא מפספס בנקודות מסוימות. ראשית, אם הדובר בהקלטה מדבר במהירות גבוהה, אמנון לא יזהה את המילים כמו שצריך ויתמלל אותן בצורה שגויה. שנית, הבוט לא יודע לזהות מילים בלועזית שאינן בשימוש נפוץ. "אמנון לא אוהב הייטקיסטים, כי אנחנו מדברים בשפה מתובלת עם מילים כמו 'קפסיטי' ו'ספרינטים', והוא לא יודע איך להתמודד עם זה עדיין", מסביר מגן. בנוסף, כשאמנון לא מבין את ההקשר, הוא עשוי לפספס את המשפט כולו.

מעבר לזה, התוצאות לא מדויקות כל הזמן, בטח אם תנאי הסאונד לא טובים. מגן אומר שהוא מוסיף תיקונים, וגם מציין כי הבוט עוד ב"תהליכי למידה": "לדוגמה, עבור כל תמלול המנוע מציע ציון. הוא יכול להגיד שהתמלול מדויק בסבירות של 87%". לדבריו, הוא מתכנן לפרסם את הסטטיסטיקות לאורך זמן, משום שהוא רוצה לחשוף כמה שיותר מידע.

בעיה נוספת שהתגלתה בעת השימוש בבוט: הוא לא מקבל קבצי סאונד רגילים. אמנון יודע לתמלל רק אודיו בפורמט ההקלטה של וואטסאפ, כלומר קבצים עם סיומת ogg. אם תחליטו לשלוח אליו לתמלול קובץ mp3, תקבלו הודעת שגיאה. מגן אמר כי בעתיד הבוט יוכל לתמוך גם בהקלטות רגילות.

פרטיות: הבוט מתחייב לשמור על המידע, אבל חובה להיזהר!

חובה להדגיש - המידע שלכם מההקלטות נמצא על השרתים שמעורבים בשירות הזה. ההקלטות נשמרות בשרתי מטא (פייסבוק לשעבר), אשר וואטסאפ בבעלותם. לדברי מגן, הוא היה יכול לשמור את ההקלטות אצלו, אך הוא בחר שלא לעשות זאת. עם זאת, התמלולים עצמם אכן נשמרים בשרתים של גוגל ובשרתים שלו, אבל אלו מוצפנים במאגר המידע.

"אני אסגור את המיזם הזה, לפני שאני אמכור פיסת מידע על משתמש", מתחייב מגן, ומוסיף: "אני לא מתעניין בזה ולא מתעסק בזה". הוא מציין כי גם אם הוא רואה את התמלול, הוא לא יודע מי אמר את הדברים ומאיפה המידע עצמו מגיע. בשרתים שלו הוא רואה את התמלולים השונים עבור סטטיסטיקות, כדי לראות איך אנשים משתמשים בשירות, ולא כדי למכור דאטה.

מנכ"ל איגוד האינטרנט הישראלי, יורם הכהן, שבעבר הקים את הרשות להגנת הפרטיות - מוסיף על דבריו של מגן וקורא לערנות המשתמשים ברשת באופן כללי. "חשוב לדעת שברגע ששירות (במקרה הזה וואטסאפ) מבוסס על שימוש בכלי אחר של פלטפורמה אחרת (במקרה הזה, גוגל) - הרי שכל מדיניות השימוש במידע כפופה גם למדיניות השימוש של אותה פלטפורמה. במקרה הספציפי הזה, מדובר במדיניות השימוש לא רק של וואטסאפ אלא גם של גוגל. הציבור צריך להיות מודע שהמידע שלו נמצא בשימוש על ידי גוף נוסף", כך הכהן.

הכהן מנצל את ההזדמנות כדי לעודד את המשתמשים לשים לב היכן מפזרים את המידע ברשת, ולהעלות את המודעות בנושא: "תוודאו שהמידע שאתם מעבירים וחושפים אינו מידע רגיש מבחינתכם - כל אחד והגדרתו לרגיש. כאמור, העברת מידע לפלטפורמה אחרת, משמעותה שהשימוש במידע האישי שלנו כפוף לכללים של אותה פלטפורמה. לכן, השימוש במידע יכול להיות למטרות אחרות מאלו שתכננו מלכתחילה כאשר נרשמנו לשירות המקורי - למשל, לצרכים מסחריים, הצגת פרסומות ועוד".

השלב הבא: לבנות מודל עסקי לשם תחזוקת המערכות

כאמור, מגן מקבל משכורת מחברת הייטק בישראל, והוא לא מתכנן לעשות מהמיזם כסף גדול. אבל הוא מסתכל על העתיד כדי לתחזק את אמנון בטווח הרחוק. "עלויות התמלול לא זולות. המערכת רצה על שני עננים: על AWS, ומנוע התמלול רץ על הענן של גוגל. המחירים לא זולים. זאת אומרת, אני לא יכול לשחרר את אמנון לכולם, כי בסוף זה יורד מהכיס שלי", הוא מסביר.

לפי התכנון, אמנון ייפתח בקרוב לחודש של שימוש לכולם, כדי שמגן יוכל להבין איך אנשים משתמשים בזה ולבנות מודל עסקי. הוא עושה זאת כדי שאמנון יוכל "לכלכל את עצמו" ולא יפסיד כסף. המגבלות עתידות לרדת בהתאם למודל התמחור שהוא יפתח עם הזמן. חוץ מזה, הוא אומר שהוא רוצה לשחרר את הכלי לכבדי שמיעה בצורה מורחבת.

בשורה התחתונה: הכוונות טובות, הזהירות חשובה והתיקונים נדרשים

אמנון המתמלל הוא פתרון נהדר למי שלא מעוניין או לא יכול לשמוע הקלטות קצרות בוואטסאפ. אמנם הבוט החדש עדיין לא מצליח לגמרי ויש מקומות חשובים שצריך לשפר בהם את השירות, אבל נראה שמגן פועל כדי לספק שירות שמאוד נצרך כיום.

הכוונות של המפתח טובות, אך זו הזדמנות חשובה לשים לב למידע שאנחנו נותנים ברשת (כך לדוגמה, נמליץ שלא לשלוח הקלטה עם פרטי כרטיס האשראי שלכם לאמנון). אחרי שייווצר מודל עסקי על ידי מגן, יש כאן פוטנציאל להפוך לכלי מפותח, בעל יכולות משופרות ומדויקות ששווה להוציא עליו כסף.