הקול בראש: איך לייצר סרטוני וידאו ויראליים - גם ללא סאונד

פייסבוק, טוויטר, יוטיוב ועוד מעט גם וואטסאפ מופצצים מדי יום בסרטונים שעוצבו במיוחד לתפוס את תשומת-הלב שלכם - בלי קול ■ איך זה קשור ליריבות בין ענקיות התוכן על שוק הטלוויזיה?

מודעה דיגיטלית בטיימס סקוור / צילום: רויטרס
מודעה דיגיטלית בטיימס סקוור / צילום: רויטרס

פרולוג | רגע, אל תדלגו!

הנה ניסוי מחשבתי: אתם עומדים בלבו של מקום הומה ומלא גירויים - נניח, קניון או שוק או מרכז מסחרי כלשהו. אנשים עוברים ושבים, חלקם חדורי מטרה בדרכם למקום ספציפי, אחרים משוטטים ובוחנים את חלונות הראווה או הדוכנים. עכשיו חשבו על נושא, כל נושא שבעולם - מהסרט האהוב עליכם ביותר ועד לדעה הפוליטית, זה לא משנה. המשימה היא כזו: יש לכם 3 שניות, שזה פחות או יותר הזמן שלוקח למישהו לחלוף על פניכם, כדי לעצור את המישהו הזה ולשכנע אותו שכדאי לו להקשיב למה שיש לכם להגיד במשך כמה דקות. נשמע קל? אז תוסיפו עוד מכשול: במהלך השניות הספורות שהוקצבו לכם כדי לגרום למישהו להקשיב, אסור לכם להוציא מילה מהפה. קחו קצת זמן לחשוב על האתגר. זה יכול להוציא מכם צדדים יצירתיים שלא ידעתם שיש בכם.

צדדים יצירתיים כאלה נדרשו גם למשווקים וליוצרי הסרטוני וידאו הוויראליים בשנה האחרונה, שבה עלו וצמחו הסרטונים האילמים בפידים של הרשתות החברתיות ובבאנרים הפרסומיים באתרי התוכן. על-פי נתונים שנאספו במאי האחרון על-ידי מגזין הרשת DIGIDAY, ואיגדו מידע שהגיע מכמה חברות המפרסמות בפייסבוק, כ-85% מהגולשים רואים את הסרטונים והפרסומות על מיוט, ללא סאונד. השפתיים זזות, הדימויים מתחלפים, הכתוביות נקראות, אבל קול לא נשמע. ובכל זאת אנחנו מרותקים. לא בכדי, הכריזו כבר לפני כשנה במגזין הטק היוקרתי WIRED, כי "הצליל הטוב ביותר עבור פרסומות וידאו בפייסבוק הוא דממה".

הדבר מתאפשר בשל הפיצ'ר שפייסבוק יצרה לניגון אוטומטי של וידאו ללא סאונד שמגביר שמע רק כשמקליקים עליו. וגם כי רבים מהגולשים - בעיקר במובייל, אך לא רק - בוחרים בגלישה על שקט כחוויית משתמש. המשמעות היא שליוצרי הסרטונים האלה היום, לפחות בשניות הראשונות שלהם אם לא מעבר לכך, יש אתגר עצום: לשכנע את הצופה להיעצר באמצעות כלים ויזואליים בלבד, בין שזו פנטומימה מתוחכמת, כתוביות שנונות, צבעוניות מתפרצת או כל דבר אחר שעולה בחדרי הישיבות. וכאן מגיעה השאלה המשמעותית: עד כמה הדבר הזה ישנה את התכנים עצמם, את השפה ברשתות החברתיות, ומי יודע - אולי אפילו את השפה שבה אנחנו רגילים לתקשר ביומיום.

 

תרבות | עוד הפרעות ברקע

הדימוי המתבקש הוא חזרה, לפחות במובן הסמלי, לימי הסרט האילם, אבל אם שואלים את חוקר התרבות הפופולרית גל חרמוני, אנחנו חוזרים אפילו אחורנית יותר מהזמנים של צ'רלי צ'פלין ובאסטר קיטון. "סרטונים שמוגשים ללא סאונד או כאלה שנעשים מתוך חשיבה שיצפו בהם ללא סאונד ובאופן אגבי, מייצרים סוג חדש של דימוי ויזואלי, שמייחד את התקופה שלנו", אומר חרמוני, דוקטורנט באוניברסיטת תל-אביב ומרצה לקולנוע באוניברסיטה הפתוחה. "צריך, למשל, לעשות את ההבחנה בין דימויים ויזואליים זזים ובין תמונות או כרזות, שאופפות את החיים שלנו מסוף המאה ה-19. היום קורה משהו לדימוים הוויזואליים, שקרה בעבר למדיומים אחרים כמו למשל, למוזיקה.

"אם לפני המצאת טכנולוגיות הקלטת הסאונד והמצאת הרדיו, אנשים היו צריכים ללכת לקונצרט כדי לשמוע מוזיקה, ההקלטה של הסאונד גרמה לכך שהתרגלנו לשמוע מוזיקה ברקע. היא הפכה להיות חלק מהסביבה, כמו פסקול של פעילויות בחיים שלנו. מה שקורה עכשיו הוא שהתמונה הופכת למעין פסקול ויזואלי של החיים שלנו, בצורה של סרטונים ודימויים זזים, שנצפים באגביות וברקע לפעילויות אחרות".

- מצד אחד הם ברקע ומצד שני הם כן דורשים את תשומת-הלב שלנו ומתחרים עליה.

"נכון, ובאופן הזה הם יוצרים 'כלכלת' תשומת-לב חדשה, שבמסגרתה אנחנו יכולים לצרוך את הסרטונים כרקע לפעילות אחרת, וכחלק מעוד הרבה נתונים שיש לנו על אותו מסך".

ריבוי הגירויים הוויזואליים היה נושא לפלפול ולשיח כבר בראשית המצאת הקולנוע, מספר חרמוני ומקביל את ימינו לימים הראשונים של הראינוע - אותן תמונות זזות באור שהמציאו בפריז האחים לומייר. כדוגמה, מביא חרמוני את המסה "יצירת האמנות בעידן השיעתוק הטכני", שכתב הפילוסוף היהודי-גרמני ולטר בנימין ערב מלחמת העולם השנייה.

"על-פי ולטר בנימין, התרבות המודרנית מפוצצת את הסובייקט בגירויים", מסביר חרמוני. "כדי שהסובייקט המודרני יוכל להתמודד איתם ולא להיכנס למצב של הלם, אנחנו מפתחים מין שלדת מגן קוגניטיבית-תפיסתית, שמאפשרת לנו לצרוך אותם במצב אגבי של היסח הדעת".

- והפסקול הוויזואלי הזה יוצר מצב חדש.

"זה משנה את הקוגניציה האנושית, מהבחינה הזאת שיש לנו תודעה אחרת שמאפשרת לדימויים ויזואליים להיות נתפסים גם כרקע. זה דבר חדש ולא ברור מה יהיו ההשלכות. מה שכן ברור הוא, שלהבדיל מסרטים וטלוויזיה, בהם יש מבנה ברור של שידור המסר - מי המוסר ומיהו הנמען כשהצופים הם פסיביים - הווידאו באינטרנט לא מחויב למבנה הזה, שמתערער לא רק מבחינה זאת שאנחנו גם מייצרים סרטי וידאו, אלא גם מפני שאנחנו משתמשים בדימויים האלה כמו שאנחנו משתמשים בשפה. הצריכה האגבית מתוך היסח הדעת, יוצרת יכולת חדשה, של שימוש בדימויי וידאו כרכיבים לשוניים בתוך שפה אישית וקולקטיבית".

- קצת מוקדם לדאוג, לא? יש סרטוני פרסומת ברשת שאין בהם סיפור והם מציעים ערך אסתטי ותו לא.

"הקולנוע באופן היסטורי החל כך ולא בסרטים נרטיבים, במובן שאנחנו מכירים אותו כיום. קראו לזה קולנוע של אטרקציות והוא היה בנוי מאסופה של דימויים ויזואליים שלא ניסו לייצר חוויה נרטיבית של סיפור או עולם שאתה נכנס אליו ונטמע בו".

- אז לדעתך, אנחנו חוזרים לשם? לקולנוע של אטרקציות?

"יש קשר תוכני בין הסרטים המוקדמים ההם לרעיונות של היום. גם מבחינה טכנולוגית אלה היו סרטים מאוד קצרים וגם מבחינת איך שתפסו את המדיום. לא תפסו אותו כמשהו שאמור לספר סיפור אלא כאיזו המצאה טכנולוגית, ואחר כך בידורית, שאמורה לייצר נראות של העולם באופן שייראה לנו פלאי. אני חושב שבמובן מסוים, הדימויים הללו באינטרנט הם חזרה לאותו קולנוע של אטרקציות".

אחד הביטויים המובהקים לכך הוא הפופולריות ההולכת וגוברת של טריק טכנולוגי חדש-ישן: הגיף (GIF), שעשה קאמבק בשנת 2015 והפך לאחר האלמנטים החזקים בתקשורת המקוונת. הגיף הראשון הומצא ב-1987 על-ידי החברה האמריקאית הוותיקה CompuServe, כשעלה הצורך בדימוי ורסטילי שלא יתפוס רוחב פס גדול כמו וידאו, מה שהופך אותו למעין הכלאה בין תמונה לווידאו.

"הגיפים הם ממש חזרה אל הסרטים של סוף המאה ה-19, אל הקולנוע של האטרקציות", אומר חרמוני, "אנשים ראו אז צילומים או ציורים של כל מיני גופים, בני אדם או חיות נעים בלופ, בתוך כל מיני מתקנים כאלה עם עינית הצצה. כשהצצת, קיבלת אשליה של תנועתיות וזאת הייתה האטרקציה - לראות דימוי או ציור זז. היום אנחנו כבר לא תמימים ולא מתלהבים מעצם זה שדימוי זז, אבל במובן מסוים יש חזרה אסתטית לסוג כזה של גירוי".

פרסום | בידור לפני רגש

"למה לדבר בלשון עתיד? זה כבר קרה ושינה את התעשייה", קובע נאור נרקיס, מפעיל הבלוג "תוכניסט", יועץ לסטארט-אפים בתחום הפרסום, ומי שזכור כיוזם מחאת המילקי. "פאבלישרס בחו"ל עברו לחלוטין לעידן ללא סאונד ויוצרים תכנים מותאמים לזה. אנשי הקריאייטיב במשרדי הפרסום והתוכן יוצאים מנקודת הנחה שהאצבע של הגולשים קלה בדילוג על וידאו, ולכן עלינו לעניין את הגולשים בשניות הראשונות כדי לעודד אותם להגביר את הסאונד. במקביל, כל תוכן שאנחנו יוצרים, מוכן ומתוכנן לצריכה גם ללא סאונד".

- איך עושים את זה?

"כותרות גדולות, מסרים ויזואליים מהירים, ועוד כל מיני מניפולציות שנראות לנו טיפשיות, אבל הן מאד אנושיות וגורמות לנו להחליט אם לדלג או להדליק את הסאונד. למשל, אם נראה לתושבי תל-אביב בשניות הראשונות בווידאו מקום מוכר בתל-אביב שהם מזהים, יש יותר סיכוי שהם יצפו בזה".

אחד הערוצים שממנו שואב נרקיס השראה להתמודדות עם האתגר החדש, היא מעבדת Unskippable labs של גוגל בהנהגתו של בן ג'ונס, סמנכ"ל הקריאייטיב העולמי של גוגל. במעבדה חוקרים מיטב אנשי הקריאייטיב מה גורם לאנשים שלא לדלג על וידאו, תוך כדי יצירת ניסויים והסקת מסקנות. בין מסקנות המחקרים עולה למשל, שהאורך בצפייה בסרטונים במובייל לא חייב להיות קצר, ושצופים יכולים להתעכב על סרטונים ארוכים יחסית, כל עוד הם קלילים ובעלי מקצב "כיפי" ומהיר. זאת, בהשוואה לסרטונים שמנסים להיות מרגשים או להעביר רעיונות עמוקים יותר.

"גם אני העליתי מחקר בבלוג אחרי שצפיתי ב-427 סרטוני פייסבוק לייב מוצלחים", מספר נרקיס, "ואחת המסקנות שלי הייתה שלעיתים פעולות טיפשיות ללא סאונד יכולות להביא למעורבות גולשים הרבה יותר גבוהה".

"זה סטייט אוף מיינד שונה לגמרי", מסביר מאור חן, מנכ"ל מקאן דיגיטל. "כולנו מכירים את זה, מצב שבו אני רואה קטע קטן ביוטיוב, גולל בפיד של חברים, וכדי שאעצור את הפיד אני חייב לקבל את הרושם שתוכן וידאו יהיה מבדר. וזה קשה. קשה להתחרות על תשומת-ליבו של מישהו שיושב בלי סאונד בשירותים או באמצע פגישה, ולגרום לו לעשות פליי".

- עד כמה זה מעסיק אתכם במקאן דיגיטל?

"מעסיק מאוד. בעולם החדש, כשאנחנו מדברים על תוכן וידאו, אנחנו מזמן לא מדברים על טלוויזיה, אלא מתאימים את עצמנו לפיד של פייסבוק, אפילו מבחינה טכנית. למשל, אם עד לפני שנה אמרו לנו בפייסבוק לצלם בצורה ריבועית כדי שזה ייראה טוב בפיד של המובייל, אז לפני חודשיים פייסבוק שינו את גודל התמונה בתצוגה ורטיקלית, בדומה לסנאפצ'אט. לכן, מה שקרה מאז הוא שהכנסנו לימי הצילום בפרסומות שלנו, ממש ליד הבמאי, גם מעמד לאייפון שמצלם את כל הסרט של הפרסומת במקביל, כך שיתאים לצפייה ללא סאונד במובייל".

גם פרץ דניאל מרקיש, סמנכ"ל קריאייטיב בחברת פיצ' ובמאי פרסומות ותיק, יוצא לימי הצילום עם האייפון בכיס וחשיבה מסוג חדש: "קודם כול, אנחנו צריכים לתכנן את הסרטון כך שיהיו לו כותרות גדולות, שלהן אנחנו נותנים משקל אסתטי וגם תפקיד בהעברת הסיפור או המסר, כך שניתן יהיה להבין מה קורה גם בלי לשמוע. גם הפריימים השתנו בהיבט הטכני ואנחנו בוחרים פריים שיש בו מקום גם לכותרות שישתלבו בצורה אסתטית, שלא יסתירו את האקשן".

היבט נוסף שמדגיש מרקיש הוא המאמץ לעורר תשומת-לב ולהתבלט בפיד, באמצעות צבעים עזים או הבעות פנים חזקות: "יש פתרונות אינטליגנטים לכך", אומר מרקיש, "ולפעמים כל מה שצריך זה לקחת וידאו פשוט, לופ של בן אדם שחוזר על תנועה מסוימת. הווידאו בימינו כבר לא חייב לספר סיפור אלא לייצר חוויה אסתטית".

אמנות | עיקרון הרפטטיביות

הקונספט הזה, של דימויים ויזואליים המוצגים בחלל ציבורי, קיים כבר כמה עשורים בגלריות ובמוזיאונים, במיצגי הווידאו ארט, המוצגים בדרך-כלל ללא סאונד (אם כי, כיום מתרבות העבודות המוצגות באולמות קטנים עם סאונד, באופן שהופך אותן לכמעט-סרטים לכל דבר ועניין). האם יצרני התוכן בגל הנוכחי יכולים ללמוד משהו מהאמנים?

האמנית מאיה ז"ק, המלמדת קורס וידאו ארט בבצלאל, מנסה להשיב: "הדבר הראשון שצריך להבין על וידאו ארט הוא שמדובר במלחמה של תמונה מול קול. אנחנו הרי נמצאים בגודש של גירויים, ואם למשל אנחנו נוסעים באוטו ומאזינים לרדיו, ותוך כדי רואים פרסומת על שלטי חוצות, שאין לה סאונד, אז הדימוי צריך להיות מאוד מחודד ומושך. זה תהליך שקרה גם במוזיאונים.

"הקהל עובר מאולם לאולם, ולאנשים אין זמן להתעכב כי הם באים למוזיאון לשעה ולא יכולים לראות סרט של שעה ואפילו לא עשר דקות. אז הם נכנסים לעבודות שמראש, הדימוי הוויזואלי שלהן מאוד חריף וכמעט סטטי. אמני הווידאו ארט לא מספרים להם סיפור. העבודות מתארות מצב עניינים ולכן הרבה פעמים אלה פעולות רפטטיביות, כמו למשל ידיים עובדות".

- ודווקא במקרה שלך, כאמנית, את ידועה כמי שמשלבת סאונד בעבודות.

"נכון, בעבודה שלי זה חלק משמעותי, כמעט 50%, משום שהסרטים שלי הם קולנועיים. לכן גם בקורס אני מדגישה לסטודנטים את נושא הסאונד ומלמדת אותם איך באמצעות הסאונד אנחנו יכולים לשנות לגמרי את התמונה ולעשות מניפולציות כדי לבנות או לעצב את הדימוי. בכלל, בשנים האחרונות ישנם יותר יוצרים שמגיעים אל עולם האמנות והווידאו ארט עם השראות מהקולנוע, ואצל אמנים אלו יש גם הקפדה ותשומת-לב מיוחדת לנושא הסאונד".

אפילוג | חוליה בשרשרת

בשבועות האחרונים התרחשה תפנית בעלילה: אחרי שהתעשייה והגולשים התיישרו והתרגלו לצפות בסרטונים אילמים, החליטה פייסבוק לשנות שוב את התמונה, ועל רקע השקת אפליקציה ייעודית לסרטוני וידאו, הכריזה החברה כי היא עתידה להחזיר את הסאונד לסרטוני הווידאו בפיד. זהו מהלך, מסבירים מומחים בתחום, שמבוצע כחלק ממאבק הענקים בין פייסבוק ליוטיוב - על רקע הניסיונות של שתי החברות להיכנס לתחום הטלוויזיה כיצרניות תוכן.

"בפייסבוק וביוטיוב הולכים להשיק בחודשים הקרובים יותר פלטפורמות שיתחרו בטלוויזיה, כי בטלוויזיה אנחנו מוכנים לצפות בפרסומות בהפסקת הפרסומות, ולכן שם רוב התקציב מושקע", אומר מאור חן ממקאן. "יוטיוב הודיעו לפני שבועיים שהם הולכים להשיק את יוטיוב TV, שירות שיעלה 35 דולר ונוכל לראות ערוצי טלוויזיה. נוח להם להתחרות בטלוויזיה על מדיום של פרסומות וידאו שנקרא פוש, ומאפיין את הצפייה המכוונת שכולנו מכירים מצפייה בטלוויזיה. היתרון מבחינת המפרסמים הוא בפילוח שהרשת מאפשרת. לכן, גם פייסבוק וגם יוטיוב הולכים להתחרות בנטפליקס, אמזון והולו ולייצר תוכן בעצמם".

"עבור מפרסמים ומשווקים, שידור פרסומות ברשתות החברתיות זול יותר משידור בטלוויזיה וגם אפקטיבי יותר", מנתח נועם פורר, סמנכ"ל ניו-מדיה וחדשנות במשרד בן חורין אלכסנדרוביץ לייעוץ תקשורתי. "לכן הלחץ של המפרסמים הוא שגרם לפייסבוק להצהיר שהיא מחזירה את הסאונד לפרסומות. יחד עם זאת, הפרסומות המושתקות יצרו סטנדרט מאוד נכון למפרסמים. הסרטונים של הפרסומות הפכו לסוג של הפרעה מתקבלת כשהם שקטים עבור הגולשים. זה מה שהצרכנים מחפשים כשהם גולשים בפייסבוק בזמן שהם באוטובוס, ברכבת, בדרך לעבודה או לבית הספר, כשהם בישיבה או בבית קפה. אנשים לא באמת רוצים את הסאונד, הם מחפשים את השקט".

על-פי העתידן ד"ר רועי צזנה, המתמחה בננו-טכנולוגיה, זאת רק עוד חוליה בשרשרת. "אדרבא", הוא אומר, "המגמה העתידית הפוכה: לשלב כמה שיותר חושים בחוויה. לכן אנחנו מתחילים לראות סרטונים תלת-ממדיים, סרטונים במציאות מדומה, פוקימון גו שמביא לנו גם מציאות רבודה לרחוב, ועוד".

- איך התפתחות תקשורת הווידאו תשפיע, אם בכלל, על השפה האנושית?

"כל שפה מיועדת לעזור לבני אדם להביע את עצמם, באילוצי המדיום בו הם משתמשים. שפת הסימנים, למשל, מאפשרת לחירשים ולאילמים להעביר מסרים גם בלי שימוש בקול. כלומר, המדיום שלהם הוא הידיים, הבעות הפנים ושפת הגוף. רובנו היינו משתמשים בדיבור כדי להביע את עצמנו עד לעשורים האחרונים, והמדיום שלנו היה הקול. אבל כאשר הגיע הטלפון הסלולרי בשלביו הראשונים, עלות העברת המידע בשיחה הייתה גבוהה כך שנסוגנו אחורנית לסוג אחר של מדיום: הודעות הטקסט.

"אבל אז נוצרה בעיה חדשה, כי ההודעות האלה היו ענייניות ואי אפשר היה להעביר בקלות ניואנסים שלמדנו כבר להעביר במדיום הקול, כמו למשל, רגשות. ואז נולד האימוג'י. בשלבים הפרימיטיביים שלו, היה מדובר בסימנים פשוטים, :) :(, אבל מהר מאוד הם התרחבו לצורות נוספות, למשל אימוג'י עם קרני שטן, >:), שמבקש להביע נקמנות וקנטרנות, קריצות עיניים ועוד.

כל אלו הועברו בטקסט בתחילה, אבל בשנים האחרונות הירידה בעלויות העברת המידע אפשרה לנו להעביר גם תמונות קטנות, או אייקונים. כך שהיום אנחנו שולחים סמיילים שבאמת נראים כמו הסמיילי המקורי, ועם הבעות פנים מלאות יותר. זוהי שפה שמשלבת טקסט עם תמונות, וכך מאפשרת להביע רגשות ברמה המתחרה בזו של הדיבור.

"גם הסרטונים האילמים, התמונות הזזות, הם חלק מהשפה החדשה של המין האנושי, שרחבה הרבה יותר מהשפה הכתובה או אפילו המילולית, ומסוגלת להעביר מסרים מורכבים יותר. אותו הדבר אמור, אגב, גם לגבי ממים".

- ומה אתה רואה בעתיד?

"אני מאמין שבעוד עשר או עשרים שנים יתפתחו מדיות אחרות - למשל, של מציאות מדומה הכוללת גם העברת מסרים באמצעים ויזואליים, קוליים ואפילו באמצעות חוש המישוש, הריח והטעם, ואז יתפתחו במדיומים האלו שפות שמנצלות גם את היכולות שהם מספקים לנו".