הכול התחיל לפני שנה וחצי באבוקדו. אלברט פרטה, אחראי היצירתיות בפינטרסט (pinterest), ניגש אל הפרי, שמונח היה על שולחן חדר ישיבות במשרדי החברה בסן פרנסיסקו, וכיוון אליו את הטלפון שלו בתשומת לב ולעיני חצי תריסר מחבריו לעבודה. הוא בדק את הפיתוח החדש ביותר של החברה, תכונה ושמה Lens (עדשות), שאילו תעשה את תפקידה כהלכה, תצליח לזהות לא רק את האבוקדו, אלא גם לחפש בינות למיליארדי התמונות שהועלו לאתר בשבע השנים האחרונות ולמצוא ביניהן תמונות דומות.

פרטה צילם: נדרשו לאפליקציה כמה רגעים, ומסך הטלפון נמלא ברצף אינסופי של אבוקדואים בשלים ובלתי מקולפים, שצולמו מכל זווית אפשרית. "המון אנשים התרשמו נורא", נזכר פרטה. פינטרסט הצליחה לזהות אובייקט באמצעות סממנים ויזואליים בלבד - בעיה הנדסית קשה להדהים. אבל דעתו של פרטה לא נחה: "הסתכלתי על זה - אלף תמונות של אבוקדו - וחשבתי, למי אכפת?". טכנולוגיית החיפוש הוויזואלי אומנם עבדה היטב, אבל התוצאות היו חסרות משמעות. אף אחד לא מצלם אבוקדו כי הוא רוצה לקבל תמונה כמעט זהה של אבוקדו אחר - ובטח ובטח לא מקבץ אינסופי של תמונות כאלה.

"התחלנו לשאול את מי שהיה שם 'מה הייתם רוצים לקבל אם הייתם מצלמים אבוקדו'", מספר פרטה. מישהו אמר שהוא היה רוצה מתכונים לגוואקמולי, מישהו אחר אמר שאולי פינטרסט תוכל לספק מידע לגבי גידול אבוקדו. מאז הפך האבוקדו למיתוס במשרדי פינטרסט - תזכורת לכך שהתאמה אישית חשובה יותר מאשר תואם מושלם.

וזה נכון במיוחד כעת, עם כניסתה של החברה לשדה ההולך ומתרחב של החיפוש הוויזואלי באמצעות כלים כמו Lens, שהושק בגרסת בטא בפברואר שעבר. דוגמה ראשונית לאופנים שבהם תולה פינטרסט את תקוותיה בבינה מלאכותית ויזואלית, כדי לחולל מהפכה גורפת שתהיה לה נגיעה לכל דבר שהוא - החל באופן שבו אנשים עושים קניות וכלה באופן שבו הם אוכלים.

"אני באמת מאמין שהמצלמה תהיה המקלדת הבאה", אומר בן סילברמן, מנכ"ל פינטרסט. "זה יהיה כלי מהותי שנשתמש בו כדי לבחון את העולם סביבנו, לגלות דברים בסביבה או לבדוק באופן ויזואלי איך משהו עשוי להשתלב לנו בחיים". המצלמה הזאת לא בהכרח תהיה בסמארטפון, אלא אולי בעין, כפי שטכנולוגיות רבות חוזות את מקומה העתידי. קפיצת מדרגה טכנולוגית, שאת היקפה ואת השלכותיה קשה להעריך, אבל כולם מנסים להיות שם, לרבות גוגל, פייסבוק, מיקרוסופט ואמזון, שמשקיעות משאבים עצומים.

בנוף התחרותי הזה, הסטארט-אפ בן 1,200 העובדים, שבראשו ניצב סילברמן, אולי לא נראה כמו מתחרה מאיים במיוחד. אבל מתברר שיש לא מעט מה למצוא מתחת לערימת האבוקדו. בתקופה שבה משתלט הצילום החובבני על אפליקציות ואתרים רבים מספור, 200 מיליון המשתמשים החודשיים של פינטרסט חוזרים אל השירות כדי לראות ולהראות - בעיני רוחם הדיגיטליות - סלון נעים, טיול מאתגר או חטיף בריא. הם לא מחפשים "פורנו-אוכל" ברוח אינסטגרם, אלא ארוחות שבאמת אפשר לבשל ביומיום, ולראיה - מחקר שביצעה נילסן מעלה כי 98% מכלל המשתמשים בפינטרסט מספרים שבאמת ניסו דברים חדשים שמצאו באמצעות השירות.

הפופולריות של פינטרסט נעוצה ביכולתה ליצור "גרף טעם" ייחודי לכל משתמש, לחבר ביעילות את הנקודות בין הסיכות השונות שהעלה וכך להסיק מה עוד עשוי לעניין אותו. ולא במקרה גם המפרסמים נוהרים אל השירות, כאשר ההערכות הן שבין 2015 ל-2017 גדלו הכנסותיה של פינטרסט פי 5, עד לסך 500 מיליון דולר, ואילו בסיס המשתמשים שלה הציג צמיחה נאה בשיעור של 40% (פינטרסט סירבה להגיב לעניין ההכנסות והתחזיות).

"כולם מדברים על כמה פינטרסט מועילה כדי לגלות רעיונות לחיים ממש", אומר סילברמן. "ואם אנשים באמת משתמשים בפינטרסט כדי להחליט מה הם מכניסים הביתה, מה הם מבשלים או לאן הם יוצאים לחופשה, יש פה ערך עצום". פירוש הדבר הוא שפינטרסט צריכה לא רק למצוא בדיוק את הדבר הבא שתחפשו, כמו שעושה גוגל, אלא גם לחזות מה אתם רוצים, אבל עדיין לא יודעים שאתם רוצים. אם תצליח, היא תוכל להשתמש במצלמות שלנו כדי לפתוח עולם של גילוי אישי בלתי פוסק.

"ההשפעה ארוכת הטווח של החיפוש הוויזואלי לא נוגעת למוצר ספציפי או לאפליקציה ספציפית", אומר אוון שארפ, מייסד-שותף של החברה, "אלא לדבר שהוא מאפשר לאנשים לעשות: להפוך כל מה שהם רואים למשהו שאפשר להשתמש בו כדי לגלות עוד משהו באינטרנט".

גוגל הרחק מאחור

אני עומד בדירת גן טחובה בשכונת SOMA בסן פרנסיסקו. חלונות הסטודיו הם חרכים גרידא בקירות, שנאטמים בלילה כדי לספק פרטיות, אבל הדלת הקדמית עשויה זכוכית, כך שפרטיות קשה להשיג. Airbnb גובה תמורת הדירה 250 דולר ללילה, מה שעשוי להיראות אבסורדי, אבל הנכס ערוך למופת ובמלוא החדווה כמעין לוח פינטרסט סטריאוטיפי המוקדש לפלאי אמצע המאה שעברה. אני פותח את אפליקציית פינטרסט. Lens עובדת היטב גם בתאורה הדלה, ומוצאת התאמות מדויקות בתכלית לאובייקטים שאני מצלם. Lens לא מזהה סתם כיסא, אלא כיסא מועדונים. לא סתם כרית, אלא כרית קילים. לא סתם אמנות, אלא ציור של רותקו. אני באמת ובתמים משכיל. רבות מן התוצאות כוללות קישורים פעילים להצבה בלוח פינטרסט ואפילו למכירה.

מאוחר יותר ניסיתי להריץ תמונות דומות ב-Google Lens, מתחרה ב-Lens של פינטרסט שהושקה השנה בגרסת בטא על מכשירי פיקסל. הגרסה של גוגל לא מבינה שהיא רואה כיסא או רהיט בכלל, ומתנצלת. היא סבורה שהכרית היא שמיכה רקומה. הדבר היחיד שהיא מצליחה לזהות כהלכה הוא ההדפס של רותקו, אבל מן הראוי לציין שזיהוי אמנות בדו-ממד נחשב על-פי רוב לאחד האתגרים הפשוטים ביותר עבור כלי חיפוש ויזואלי.

גוגל Lens פשוט לא כה מוצלחת. בינתיים, לפחות. אבל אפשר לראות כיצד משתלבת הבינה המלאכותית הוויזואלית במכלול העסקי הרחב של החברה - ושל ענקיות טכנולוגיה אחרות. גוגל מתעסקת באינדוקס, ולכן מתבקש שתרצה לסייע למשתמשים לזהות ויזואלית את העולם שסביבם. לפייסבוק יש גרף חברתי, היא מתמקדת בחיבור בין משתמשים לחברים ומעוניינת להשתמש בבינה מלאכותית לזיהוי פנים. אמזון עוסקת במסחר מקוון. מבחינתה, יכול החיפוש הוויזואלי לשמש גשר בין העולם הדיגיטלי לעולם הגשמי - לאפשר לכם לצלם זוג נעליים כדי לחפש זוג דומה, ואולי זול יותר, באמזון. כל חברה אולי רואה את הבינה המלאכותית הוויזואלית באור שונה, אבל ההשלכות דומות ומרחיקות לכת. "תחשוב שתוכל לצלם תמונה בשביל לחפש משהו שאתה אפילו לא יודע לתאר - זה דבר חזק", אומר קולין קולבורן, אנליסט חיפוש בפורסטר. "זו כנראה צורת החיפוש הכי בלתי בשלה, אבל אולי גם זו שיש לה הכי הרבה פוטנציאל".

מאות מעובדי גוגל עובדים אך ורק על בינה מלאכותית ויזואלית. לפייסבוק יש 20 אלף עובדים ו-300 חוקרי בינה מלאכותית, ובכל רגע נתון היא עורכת 1.2 מיליון ניסויים בבינה מלאכותית ויזואלית ברשת החברתית. לאמזון יש יותר מחצי מיליון עובדים, ו-5,000 מהם עובדים על אלכסה - תכונות Echo Show החדשות שלה אינן מסתמכות רק על מיקרופון, אלא מאפשרות לתקשר עם אלכסה גם באמצעות מצלמה, המאפשרת לאמזון להשקיף על חדר שלם בתוך הבית שלכם. ומה לגבי פינטרסט? לה יש רק 12 עובדים שזמנם קודש לחיפוש ויזואלי.

ואף על פי כן, פינטרסט חזקה מכפי שאולי נדמה. בתור התחלה, יש לה מערך נתונים עצום שבאמצעותו היא "מאמנת" את הבינה המלאכותית הוויזואלית שלה. המשמעות היא שככל שיש לכם יותר תמונות, האלגוריתם שלכם יהיה חכם יותר ויספק המלצות מוצלחות יותר על דברים שהמשתמשים באמת מעוניינים בהם. כמה זה המון תמונות? מערך הנתונים הפומבי הגדול ביותר שמשמש את רוב החוקרים, Image Net, מכיל 14 מיליון תמונות של אובייקטים יומיומיים שצילמו גולשים מן השורה.

לפינטרסט, לעומת זאת, יש מיליארדי תמונות - כאלה שהעלו משתמשים נלהבים, כאלה שנקטפו מתוך בלוגים וכאלה שהעלו חברות שונות - ורובן מוארות ומוצבות למופת, כי מדובר בתצלומי מוצר רשמיים. למחשבים קל יותר לראות תמונות מושלמות. וחשוב לא פחות: התמונות האלה עברו תיוג ידני בידי משתמשי פינטרסט נאמנים במשך שנים. "אתה רוצה שיהיו לך דוגמאות של כל מה שיכול לקרות ושל כל מה שאפשר לראות", אומרת מנואלה ולוסו, ראש מחלקת למידת מכונה באוניברסיטת קרנגי מלון. "ככל שמצבור הנתונים גדול יותר, סביר יותר שלא יפתיעו אותך".

על כך יש להוסיף את העובדה שתוצאות החיפוש שמספקת פינטרסט הן מעט מעורפלות מעצם טיבן. שאילתות על ז'קט ג'ינס יחזירו תוצאות של ז'קטי ג'ינס, אבל אם אחת מהן תציג ז'קט שחור ולא כחול, למשל, או ארנק ג'ינס כחול במקום ז'קט, זה לא נראה כמו טעות. זה מה שלמדה פינטרסט מן האבוקדו. התאמות מדויקות הן תחום המומחיות של החיפוש של גוגל, ששוכלל כדי להשיב על שאלות ספציפיות - "איך צולים דגים?", לדוגמה - בקישור מושלם. משתמשי פינטרסט נוטים לשאילתות מעורפלות יותר. הם עשויים לחפש למשל "רעיונות למאכלי ים" כמה פעמים בשבוע. מבחינתם, תוצאה לא מדויקת היא לא טעות, אלא השראה.

במילים אחרות: הבינה המלאכותית של פינטרסט עשויה לבצע חיפוש ויזואלי שגוי, אבל עם קצת מזל, עדיין לספק תשובה נכונה. "מה שמשנה בשורה התחתונה הוא עד כמה התוצאות מועילות למשתמשים", אומרת לי פן, אחראית הנדסה בפינטרסט. "ואולי המשתמשים לא צריכים דיוק של 100%, כי כל עוד אנחנו עומדים בציפיות, הם מרגישים שהחוויה מועילה להם".

זו גם אחת הסיבות שפינטרסט זוכה לאמונם של משתמשיה בתקופה שבה הפלטפורמות המתחרות נמצאות תחת מתקפה בגין חדירות לפרטיות. אנשים רואים את פינטרסט אחרת מכפי שהם רואים מנוע חיפוש או רשת חברתית. "אנחנו מנסים לקיים עם המשתמשים שלנו יחסים שבהם מי שמשתף דברים על עצמו, משתף אותם כי הוא רוצה המלצות מוצלחות יותר, ואנחנו מספקים אותן", אומר סילברמן. "הציפיות די ברורות. אתה משתמש בפינטרסט כדי למצוא סגנון, אז אם נשאל אותך אילו צבעים אתה אוהב, זה לא ייחשב פולשני".

"לקנות את הלוק"

פינטרסט קמה ב-2010, והימרה בגדול על עיצוב: היא ביקשה להעמיד פלטפורמה שתאפשר לכם לאסוף ולמיין את הנושאים שמעניינים אתכם, ולא בדמות קישורים כחולים מכוערים, אלא כתמונות יפהפיות המאורגנות בכרטיסיות וירטואליות. מבין המייסדים, שארפ היה איש החזון היצירתי - מעצב שלמד בבית הספר הגבוה לאדריכלות באוניברסיטת קולומביה - ובכך היה שותף מושלם למנכ"ל סילברמן, יועץ ניהולי שהיה ליזם.

הפלטפורמה הייתה להיט: ב-2016 הכריזה comScore כי מדובר בשירות הרשת מהיר הצמיחה ביותר בהיסטוריה. אלא שגישתה החדשנית של פינטרסט לכרטיסיות התצלומים אומצה מאז בידי ענקים כמו גוגל וחברות אחרות, שמשתמשות בהן בכל מקום, החל בתוצאות חיפוש וכלה באנדרואיד. גם הצמיחה המטאורית האטה; וכיום נמצאת פינטרסט בצלן של אינסטגרם, עם 800 מיליון משתמשים חודשיים פעילים, ושל סנאפצ'ט, עם טכנולוגיות המציאות המתוגברת הדרמטיות שלה.

אלא שבמקום להתעקש על צמיחה אגרסיבית, פינטרסט החליטה להשקיע מאמצים מיוחדים דווקא בשירות הליבה שלה: האפשרות לחזות מה משתמשים רוצים לראות. "בסופו של דבר, השקענו המון בלמידת מכונה", אומר שארפ, המשמש כיום אחראי מוצר ראשי, בעודו פוסע סביב לשולחן ישיבות בחולצת טי לבנה עם סמל החברה. אין לו ממש משרד משלו, והאמת היא שלאף אחד בפינטרסט אין. במקום זאת, הוא השתלט על חדר קטן שבמרכזו שולחן אבירים בסגנון המלך ארתור. על הקיר האחורי תלוי לוח אנלוגי גדול ועליו סמל רקום של פינטרסט, מעשה ידי אמא שלו. "רוב מה שהמשתמשים רואים נקבע באמצעות אלגוריתם", הוא אומר. "המלצה, תוצאת חיפוש או סיכה קשורה".

זו האחרונה - רשימה פשוטה יחסית של סיכות מומלצות, המופקת על סמך התוכן האחרון שצפיתם בו - הושקה בשנת 2013. בתוך זמן לא רב ניתן היה לזקוף לזכותה 10% מכלל הצפיות בפינטרסט, אבל הנתונים לא המשיכו להשתפר עד ל-2014, אז הטילה החברה את המשימה על כמה מהנדסי בינה מלאכותית. הם אימנו אלגוריתמים להציע נושאים קשורים ובפריטים דומים בהתבסס על סימנים ויזואליים בלבד, ותוך מתן עדיפות לסיכות שיקבלו את מרב הקליקים. למשל, אם תלחצו על וו עשוי מענף עץ שנפל, רשימת הסיכות הקשורות יכללו הצעות הנוגעות לעיצוב הבית ואחרות הנוגעות לעצים - ובכללן מתלה מעילים עשוי מגזע עץ, פרגוד עץ לחדר וצלוחית מפתחות עשויה עץ בשימוש חוזר. כיום, רשימת הסיכות הקשורות אחראית לכ-40% מכלל השימוש בפינטרסט.

ב-2016, בעקבות אותה השקעה מוקדמת בבינה מלאכותית ויזואלית, גייסה החברה את פן, אשפית הראייה הממוחשבת, שעבדה קודם לכן בגוגל. פן הייתה ילדה חובבת ציור עם נטייה עזה לאמנות חזותית, וכשמלאו לה 12 החלו הוריה לדחוף אותה לעיסוק בהנדסה. היא עבדה בגוגל במשך שמונה שנים ולאחר מכן ניהלה 1,000 מהנדסים שעסקו בתחום החיפוש בענקית האינטרנט הסינית באידו. אחר כך חזרה פן לגוגל, והפעם לתפקיד ממוקד יותר בדמות אחראית חיפוש התמונות בחברה, ואז פנתה אליה פינטרסט. "הערכים שלה, הן בתור מנהיגה והן בתור אדם, תואמים מאוד את הערכים של פינטרסט", אומר סילברמן. "אחד הדברים שהיו משמעותיים מבחינתי הוא שהיא רואה את הטכנולוגיה כדרך להעשיר חיים של אנשים, לא טכנולוגיה לשם טכנולוגיה".

תחת שרביטה של פן, החיפושים הוויזואליים בפינטרסט - באמצעות Lens, בסיכות או בתוסף הדפדפן של החברה - צמחו בהיקף של 70% משנה לשנה, עד לסך של למעלה מ-300 מיליון חיפושים בחודש. שותפיה המסחריים של פינטרסט, מצדם, מצאו כי נפח ההקלקות על סיכות "לקנות את הלו*ק" - תכונה המאפשרת למשתמשים ללחוץ על פריטים בתמונות ואז לרכוש אותם - הוכפל פי 2.

"אנחנו ממש מקדימים"

כל זה פירושו הזדמנות עסקית משמעותית. פינטרסט כבר מספקת פלטפורמה מבטיחה מאוד למפרסמים הרוצים לקדם את הסיכות שלהם. המשתמשים מגיעים לשם לרוב במטרה ברורה: סקרים פנימיים העלו כי 93% מהם משתמשים בפינטרסט כדי לתכנן רכישות, וכי 87% מהם כבר קנו פריטים שגילו באמצעותה; זאת, לפי מחקר שביצעה פירמת מילוורד בראון. וחשוב אף מזה: משתמשי פינטרסט טרם החליטו באיזה מוצר בדיוק הם מעוניינים. לדברי החברה עצמה, 97% משאילתות החיפוש אינן מציינות מותג ספציפי.

באחרונה הפכה חברת טרגט לשותפה הקמעונית הבלבדית של טכנולוגיית Lens של פינטרסט בארה"ב, ובקרוב תוכלו למצוא בתוך האפליקציה הראשית של טרגט גרסה של Lens שתאפשר לכם למשל לצלם מנורה ולקבל בתגובה פיד של מנורות דומות הנמכרות בטרגט. "מספיק לצלם תמונה של פריט, ו-Lens של פינטרסט תחזיר מוצרים שמותאמים במיוחד לדברים שהאורחים שלנו מחפשים", אומר ריק גומז, מנהל השיווק של טרגט. פינטרסט חברה גם אל סמסונג, כדי להפעיל את החיפוש הוויזואלי בטלפונים מסדרת גלקסי, וכן אל Shopstyle כדי לקשור את התוצאות שמניבה Lens עם סיכות המאפשרות רכישה של יותר מ-5 מיליון אקססוריז אופנתיים. המותגים השונים מתחילים להבין שחיפוש ויזואלי הוא חלק מהותי מעתידם.

הבעיה, כמובן, היא שתקציבי השיווק שלהם מוגבלים, ופינטרסט אינה החברה היחידה שרוצה למכור להם בינה מלאכותית ויזואלית. בנובמבר השיקה פינטרסט גלגול חדש של Lens, ושמו Lens Your Look. הוא מאפשר למשתמשים למצוא דרכים חדשות ללבוש את הבגדים שכבר יש להם. תוכלו לצלם פריט מן הארון שלכם - זוג נעליים שחורות עם עקב מאסיבי, נאמר - ואז להשתמש בשאילתות טקסט כדי לחפש פריטי לבוש שעשויים להתאים לו (נגיד, "שמלה שחורה"). בתגובה, Lens Your Look תציג תמונות של נשים בשמלות שחורות ובנעלי עקב מאסיביות, אולי אפילו מאותה תוצרת ובאותו סגנון.

כאשר המשתמשים לוחצים על תמונות ספציפיות, פינטרסט לומדת אילו תוצאות היו המתאימות או הקרובות ביותר למתאימות מתוך כל אלה שהציגה, כך שתוכל לתעדף אותן בפעם הבאה. מדובר בייצוג תמציתי ומדויק של גישתה של החברה לחיפוש ויזואלי: לנבור במסד הנתונים הכביר שלה, להתחבר לטעמם של המשתמשים ולא לפחד מתוצאות לא מושלמות.

זה לא אומר שהמשתמשים ב-Lens Your Look בהכרח יישארו בסביבה. שארפ הוא הראשון להודות שאולי הציוד האידיאלי לביצוע חיפושים ויזואליים בכלל לא הומצא עדיין, ושאולי נצטרך לחכות להופעתו של התקן חביש של מציאות מתוגברת כדי שהקונספט באמת יתפוס. "אנחנו ממש מקדימים", אומר שארפ. "אנחנו במקום שבו החיפוש הטקסטואלי היה באמצע שנות ה-90 - יש מין טכנולוגיה כזאת, היא מעניינת, אבל אף אחד עדיין לא נבר מספיק עמוק כדי להבין מה המוצר הזה או מה הבעיות שהוא יפתור".

והשאלה בעינה עומדת: מכל החברות, האם פינטרסט היא אכן זו שתפצח את הקוד? האם יבוא יום ובו נאמר "Pin it" במקום "Google it"? ברגע זה, מעט קשה להאמין, בהתחשב בעובדה שפינטרסט מתחרה כאן מול כמה מן החברות עתירות הערך והחזקות בעולם. כשאנחנו דנים בנושא ב"משרד" המאולתר שלו, נראה ששארפ כובש במאמץ את הדחף לפצוח בנאום. הוא רוצה לספר על התוכניות שלו לעתיד, אבל רוצה גם לשמור את הקלפים קרוב לחזה. בסופו של דבר, הוא לא מצליח להתאפק, ניגש אל הלוח המחיק ומצייר עליו גריד של 2 על 2. על ציר ה-x הוא כותב "שיתוף וחיפוש". על ציר ה-y הוא כותב "טקסט ותמונה".

שיתוף טקסט? זה הרביע של פייסבוק וטוויטר. שיתוף תמונה? פייסבוק, אינסטגרם וסנאפצ'ט. חיפוש טקסט? גוגל ובינג. אבל חיפוש באמצעות תמונה? המרקר של שארפ משתהה לרגע באוויר, ואז רושם בתיבה את שמה של חברה יחידה: "פינטרסט". לצייר צירי x ו-y ואז למקם את החברה שלך ברביע משל עצמה הוא אקט קלאסי ודרמטי, שלא היה מבייש שום מייסד חברה. אבל שארפ צודק בדבר אחד: מדובר במרחב נדיר ובלתי מיושב. "זה הרביע הכי חשוב כאן, אין מה להשוות אפילו", הוא קובע ומשליך את המרקר בחזרה אל המגש לשם הדגשה. "וזאת הנחת היסוד של פינטרסט".