קלירפורסט עושה סדר ביער המידע

קלירפורסט, שנבחרה לפני חודשיים לאחת מ-20 חברות הסטרט-אפ המבטיחות ביותר על ידי ה"רדהרינג", פיתחה מערכת לקריאת טקסטים וניתוח המידע בצורה גרפית פשוטה

המהפכה האינטרנטית, חשוב להדגיש, אינה מתמצה רק בכל אותן אפליקציות מושכות עין ואוזן, כמו סרטי וידאו או קבצי מוסיקה ב-MP3. נראה שהצד הבידורי שבאינטרנט השכיח לרגע את מקורו כרשת בינ-אוניברסטאית, ושהכינוי המקצועי למהפכה הזאת הוא מהפכת טכנולוגיית המידע (Information Technology - IT). מבין כל התופעות שהאינטרנט הביא איתו המשמעותית ביותר היא הנגישות הגדולה למידע. מכר שלי, משקיע טכנולוגי, העסיק סטודנט במשרה חלקית לאיתור מידע בנושאים טכנולוגיים שיסייעו לו בתחום עיסוקו. התפקיד כלל איתור מידע רלוונטי, אגירתו וסידורו לפי סדר חשיבותו. הסטודנט אמנם עשה עבודה טובה, המידע זרם, אבל למכר שלי התברר שבחצי משרה הוא פשוט לא מצליח להגיע לרמת הדיוק והתמצות הרצויה, ולכן נפרדו דרכיהם לטובת עובד במשרה מלאה.

מכאן שהצורך במידע זמין ואיכותי ברור, הבעיה היא איך מגיעים אליו? פתרון אפשרי אחד נותן יונתן אומן, אחד ממייסדי קלירפורסט, שמשמש כיום כמנהל הטכנולוגיה. קלירפורסט נבחרה לפני חודשיים לאחת מ-20 חברות הסטרטאפ המבטיחות ביותר על ידי מגזין רדהרינג. "בגדול הכוונות שלנו נוגעת לכמות המידע העצומה שחברות מפסידות בגלל שהן לא יכולות לטפל בו, לא יכולות להגיע אליו בכלל. מטרתנו להפוך מידע ליתרון תחרותי בכך שאנחנו נותנים לאנשים להסתכל על היער ואם הם רוצים הם יכולים להעמיק ולראות את העצים. לכן קראנו לחברה קלירפורסט (ClearForest). תחום העיסוק שלנו Text Mining, כלומר קריאת מסמכי טקסט, הבנתם וארגון המידע שבהם כך שלמשתמש יהיה נוח לנתח. אנחנו נותנים מגוון גדול של דרכים ושימושים לטובתו של המשתמש. המוצרים של קלירפורסט מיועדים למוסדות פיננסיים, ולכל ארגון גדול שצריך מידע זמין ואיכותי. בתחום הפיננסי אנחנו סוקרים חדשות רלוונטיות ומסוגלים לתת סיכומים ויזואליים של המאמרים. בטקסט חדשותי - אנחנו מסוגלים לזהות אירועים, והמערכת מסכמת כל אירוע במשפט מתוך כתבה גדולה".

אומן הוא דוקטור במדעי המחשב ובמתמטיקה עם התמחות באלגוריתמיקה מהאוניברסיטה העברית. את הפוסט-דוקטורט שלו עשה ב-MIT ובמשך שנה עבד בהרווארד. "ב-MIT עבדתי עם פרופ' טום לייטון שהקים את חברת אקאמאי (חברת תשתית אינטרנט שנסחרה בשיא בשווי של 33 מיליארד דולר וכיום נסחרת לפי 2 מיליארד דולר - מ.ב). למעשה, עזבתי כאשר דניאל לוין (הסטודנט הישראלי של לייטון שהפך לשותפו לייסוד אקאמאי - מ.ב.) הגיע מהטכניון לעשות שם דוקטורט". אומן הצטרף לסגל במחלקה למדעי מחשב של אוניברסיטת בר-אילן, שהיתה אז מחלקה צעירה עם פוטנציאל גדול לקידום לחוקר צעיר. "צוותתי באותו חדר עם רונן פלדמן, ומהחוויה האינטנסיבית ההיא צמחה קלירפורסט".

פלדמן, המשמש כיום כנשיא החברה, הוא בוגר מחזור שלוש של תלפיות ששירת בחיל האוויר ועשה גם הוא דוקטורט בתחום האינטליגנציה המלאכותית באוניברסיטת קורנל, שליד ניו-יורק. ההתמחות שלו היא בתחום ה-Data Mining, ונחשב לאחד מאלו שפיתח את תת-ההתמחות של Text Mining. אומן: "רונן הוא ממש גורו בתחום הזה. הוא האדם שטבע את המושג וממשיך להיות דמות מובילה בו. הוא מוזמן לכל הכנסים, אקדמיים כעסקיים, שעוסקים בתחום".

- מה למתמטיקאים ולניתוח טקסטואלי שיש בו מרכיב גדול של מחקר מעולם הסמנטיקה?

"רונן פלדמן פיתח את התחום הזה מסיבה פשוטה. הוא לא אוהב לקרוא. והמערכת שהוא הגה נועדה לתת סיכום גרפי שחוסך הרבה זמן קריאה ולהיות אינטראקטיבית עם המשתמש".

קלירפורסט החלה את פעילותה באוגוסט 98' במרתף בגבעת שמואל. המשקיעים הראשוניים של החברה, בני משפחת וייל, מכירים את שני היזמים מבית הכנסת. משפחת וייל, היתה ממייסדי אוסם שמכרו את חלקם לחברת נסטלה וכיום הם משקיעים בהיי-טק. בספטמבר 99' בוצע סיבוב הגיוס המוסדי הראשון בו השקיעו בחברה הקרנות וולדן ופולריס. לדברי היזמים, לפולריס היתה תרומה רבה למצבה של החברה. אחד הדברים החשובים שעשו היה הבאת מנכ"ל מקצועי. "שיווענו לניהול מקצועי" אומר אומן, "והם הביאו לנו את ברק פרידור".

פרידור, בן ה-31, הוא בעל תואר ראשון במדעי המחשב בת"א, ומינהל עסקים בביה"ס אינסייד שבפונטנבלו, צרפת. במקביל ללמודי התואר הראשון החל לעבוד בטקנומטיקס כמתכנת ובמשך הזמן הפך למנהל של כל פעילות החברה בישראל.

"בשנת 99' רציתי לעזוב את טקנומטיקס ולנוח שנה", אומר פרידור. "רציתי לחזור לאהבה הגדולה שלי, המוסיקה. יום אחד התקשר אליי רמי ברכה מפולריס, שהוא חבר שלי מזה שנים, והציע לי לראות חברה מעניינת. פגשתי אותם באיזה חור מזעזע בקרית מטלון, אבל לא היתה לי שום כוונה להפסיק את החופש. בטח לא אחרי שראיתי את המקום. אבל הגרסה הראשונית שהם הציגו לי היתה פשוט מדהימה, היא העיפה אותי לגמרי, ולכן קיצרתי את התוכניות שלי והצטרפתי לחברה כמנכ"ל בתחילת ינואר 2000".

- יונתן, למה רונן ואתה, היזמים, ויתרתם כל כך מהר על הניהול?

"המושג 'ויתרנו' לא רלוונטי לגבינו. מהיום הראשון חיפשנו אנשי מקצוע בכל תחום. לא רונן ולא אני חשבנו שאנחנו מנהלים. הצלחה של חברה היא הרבה מעבר לטכנולוגיה מוצלחת, ולכן היה ברור לנו שצריך מישהו עם ידע ויכולות של ניהול. לנו הרבה יותר טוב מאז שברק הגיע ואיפשר לנו לעסוק בדברים שהכי מעניינים אותנו ושאנחנו הכי טובים בהם. כל פעם שנוסף לחברה סגן נשיא אני שמח יותר, ולא רק בגלל שזו עדות לצמיחה של החברה מ-20 עובדים בפתחתקווה ל-80 עובדים בניו-יורק ובאור-יהודה".

- למה לקחת מנכ"ל ישראלי לחברה שמחפשת שווקים בינלאומיים, בעיקר אמריקניים?

פרידור: "כי המנטליות האמריקנית היא שאין שום דבר חוץ מארה"ב. לכן דווקא מנהל ישראלי, שאינו מקובע לאיזושהי תרבות ובמנטליות שלו יש בסיס מערבי מאוד חזק, יצליח לבצע את האינטגרציה בין האנשים מכל העולם, את הגישור על הפערים, באופן חלק יותר".

- ואיך אתה מסתדר בגישור על הפערים בין ישראלים לאמריקניים?

"גדלתי בארה"ב, ולכן אני מכיר היטב את התרבות האמריקנית. בהזדמנות ארצה להיות יועץ לענייני יחסי עבודה בין ישראלים לאמריקנים. זה מתחיל מהדברים הקטנים: כשאמריקני אומר לך שמשהו קשה לביצוע, הוא פשוט לא יקרה. הישראלי, לעומת זאת, לא מרים ידיים. רמת הבוטות הישראלית, למשל, יכולה להיות מקור להתלקחויות. למרות השם הרע שיצא לנו בעניין, המציאות הרבה פחות דרמטית. כשאמריקני כבר בא להתראיין בחברה ישראלית סימן שהוא התגבר על הסטיגמה".

- רצית חופש, וכל כך מהר ויתרת על הנוחות בחיים בבית בישראל לטובת מעבר לארה"ב.

פרידור: "הקמת המטה בארה"ב היתה דבר מתבקש מבחינה עסקית. בכל מקרה רציתי לגור בארה"ב תקופה מסויימת כך שהכל הסתדר לטובה. בניית המטה היא אתגר משמעותי מבחינתי. בהתחלה המשרד בניו-יורק היה הטלפון הנייד שלי, אבל בהמשך רונן הצטרף אליי והיום אנחנו יושבים בקומה ה-47 במגדלי התאומים עם נוף מדהים ו-20 עובדים שעוסקים בעיקר בשיווק, מכירות ופיתוח עסקי".

- איך ניתן לנתח טקסט באופן שבוחן את ההקשרים הפנימיים שלו?

אומן: "אנחנו יוצרים ספרי חוקים שבהם נוצר בסיס הידע לפי קשרים, אינטרקציות, בין גורמים בתוך אותו תחום שמאפשרים לנו זיהוי הקשר ומהותו. למעשה, המערכת מסוגלת לזהות הקשר טקסטואלי המדבר על שינוי במצבו התעסוקתי של העובד. לדוגמה, משפט כמו 'רוג'רס, שהיה בעברו בכיר בסיסקו' יוביל את המערכת להבנה שאותו רוג'רס עבר מתפקידו בסיסקו. היתרון של הכלי הוא בכך שאם במסמך אחר כתוב שהוא עזב ובמסמך שני כתוב מתי הוא עזב, המערכת תדע לחבר את שני הנתונים".

לקלירפורסט שני מוצרים: ClearSight - מוצר שמטפל רק בתכני חדשות אקטואליים, עד חודשיים, שלושה אחורה. השני - ClearResearch שנותן פתרון מערכתי כמעט ללא מגבלות מבחינת כמות המידע שאותו הוא יכול לסרוק. היכולת העצומה לעיבוד כמות גדולה של מידע נובעת מכך שהמוצר בנוי על עבודה עם חוות שרתים, כך שגם אם יש עומסים גדולים יותר ניתן להגדיל את החווה בהתאם.

התוצאות מוצגות באופן גרפי כמו שמש שבמרכזה המושג המבוקש ומסביב המושגים שקשורים אליו ומיוצגים באמצעות חיצים. צבע החץ מסמן את סוג הקשר - עובד-מעביד, חברות מתחרות, חברות מאותה משפחה וכו', ואילו חוזקו מסמל את מידת הקרבה בין שני הישויות. קשר שעוצמתו נקבעת לפי מידת הביטוי של המושג, כלומר תדירות הופעתו במסמכים. המערכת יכולה לקבוע את המידתיות גם לפי רמה כמותית וגם לפי רמה איכותית. המערכת מאפשרת לבצע ZOOM-IN ZOOM-OUT לגבי מספר הקשרים הנדרשים למושג המבוקש וגם תקופת החיפוש ניתנת לכיול.

- ניתן להגדיר את רשת האינטרנט כולה כמאגר המידע שייבחן?

אומן: "תיאורטית אפשר להגדיר את הרשת כולה, אבל מעשית לא. מדברים על 10,000 מסמכים כשמתוכם פחות מ-0.1% מתאימים לתחום ספציפי. ייחודו של הפתרון שלנו הוא בהתמקצעות שלו, זה לא פתרון גנרי, הוא נובע מהפרספקטיבה - אם התחום הוא העיסקי, הפוליטי, הביטחוני וכו'. מנועי חיפוש רגילים יוצאים כל לילה לבצע חיפוש בכ-20% מהמידע שעל האינטרנט ועל בסיס המצאי נבנה מאגר המידע. הייחוד שלנו שכל מסמך חדש שנוסף אינו מצריך בניית מאגר המידע מחדש. הדף מתווסף למאגר הקיים על בסיס הכללים שהוגדרו".

- אז למה לא להשתמש פשוט במנוע חיפוש חזק?

"אנחנו מאפשרים לגורמים המעוניינים לא לקרוא את המסמכים, אלא לקבל תשובות פשוטות ומסכמות שמתארות בצורה גרפית, ככל האפשר, את המידע. אנחנו לא מנוע חיפוש, ולכן אנחנו גם לא מתחרים בהם. למעשה, אנו משתמשים בתוצאות שלהם".

- ואיך מתבצע תהליך הזיקוק הטקסטואלי?

פרידור: "מהות התוכן אינו רלוונטי למערכת שלנו - Content Agnostic. התוכן עובר תהליך של הפקה/זיקוק של הידע, שמשמעותו שהטכנולוגיה עוברת על מספר מידרגי זיהוי: בהתחלה היא מזהה ישויות, אח"כ תזהה את מהות הישות - אדם, חברה וכו', אז היא תבחן האם קיים קשר בין הישויות השונות, ולבסוף תבצע את הזיקוק המוחלט ותדע לספק תשובה לשאלה האם הקשר הוא מסוג 'תעסוקה', 'תחרות' או 'בעלות' וכו'. בסיום תהליך זיקוק הידע המערכת תציג את התוצאות כמפה של ישויות, הקשרים ביניהם ומידת הקרבה בכל קשר באופן גרפי, פשוט וצבעוני".

אומן: "קרבי הטכנולוגיה בנויים על אוסף של חוקים שכתובים בשפה מיוחדת שפיתחנו ושמגדירה מה הוא פריט מידע מעניין ואיך לזהותו. למשל, אוסף של חוקים שמגדירים שהמילה או אוסף המילים הזה הוא בן-אדם. חוק אפשרי, לדוגמה, הוא שאם אותו אוסף מילים צוטט בקטע מסויים, אז הוא, כנראה, בן-אדם. יש לנו מבנה היררכי של חוקים כאלה כדי להביא לתוצאה אופטימלית. לא מידע מיותר ולא מידע חסר. פיתחנו יכולות לשוניות לזיהוי תחילתו וסיומו של שם. לדוגמה, להבחין בין New York Stock Exchange לבין New York. המערכת שלנו בנויה על חוקים סמנטיים ובזכותם היא מצליחה להגיע לרמת הדיוק הזאת".

- עד כמה גנרית הטכנולוגיה שלכם. כלומר, באיזו מהירות תצליחו לבנות מערכת שממפה טקסטים משפטיים, לדוגמה?

אומן: "הטכנולוגיה שלנו אכן גנרית, כך שמה שנצטרך לעשות זה לקחת מומחה משפטי ואז לבנות את מערכת החוקים לתחום ידע זה. הבסיס, סביבת הכתיבה, כבר פותחה בקלירפורסט והיא גנרית לחלוטין. כדי לבנות ספר חוקים לתחום מסוים יידרש לנו 3 חודשים, אבל ככל שהמיומנות שלנו תעלה - זמן הביצוע יתקצר".

- המוצר שלכם מאוד שובה את העין, אבל נראה שיש חברות רבות שעוסקות בתחומים משיקים, כמו מנועי חיפוש מאוד חכמים ומהירים. הן יכולות להתחרות בכם?

אומן: "מאוד קשה ומסובך להגיע לשלב הטכנולוגיה שבו המוצרים שלנו נמצאים. תוצאה של מאמץ שנמשך 8 שנים. אלכס לינדן, אנליסט של גרטנר גרופ, אמר לנו שיש לנו יתרון של לפחות שנה אחת. אם למישהו היה יכולת דומה לשלנו, הוא היה מציג אותה או יוצא בהצהרה כלשהי. עם זאת, יש מספר שחקנים שיש להם נגיעה לתחום העיסוק שלנו: קודם כל, יבמ, שמחזיקה מעבדה של Natural Language, אבל הם לא בונים מוצר מדף, אלא עובדים פר פרוייקט. Atonomy היא חברה אנגלית שהמוצר שלה יודע לבחון מסמך ולהגדיר בו קטיגוריות. יום אחד הם יהיו שותפים מצויינים עבורנו".

היום המערכות של קלירפורסט בנויות לטפל בטקסטים בתחומי עניין מסויימים: שירותים פיננסיים, מחקר תחרותי, פיתוח עסקי ותאגידי, שמיועד גם לחטיבות מחקר בחברות ענק. כאשר המכירות מתבצעות לשני סוגי לקוחות יעד: מוצר ה-ClearSight מיועד ללקוחות שמקבלים זכות שימוש מתוך קשר עם החברה המתווכת. כלומר, לקוח של בנק השקעות, לדוגמה, שהבנק נותן לו הרשאה להשתמש במוצר כדי לקבל מידע מהיר באתר של הבנק, מעין B2B2C. המערכת נבנתה כ-ASP (ספקית שירותי אפליקציות), שבו ניתן להשתמש במידע. עבור שירות ה-ASP החברה, שרוצה להעניק את השירות ללקוחותיה, תשלם דמי שימוש שנתיים, שמחירם תלוי בסוג האתר ובמספר המשתמשים המקסימלי. לדברי פרידור, טווח המחירים הממוצע לעסקה 500-100 אלף דולר.

את המוצר החזק יותר, ה-ClearResearch, מייעדים בקלירפורסט ללקוחות עסקיים ולכן הוא נמכר ישירות על בסיס של רישיונות שימוש לתוכנה. עסקה ממוצעת בתחום העסקי נע בין 200 ל-600 אלף דולר בתוספת תשלום לתחזוקה שוטפת. בין לקוחותיה הגדולים: ג'נרל מוטורס, פורד, קודאק, פרוקטור אנד גמבל, קרדיט סוויס פירסט בוסטון, מישלין ו-EDS.

"אלו לא לקוחות של מוצר הביטא, שלא משלמים כלום", מסביר אומן, "אלא לקוחות לכל דבר ששילמו הרבה כסף עבור השימוש במוצר. במידה מסויימת מצב זה הוא תוצאה של החלטה אסטרטגית שרונן קיבל כבר בהתחלה - לא לתת כלום בחינם. כשברק הצטרף לחברה העסק הקצין. לדעתו, כל סכום שבו אנחנו נוקבים, נמוך מדי".

- מתי תאפשרו לציבור הרחב נגישות למוצרים שלכם?

פרידור: "זה לא יקרה בעתיד הקרוב, אבל העניין נמצא על השולחן כבר הרבה זמן. אנחנו מנסים לבחון איך אפשר להרוויח מיישום לציבור. צריך גם לראות איך לבנות מוצר שיתאים לציבור, כלומר יכלול הרבה מקורות מידע, אבל עדיין יניב תוצאות ממוקדות. כנראה, שהדרך תהיה לפנות ללקוחות קצה באמצעות פורטלים מקצועיים, שעבורם יוכל הציבור לשלם דמי מנוי. זה נראה לנו נכון, כי כך נוכל למתג את המוצר שלנו כמוצר שמיועד ללקוחות High End".

- מהם תוכניותיכם לעתיד?

פרידור: "השנה הקרובה היא השנה שבה ננצל את ההכנסה שכבר יש לנו לחדירה גדולה יותר בשוק הפיננסי. במקביל אנחנו מתחילים להתמקד בשוק היעד הבא שלנו, שוק המחקר העסקי. בתחום הטכנולוגיה אנחנו רוצים לשמור, כמובן, על היתרון שלנו ולשפר את הטכנולוגיה כך שהיא תציב רף חיקוי גבוה עד בלתי אפשרי. אנחנו בוחנים איך להעביר את המידע שהמוצרים שלנו מספקים גם למכשירי קצה ניידים. ההיתכנות של הנפקה עתידית תלויה במצב השווקים. הנפקה היא לא יותר מדרך נוספת לגיוס הון, ומבחינת הרווחיות נהיה מוכנים לכך ב-2002".

- איך הגעתם לכנס של רדהרינג שבו נבחרתם כאחת מ-20 חברות הסטרט-אפ המבטיחות ביותר על ידי המגזין.

פרידור: "רדהרינג שמעו אלינו לאחר שבאחד הפרוייקטים שלנו המוצר נדרש לעבור על מאגר המידע של רדהרינג. מישהו הציע לנו להציג את המוצר באחד הכנסים שלהם. לאחר שראו אותנו הם הודיעו לנו שנבחרנו על ידם כסטרטאפ נבחר. החלק המעניין בסיפור הוא, שרדהרינג מנסים לקבוע את פני השוק בעתיד, ולכן הם בחרו 10 טרנדים שיובילו את השוק הטכנולוגי, אבל אנחנו לא נכנסנו לאף קטיגוריה ולמרות זאת נבחרנו. זה היה מאוד מרגש, וזה גם אישר את הייחודיות שלנו".

- ומה יצא מהבחירה הזאת, קיבלתם פסלון?

"אני חושב שנוצרו שם קשרים עם משקיעים שיועילו לנו בהמשך. אבל זה היה החלק הפחות משמעותי. הקשרים היותר משמעותיים נוצרו דווקא עם לקוחות פוטנציאליים ועם חברות, שעשויות להיות שותפות עתידיות שלנו".