בסוף שנות ה־70, יצאו ערב אחד הפיזיקאי הנודע ריצ'רד פיינמן וחברו מפיק הסרטים ראלף לייטון לארוחה במסעדה תאילנדית, שבה נהגו לסעוד בקביעות. לייטון התלבט אם להזמין עוף בג'ינג'ר, כרגיל, או להחליף את המנה המוצלחת במנה אחרת, שעשויה להיות מוצלחת עוד יותר או התרסקות איומה.
פיינמן התלהב מהדילמה, וברגע ניסח את הבעיה כסוגיה מתמטית של קבלת החלטות בתנאי אי־ודאות. הוא כתב על מפית משוואה המתארת את ההחלטה שעל לייטון לקבל, בהתחשב במספר הפעמים שהוא מעריך שעוד יזדמן לו לאכול במסעדה הזאת וטווח האיכות הצפוי של המנות - כלומר, עד כמה גרועה או מוצלחת יכולה להיות מנה אקראית באותה מסעדה.
● המסחר הקוונטי: איך המתמטיקאים כבשו את וול סטריט
● אייס קפה עם אינסולין וחיסונים בבליעה: החוקר שמהנדס את העתיד בהשראת הגוף האנושי
במשך שנים רבות נותרה התוצאה שכתב פיינמן על המפית. הוא לא פרסם אותה בחייו, ואיש לא ידע אם הוא אכן שרבט פתרון בעל ערך.
לייטון הפך עם השנים לביוגרף של פיינמן, וכתב איתו ספרים מצליחים, ביניהם "אתה בטח מתלוצץ מר פיינמן!" המשעשע (שיצא בעברית בהוצאת מחברות לספרות). לאחר מותו של פיינמן, לייטון ירש את אוסף המפיות שלו ועבד עם כמה חוקרים מתחומי קבלת החלטות ותורת המשחקים כדי להבין מה נכתב באותה מפית במסעדה. ב־2013 הם הסכימו על מבנה הבעיה והפתרון שפיינמן הציע.
כעת, ב־2026, קבוצת חוקרים מאוקספורד, פרינסטון וCity־University of New York הוכיחה לראשונה שפיינמן אכן נתן את הפתרון האופטימלי לבעיה, וניתן להחיל אותו על בעיות נוספות דומות. המחקר, שהשתתפו בו יותר מ־2,500 נבדקים, הראה גם שאנשים בוחרים בין חלופות באותו אופן פחות או יותר. המאמר פורסם החודש בכתב העת המדעי המוביל PNAS.

שאלת הזמן ואיכות המנה
הנוסחה של פיינמן הביאה בחשבון מספר קטן יחסית של פרמטרים: איכות אפשרית של כלל המנות במסעדה, איכות המנה שכבר בחרנו ומספר הימים שעוד יש לנו לביצוע ההחלטה.
נניח שיש לנו יומיים בלבד לבקר במסעדה מסוימת, ואנחנו מניחים שאיכות המנות בה מפוזרת באופן אחיד בין 0 ל־1. די אינטואיטיבי לחשוב שאם המנה שקיבלנו ביום הראשון היא באיכות של 0.2, ביום הבא כדאי לנו לבחור מנה אחרת. לעומת זאת, אם איכות המנה היא 0.8, כנראה שלא כדאי להחליף. הרף האינטואיטיבי בדוגמה הזאת הוא 0.5. אם איכות המנה שלנו נמוכה ממנו, נחליף. ואם גבוהה יותר - נזמין אותה שוב.
פיינמן מותח את ההיגיון הזה, באמצעות חישובים סטטיסטיים, על פני לילות רבים יותר וטווחי איכות מורכבים יותר. לדברי פרופ' אייל וינטר, מהמרכז לחקר הרציונליות באוניברסיטה העברית, "התובנה העיקרית שעולה מהחישובים היא שככל שיש לנו יותר זמן לשהות ביעד ויותר הזדמנויות ליהנות מהבחירה החדשה שלנו, כך כדאי לנו יותר לחקור ולהחליף, כי יהיה לנו הרבה זמן ליהנות מהחלופה המשופרת שנמצא. לעומת זאת, אם הזמן שלנו קצר, עדיף לנו להישאר עם מה שעובד, ובתנאי שהאיכות היא מעבר לרף סביר כלשהו".

החוקרים במאמר שפורסם כעת הציגו לכ־2,500 נבדקים בחירה שהוצגה בצורה הפשוטה והדומה ביותר לבעיה שהגדיר פיינמן. "התוצאה הייתה דומה לזו של פיינמן במובן שהנטייה להחליף את הבחירה הלכה וירדה ככל שהנבדקים החלו להרגיש את סוף המסע", מסבירה פרופ' שוהם חושן הלל, סגנית דקאן להוראה בבית הספר למנהל עסקים וחברת מרכז פדרמן לחקר הרציונליות באוניברסיטה העברית. היה הבדל קטן: אצל הנבדקים, הנטייה להחליף מסעדה ירדה באופן לינארי עם הזמן, ואילו אצל פיינמן, הקצב ירד יותר מהר ככל שהסוף התקרב. בגבולות הגדרת הבעיה, המודל של פיינמן נותן תוצאה אופטימלית יותר, אבל דורש חישוב מורכב יותר.
בעיה דומה בגיוס עובדים
הבעיה שפיינמן ביקש לפתור היא מסוג "כללי עצירה", כלומר, בעיה שבה עלינו להחליט מתי להמשיך לבחון אפשרויות ומתי לעצור ולדבוק באופציה שבחרנו. אחת הבעיות המפורסמות מהסוג הזה היא "בעיית המזכירה", "שמשיקולי פוליטיקלי קורקט אנחנו כבר קוראים לה 'בעיית גיוס העובדים'", אומר וינטר. "בבעיה הזאת יש זרם של מועמדים שמגיע, ואחרי כל מועמד צריך להחליט אם אומרים לו כן או לא".
אלא שבניגוד לבעיית המסעדה, אחרי שבוחרים מועמד לא ניתן לשנות את הבחירה ואחרי ששילחנו מועמד לדרכו, לא ניתן לחזור אליו. "המשוואה קצת שונה, אבל הרעיון הכללי דומה: אנחנו מנסים להעריך את האיכות של כלל המועמדים תחת תנאי אי־ודאות, ולגזור מכך איזשהו רף איכות שאם נעבור אותו, כדאי לנו להגיד 'כן', מהחשש לאבד את האופציה הטובה רק כי חיפשנו את האופציה העוד־יותר טובה", אומר וינטר. גם בבעיית גיוס העובדים, מתברר שככל שאנחנו קרובים לסוף התהליך, עם פחות הזדמנויות לראות אופציות נוספות, כך כדאיות הפשרה גבוהה יותר.
"ישנה גם השאלה איך אנחנו מעריכים את ההתפלגות. אם אנחנו חושבים שרוב המועמדים טובים, כדאי לנו להמשיך לדגום. אם אנחנו מעריכים שרובם בינוניים, כדאי לנו לעצור ברגע שראינו מישהו שעומד באיזשהו רף מינימלי".
ד"ר רן סניטקובסקי, מהפקולטה לניהול ע"ש קולר באוניברסיטת ת"א, מוסיף כי אלה בעיות שניתן לקרוא להן גם Exploring-Exploiting, כלומר "לחקור לעומת לממש". "עד מתי אנחנו משתמשים בבחירות שלנו כדי ללמוד את העולם, ומתי אנחנו מרגישים שלמדנו מספיק והגיע הזמן לממש את הבחירה שלנו", הוא מסביר. אותו היגיון ניתן להפעיל גם בסוגיות של חיפוש חניה, בן זוג, דירה ועוד.
סניטקובסקי מבהיר שפיינמן רק נגע בתחום בעיות העצירה, אבל הן עולם שלם בפני עצמו. "מי שפיתח אותן הוא חוקר עם סיפור חיים לא פחות מעניין מזה של פיינמן. זה היה פרופ' דיוויד בלקוול, האפרו־אמריקאי הראשון שהחזיק משרה בברקלי והראשון שמונה לאקדמיה הלאומית למדעים".
מנסים לפני שמהמרים
אחת הבעיות הידועות בתחום הזה נקראת "הבנדיט בעל שתי הזרועות", על שמה של מכונת הגרלה שבה יש לנו אפשרות לבחור בין שתי זרועות (או יותר), שכל אחת מהן נותנת פרס בהסתברות שונה. תחילה, כדאי לנו לדגום את כל אחת מהזרועות, כך שנבין היכן הסיכוי הגבוה ביותר לקבל פרס. בשלב מסוים, כדאי לנו לקבל החלטה ולבחור בזרוע שנראית לנו המניבה יותר, אבל מתי נחליט שקיבלנו מספיק מידע? ניתן לכתוב משוואה שתציע לנו נקודת עצירה אופטימלית, כתלות במספר הפעמים שמותר לנו לשחק ובהערכת הבדלי התגמול בין המכונות.
סניטקובסקי מספר שניתן לראות באולמות קזינו בארה"ב מהמרים שמנסים תחילה את כל המכונות, זו אחר זו, כדי לנסות לראות "לאיזו מהן יש היום יותר מזל".

אנשים באמת משתמשים בשיטות האלה?
וינטר: "באופן אינטואיטיבי, אנשים עושים בחירות שמשקפות את התובנות שמשוואות בעיות העצירה מגלמות, אבל כמובן הם לא פותחים משוואה בכל פעם שהם מגייסים עובד או בוחרים מסעדה.
"המשוואות הללו כן משמשות אותנו בתחום ההנדסה. למשל, אם אנחנו בוחנים שני אלגוריתמים שמפיקים תוצאות שיש בהן אקראיות ואנחנו רוצים לדעת איזה מהם מספק תוצאות טובות יותר, אנחנו כן נגדיר למערכת זמן מסוים לבדיקה שאחריו עוצרים ובוחרים, ממש על פי משוואות העצירה שפותחו לבעיה הזאת. או אם אנחנו מפתחים מודל בינה מלאכותית ואנחנו רוצים להחליט כמה זמן אנחנו רוצים לאמן אותו לפני התחלת השימוש בו. זאת בעיית עצירה שיש לה פן מתמטי פורמלי".
סניטקובסקי נותן דוגמה אחרת לשימוש במשוואות. "נניח שיש לי רובוט שואב, שמוקצה לו זמן סוללה מסוים לכסות את כל הבית - כמה מהזמן הזה הוא מקדיש כדי להסתובב ולמפות את הבית כדי שיהיה לו קל יותר לשאוב בהמשך, וכמה לשאיבה עצמה?".
לדברי סניטקובסקי, גם מודל תמחור האופציות בלק אנד שולס הוא סוג של בעיית עצירה. המודל מניח שבשלב כלשהו נפסיק לחכות לתועלת המקסימלית של האופציה ונמכור אותה, ומחשב מהו המחיר האופטימלי לעשות זאת, תוך שהוא מביא בחשבון את התנודתיות הצפויה של המניה. כמובן, מדובר במודל סטטיסטי, ואיננו יודעים באמת לא מה תנודת המניה ולא אם אנשים אכן ימכרו אותה במחיר שהמודל מציע. בכל זאת, מפתחי מודל בלק אנד שולס קיבלו עבורו פרס נובל, והוא הפך שימושי מאוד בכלכלה.
"בין בעיות העצירה, בעיית המסעדה של פיינמן היא לא באמת כל כך מסובכת, ולא באמת הייתה דרושה המפית שלו כדי לפתור אותה", אומר וינטר, "אבל זה גם חלק מהשיווק של מאמרים במתמטיקה. המאמר פורסם בכתב עת עם הרבה יוקרה, שגם מאוד אוהב לפרסם את עצמו - והנה זה מה שיצא".
יש לפיינמן עוד מפיות מעניינות כאלה שאנחנו צפויים לגלות בהמשך?
"אני מאמין שאת הדברים הבאמת חשובים שמצא, הוא פרסם כמאמרים".
בין המשוואה לחיים
אם אתם מרגישים שאתם בוחרים מסעדות או מנות אחרת מכפי שהתיאוריה מציעה, אתם כנראה לא טועים. יש במשוואה כמה מרכיבים חסרים, אומרת חושן הלל. לדוגמה, יש הבדלים בין־אישיים ברמת הגיוון שבני אדם מחפשים. יש מי שעבורו הרעיון לחזור לאותה מסעדה בחו"ל פעמיים נחשב בעצמו לחילול הקודש, ואילו אחרים ידבקו במנה שמשביעה את רצונם, לא משנה מה ההתפלגות הנתפסת בעיניהם או כמה לילות נותרו להם לסעוד במקום. פיינמן הניח במשוואות שלו אדם אדיש לסיכון, אדיש לאלמנט הריגוש, שרק האיכות האבסולוטית של המנה מעניינת אותו.
"ישנו לא רק הבדל בין־אישי, אלא אפילו הבדל באותו אדם במצבים שונים", אומר סניטקובסקי. "למשל, בקבלת החלטת השקעה בבנק הם יכולים להיות שונאי סיכון, ובקזינו חובבי סיכון".

חושן הלל מוסיפה: "השאלה הזאת של בחירת המנות במסעדה חושפת המון מידע מעניין על בני אדם. למשל, מתברר שאנשים משערים שהם ירצו גיוון יותר מכפי שהם רוצים בפועל. איך בחנו זאת? מקבוצת נבדקים אחת ביקשו להכין תפריט שבועי, ומחברי הקבוצה השנייה ביקשו לדווח כל יום מה הם רוצים לאכול. הקבוצה שתכננה תפריט שבועי נמנעה מלחזור על מנות ואילו הקבוצה שבחרה כל יום גיוונה פחות.
"נראה שאנשים מעריכים ביתר עד כמה הם בכלל יזכרו ביום הרביעי את הטעם של מה שהם אכלו ביום ראשון, או מעריכים בחסר את האנרגיה הקוגניטיבית לבצע בחירה יצירתית יותר. אז בפועל אולי בכל זאת נמצא את עצמנו בכל פעם אוכלים עוף בג'ינג'ר".
מסתפקים או ממקסמים?
הבחנה נוספת רלוונטית לבחירה: האם אתם Satisficers או Maximizers (מסתפקים או ממקסמים)? "המסתפק באופן עקרוני רוצה להגיע לרף איכות מסוים, ואחרי שהגיע אליו, הוא בוחר אופציה ומרגיש מסופק. הממקסם הוא אדם שחשוב לו להגיע למקסימום האפשרי, והוא לא יהיה רגוע עד שבחן כמה שיותר אפשרויות, והשתכנע שלא היה יכול באופן ריאלי לעשות יותר כדי לשפר את מצבו".
זו תכונת אישיות, אולם לפעמים אנשים הם ממקסמים או מסתפקים בנסיבות חיים שונות. לדוגמה, מתחתנים עם האישה הראשונה שאיתה יצאו לדייט אבל גוררים אותה בסיבובים בלתי פוסקים סביב היעד בחיפוש אחר מקום החניה הקרוב ביותר.
"המחקר מראה שהמסתפקים הם בעיקרון אנשים יותר מרוצים מחייהם מאשר הממקסמים, שהם רוב הזמן מאוד עייפים מניסיונות המקסום שלהם", אומרת חושן הלל ומוסיפה שבעיות בחירה משתנות בהתאם לשאלה אם המוצר הנבחר הוא תלוי טעם או שיש לו איכות ברורה. כשהמוצר תלוי טעם, השיקולים הופכים להיות יותר מגוונים, וכוללים גם פרמטרים כמו הרצון להרשים בבחירה מיוחדת, או להיפך, הרצון להימנע מחרטה אם הלכתם על בחירה נועזת מדי.
אחד המאמרים של חושן הלל הראה, למשל, כיצד חוכמת ההמונים משתלבת בסוגיה של חיפוש־מימוש. כשאנשים לומדים על אופציות מוכרות מאנשים שהם מכירים, תגבר הנטייה שלהם להמשיך לבדוק את האופציות הלא מוכרות. נראה שישנה כאן התבוננות על הסוגיה ממבט של "אנחנו", ולא רק של "אני", ורצון להגדיל את כמות המידע הזמינה לקולקטיב, ולמקסם את התוצאה ברמת הקבוצה.
"יש עוד המון המון גורמים שמשחקים תפקיד בבחירת מסעדה", אומר סניטקובסקי. "מחקר שאנחנו ערכנו קשור בתפקיד של התור למסעדה והצפיפות בה כסמן של איכות, לעומת התור והצפיפות כמשהו שבעצמו גורם אי־נוחות. אנחנו חושבים שהמסעדנים מאוד אוהבים לראות תור למסעדה שלהם ומעריכים בחסר את רמת האי־נוחות שהוא גורם, ואת הסיכוי שסועדים יוותרו על מסעדה שהם מניחים שיהיה בה צפוף".
בכל זאת רציונלים?
בסופו של דבר, בני האדם הם כן די רציונליים", טוען סניטקובסקי. "מאז שבוצעו העבודות המפורסמות בקבלת החלטות על ידי כהנמן וטברסקי, יש איזה הייפ על חוסר רציונליות, שבעיניי הוא מוטעה קצת. כהנמן וטברסקי לא טענו אחרת, אלא הראו נקודות מאוד מסוימות שבהן יכולת החישוב של האדם הסביר גורמת לסטייה מוגבלת וצפויה מהאופטימום המתמטי הטהור. אבל כל התנהגות יכולה להיות מתוארת כרציונלית אם אנחנו מניחים שאדם בסופו של דבר עושה מה שהוא רוצה, ורוצה את מה שהוא עושה, מהסיבות שלפעמים ידועות רק לו".
האם אפשר עקרונית להוסיף על גבי המודל הזה גם את כל ההבדלים הבין־אישיים, והסוגיות האחרות, עד שנגיע למודל שהבסיס שלו הוא המשוואה של פיינמן, אבל כן מנבא התנהגות של בני אדם בסבירות גבוהה?
סניטקובסקי: "הסטטיסטיקאי ג'ורג' בוקס אמר שכל המודלים הם מוטעים אבל חלקם שימושיים. מודל כמו של פיינמן לא נועד לחזות התנהגות אנושית, אלא להאיר זוויות מעניינות להתבונן בבעיה".
עם עליית כוח החישוב, שוב חוזרת האופטימיות לגבי האפשרות לנבא מערכות מורכבות, אפילו התנהגות אנושית.
סניטקובסקי: אני מאמין שאי־אפשר יהיה לעולם באמת לנבא את ההתנהגות האנושית באופן מלא. תמיד יהיה אלמנט של אי־ודאות והמודל לעולם לא יהיה מושלם. אפשר בהחלט, ברמה העקרונית, להוסיף למודל עוד ועוד פרמטרים, ולקבל ניבוי שמתקרב יותר למציאות, אבל לפעמים המודלים הפשוטים הם דווקא אלה שנותנים לנו איזו תובנה על החיים, למשל שככל שיש לנו פחות זמן, כך ניטה להתפשר. ואילו מהמודלים המורכבים אנחנו אולי יכולים לחזות, אבל קשה יותר להפיק הבנה אינטואיטיבית ושימושית על העולם".




















