Blog
על המקרה המוזר של אברהם וולד או למה נתונים לא מדברים בעד עצמם?
בעידן של טכנולוגיה המאפשרת לנו לאסוף ולנתח כמויות אדירות של נתונים, קל להניח שהנתונים לבדם יכולים לספק את כל התשובות. בפוסט זה, 'נרים דגל אדום' לגבי הנחה זו.
אחת מהאשליות הכי גדולות שיש בקשר לנתונים היא שהם, כמשפט העממי – "מדברים בעד עצמם", ובכן מעבר לכך שעדיין לא נמצא האדם שיכול להעיד כיצד הם נשמעים, המקרה של אברהם וולד במלחמת העולם השנייה מתאר היטב את הבעייתיות במשפט הזה. בעיצומה של המלחמה, היה וולד חלק מקבוצה של סטטיסטיקאים וחוקרי ביצועים אמריקאים שקיבלו משימה להבין כיצד ניתן לחזק טוב יותר את מבנה המטוסים כדי שיהיו עמידים יותר בשדה הקרב.
כיאה לצוות מוכוון נתונים הוא החל את עבודתו במיפוי הפגיעות של מטוסים שנפגעו מאש גרמנית. מטוסים פגועים הועמסו על משאיות או נגררו להאנגרים ענקיים בהם ביקר הצוות על מנת לסמן במדויק את מיקומי הפגיעות. התוצר של השלב הזה היה שרטוט סכמתי שבו צוינו נקודות הפגיעה על פני דגם של מטוס, שרטוט שנראה כך:
למהנדסים שקיבלו את השרטוט התובנה הייתה ברורה, לכל אזור בו יש ריכוז פגיעות נדרש להתאים לוחות חיזוק שיגנו כנגד פגיעות עתידיות. מעט לפני תחילת המדידות והייצור, משהו עדיין הפריע לוולד, הוא התבונן שוב ושוב בשרטוט, ואז הוא הבין את הטעות הגדולה של המהנדסים – כל הנקודות אומנם ציינו פגיעות במטוסים, אבל מטבע הדברים אלו היו פגיעות רק במטוסים שנפגעו קל יחסית והצליחו להגיע לשטח ידידותי. איפה נפגעו המטוסים שהתרסקו בשטח אויב? ככל הנראה בדיוק במקומות שנותרו ריקים בשרטוט המקורי. כלומר, חיזוק המיגון צריך להתמקד באזורים הלבנים בשרטוט – המנועים, החלק הקדמי והחיבור בין בזנב לגוף.
בקבלת החלטות, המקרה הזה הוא דוגמה למה שנקרא הטיית הישרדות (Survivor bias) – הנטייה לקבל החלטות על סמך רק חלק מהנתונים, אלו שניתן לאסוף אותם, בעוד שנתונים אחרים, משמעותיים לא פחות, לא נכנסים למערכת קבלת ההחלטות כיוון שיש קושי למצוא אותם. דוגמאות לכך מהעולם הארגוני הם סקרי שביעות רצון משירות או מוצר מסוים שכמובן לא כוללים את האוכלוסייה שלא רכשה את המוצר או השירות מסיבותיה, או לחילופין, הסתמכות על נתונים קיימים בשלבי פיתוח מוצר – שמן הסתם כוללים רק נתונים לגבי מוצרים ושירותים קיימים ומצליחים עד לאותה נקודת זמן ולעיתים מובילים להתעלמות מצרכים והעדפות שנמצאים בשלבי גיבוש אצל קהל חדש ורחב יותר (בדומה לכך, שום נתון שהיה לבלוקבאסטר לגבי היקפי המכירות לא הצביע מספיק זמן מראש על נדידת ההעדפה לשירותי הסטרימינג).
לסיכום: המקרה של וולד ומיפוי פגיעות המטוסים והדוגמאות לאחר מכן, מהוות תמרור אזהרה ודגל אדום לכל מי שסבור שהנתונים הם תנאי מספק לקבלת החלטה, כדי שהם יהיו כאלו לא ניתן להסתפק רק בהם או בכמות גדולה יותר של נתונים – אלא יש צורך ביחד איתם גם במרכיבים נוספים ובראש ובראשונה אדם שיכול להסביר את המשמעות מאחוריהם, כמו אברהם וולד, הוא לעיתים רבות, הגורם המכריע בין בזבוז משאבים להחלטה טובה.