מגזין

הנומראטי

הספר "אשפי המספרים" מאת סטיבן בייקר, מבהיר טכנולוגית ומתמטית את תיאוריית האח הגדול של ג'ורג' אורוול. הישענותו על מידע ומדע חדשים ועדכניים, יוצקת תוכן מפורט ומבהיל לדרכים השונות שבהן חשופים חיינו למעקב והטייה

מאת גיל מטוס. 02-12-2010

תגיות: טכנולוגיה, ג'ורג' אורוול, נומראטי, סטיבן ביקר, אשפי המספרים, 1984

ב-"1984", ספרו של הקלאסי של ג'ורג' אורוול, יש באג רציני שאינו גורע מגדולתו, אך מונע מהרעיון של אורוול להיות מיושם. האח הגדול עוקב אחרי האזרחים ויודע בדיוק מה כל אחד מהם עושה בכל רגע נתון. אך נשאלת השאלה, האם באמת ניתן לעקוב אחרי כל אחד ואחת באופן שיבטיח שליטה מלאה על כולם? בהנחה שגם העוקבים צריכים לישון ולנהל חיים משל עצמם מחוץ לעבודה, מי מחליף אותם בזמן שהם לא עוקבים? ובכלל, מי עוקב אחרי העוקבים?

אף מפלגה אינה יכולה לבטוח בכל כך הרבה עוקבים, ולכן חייב האח הגדול להיות ריכוזי ולעקוב אחרי העוקבים ואחרי אלה שעוקבים אחרי העוקבים, וכך הלאה. בקיצור, היישום של האח הגדול פשוט בלתי אפשרי, לפחות ל- 1948, השנה שבה נכתב הספר. באותה תקופה המחשבים רק הומצאו ובקושי היו בשימוש, ואורוול לא יכול היה לחזות את יכולות החישוב המאסיביות שלהם והאפשרות להשתמש בהם ככלי מעקב יעיל.

אורוול לא חזה מגמה נוספת וחשובה לא פחות. הוא הניח כי השליטה על ההמונים תעשה בכוח ובאמצעי דיכוי. וינסטון סמית, גיבור הסיפור, מייצג את הכמיהה לחופש ואת הניסיון לברוח משליטתו של האח הגדול. אורוול לא העלה על הדעת שיגיע היום שבו וינסטון יבחר לבלות את זמנו מול הטלסקרין, ואולי אף יתקין לעצמו עוד כמה מכשירי מעקב בבית מרצון, תחת הנימוק שהם הופכים את החיים לנוחים יותר.

 

מתוך עטיפת הספרמתוך עטיפת הספר

"אשפי המספרים", ספרו של העיתונאי סטיבן בייקר שראה אור ב-2008 ותורגם לעברית לאחרונה, עוסק בסוגיות של מידע ופרטיות בעולם המספרים. בעידן הטכנולוגי כולנו משרתים את האח הגדול. בין אם הוא מייצג גוף אחד או גופים רבים, כולנו יצרנים ומפיצים גדולים של מידע. שימוש בסלולר, כתיבת אימייל, עדכון סטטוס בפייסבוק, ציוץ בטוויטר, גיהוץ של כרטיס אשראי, כרטיס חבר בסופר. מדובר בכמות אינסופית של נתונים שתופחת בכל אלפית שנייה.

אם האח הגדול של אורוול היה מקבל את כל הנתונים הללו, ודאי היה קורס, מכיוון שעודף מידע משתק ולא בהכרח מועיל. אך בימינו, הנתונים שמצטברים הופכים לרלוונטיים ככל שכוחם של המחשבים גובר. הנתונים הם הזהב של העידן החדש ומתמטיקאים ומדעני מחשב, נמצאים בעמדת כוח המאפשרת להם לשלוט במידע של כולנו. את אותם אנשים מכנה בייקר "הנומראטי" (על משקל אילומינאטי), אשפי המספרים שמשחקים עם הנתונים של חיינו ומתיימרים (לפחות חלקם) להפוך את המורכבות של החוויה האנושית לנוסחה מתמטית.

בשבעה פרקים מתאר בייקר את הפרוייקטים עליהם עמלים הנומראטי, האופן שבו הם רואים את העתיד ועמדתם המוסרית לגבי אופי עבודתם. שבעת הפרקים הם שבעה פרופילים רווחיים מאוד, שהנומראטי מנסים לפצח: העובד, הקונה, המצביע, הבלוגר, הטרוריסט, המטופל והמאהב.

בכל אחד מהם מתמודדים הנומראטי עם בעיות ומגבלות להם הם מתאימים מודלים מגוונים שלכולם מכנה משותף. בכל אחד מהמקרים, מדובר בכמות עצומה של נתונים שמתייחסת לפרט שזהותו אינה חשובה לתהליך העיבוד. הנתונים מעובדים ביחס לנתונים קודמים של אותו פרט, וביחס לנתוניהם של מאות אלפי פרטים אחרים. באופן זה ניתן לבנות מודלים סטטיסטיים חזקים לפילוח מדויק שמאפשרים לחזות תופעות והתנהגויות.

בשלהי המאה ה-20 אורח החיים היה זהה. כולם צרכו את אותם מוצרים. קראו את אותם עיתונים והתחממו מול אותה מדורת שבט. הפרסום במרחב כזה היה פשוט. כל שהיה צריך הוא לפלח את האוכלוסייה לכמה קבוצות גדולות. בעולם של שפע, עודפות, נזילות וריבוי ערוצים, משימת הפילוח נעשית מורכבת, ויש למצוא שיטות טובות יותר.

יש להתייחס לפרט ולספק לכל צרכן בדיוק את מה שהוא רוצה ואיך שהוא רוצה. כמובן שלאף חברה אין משאבים, רצון או יכולת למדוד את כלל האוכלוסיה ולבנות פרופיל לכל אחד. לכן הדרך הנוחה ביותר היא לנתח את שטף הנתונים שאנו מייצרים. לפי אחד ממרואייניו של בייקר: "התגליות הגדולות של המאה ה-21 יגיעו מאיתור דפוסים בארכיונים עצומים של נתונים".

* * *

בפרק "העובד", הפותח את הספר, משימתם של הנומראטי היא לנתח את המחשב של העובד, מולו הוא מבלה את עיקר יומו. המנהלים אמנם לא יוכלו לקרוא את המיילים של עובדיהם, אך הם יוכלו לדעת בדיוק מה הן המילים השכיחות ביותר שהם כותבים, וכמה זמן בדיוק הם עסוקים בדברים שאינם קשורים לעבודה. על סמך סטטיסטיקה של שימוש במילים ותפוקה, יעניק המחשב ציון לכל עובד, וישלח דו"ח מפורט למנהל.

אך זאת רק ההתחלה. נתונים כמו קצב הלב, לחץ דם, מוליכות העור והבעות הפנים של העובדים, יעזרו למנהלים לדעת מתי העובדים חווים תסכול או לחץ ברמה גבוהה. באמצעות מודלים מתמטיים, תוכלנה חברות להיפטר מעובדים לא יעילים ולשבט עובדים טובים, כך שהעובד יהפוך למניה.

בפרק "הלקוח", הנומראטי עובדים בשירות המשווקים שמטרתם לאסוף כמה שיותר מידע על כל צרכן. מנועי המלצות כמו זה של אמזון, שאומר לנו שאם אהבנו את האלבום הזה ודאי נאהב גם את ההוא, אינם דבר חדש. אולם הנומראטי ינתחו את הקניות שנעשה מחוץ לעולם הווירטואלי, יפלחו אותנו לשבטים קטנים, ובהתאם לכך, ידחפו לנו מוצרים נוספים הישר לתוך העגלה החכמה של הסופר.

בפרקים "המצביע" ו"הטרוריסט", מדגיש בייקר את הקושי והרגישות של עבודת הנומראטי. קל יותר למצוא קשרים בין רשימת קניות בסופר, מלבנות פרופיל פוליטי שמורכב ממשתנים רבים של אורח חיים. כאשר מדובר באיתור טרוריסטים ונוכלים, הופכת המשימה לרגישה מאוד, מכיוון שטעות בכריית הנתונים, עלולה לעלות בחיי אדם. נוסף לכך, אנשים מסוג זה, נוהגים לטשטש עקבות, ולכן איסוף הנתונים הופך מסובך.

בפרק "המטופל", דן בייקר בסוגיות חברתיות וכלכליות, שצצות בעולם המספרים. אם הנומראטי יוכלו לחזות התפרצויות של מחלות, או הסתברות לתאונות דרכים, נצטרך להתמודד עם שאלות חדשות; האם האזרחים יהיו מחויבים לדיווח אלקטרוני? האם מי שיסרב להתקין על גופו חיישנים שמודדים את מצבו הבריאותי, ייתפש כחסר אחריות? האם חברות הביטוח יתבעו דיווח אלקטרוני ויתמחרו את פוליסות הביטוח ביחס לרמת המידע שהפרט מוכן לחשוף? כל אלו שאלות חשובות שבוחנות את הקשר בין מדע וחברה.

את "המאהב" השאיר בייקר לסוף הסיפור. שם הוא מציג את המשימה היומרנית ביותר של הנומראטי: פיצוח הרגש האנושי. בפרק זה הוא בוחן אתרי היכרויות שמנסים להפוך למדע את תהליך מציאת בני הזוג באמצעות מודלים מתמטיים שמציגים את השידוך הטוב ביותר.

אתרי היכרויות חושפים את הקושי של הנומראטי, שמניחים שהאדם הוא יצור רציונלי שניתן לסווגו לקטגוריות. בפועל, הקלישאה נכונה והאדם הוא יותר מסך חלקיו. ישנם סיפורים רבים על מערכות יחסים שעל הנייר נראות מושלמות, אך במציאות אינן עובדות.

כאשר מכירים דרך אתר היכרויות, חשופים רק לקטגוריות של הצד השני ומחברים אותן בדמיון. במציאות, התכונות יכולות להסתדר באופן שונה ולטשטש אחת את השנייה. כשאנשים מתארים מערכת יחסים שנכשלה, הם לא נותנים לה ציון, אלא משתמשים במושגים כמו: כימיה, תחושת בטן, אנרגיה ותארים מיסטיים אחרים, שהמדע מנסה לדחוק החוצה כי הם לא נכנסים לשום נוסחה.

 

סטיבן בייקרסטיבן בייקר

בייקר עושה עבודה עיתונאית נהדרת. הוא משוחח עם מתמטיקאים, מדעני מחשב ומנהלים בכירים ומציג תמונת מצב רחבה ועמוקה של עולם המספרים. למרות שלפעמים הוא מנסה להפחיד את הקורא, נראה כי עמדתו ביחס לטכנולוגיה ולמדע היא אוטופית ולא פעם הוא מוקסם מהאפשרויות שעתיד המספרים צופן. הוא מביע ספקנות לאורך הספר, אך מדובר בספקנות לשם הספקנות ולא בביקורת על הפרטיות המופרטת או הנחות היסוד של אשפי המספרים.

הנומראטי משתמשים בסטטיסטיקה ולכן הם נאלצים לרמות. מחשבים לא יכולים לדעת טוב יותר מבני אדם את התשובות לשאלות שהם מחפשים, אך הם יכולים להתמודד במהירות עם כמות עצומה של נתונים. לכן הלימוד מותנה בכך שקבוצה של אנשים מאמנת את המחשב. המחשב נסמך על קטלוג ומיון שערכו בני אדם ולומד לקשר בין המילים והערכים שהוזנו לתוכו.

התהליך הזה כרוך בוויתור על מידע רב ולכן מחירה של הסטטיסטיקה הוא השגיאה. בעיה נפוצה של כורי הנתונים היא בלבול בין מתאם לסיבתיות. העובדה שהרבה אוהבי סרטים רומנטיים שוכרים רכבים, לא אומרת שאחד בהכרח מחולל את השני. המחשב יכול למיין ולהשוות, אבל הוא לא יכול להבין.

 

 

 

 

הנומראטי אינם חותרים לאמת והם מודעים לשגיאות של המערכת – מנקודת המבט שלהם, השגיאה הינה נסבלת במיוחד לאור העובדה שאין לרשותם כלים אחרים שמציגים תוצאות טובות יותר. במובן זה הם מייצגים את זרם האינסטרומנטליזם במדע, לפיו תיאוריות מדעיות הן לא יותר מכלים לניבוי תופעות והאמת היא מה שמייצגים מכשירי המדידה.

הנומראטי שואפים לשכלל את המתמטיקה שלהם כדי לחתור לתוצאות טובות יותר ולהקטין את טווח השגיאה. היומרה הזאת מעלה שאלות כמו: האם האמת תושג כשמכשירי המדידה ישתכללו? האם אפשר למדוד את האדם? האם אפשר ללכוד את המורכבות האנושית והסביבתית?

למעשה, הנומראטי היו קיימים מאז ומתמיד. כבר במאה ה-19 רווח מדע הקרניומטריה לפיו ממדי הראש הם שקבעו ערכו של האדם, בהמשך הגיעו מבחני ה-IQ למיניהם שהמשותף לכולם הוא הניסיון של כל אחד מהם לתפוש את עצמו כמדע אובייקטיבי, כשהלכה למעשה הוא מנציח אידיאולוגיה מסוימת. הדחף להפוך את האדם למספר נולד הרבה לפני המחשבים והאינטרנט, אך אלה מעצימים את היכולות ומגשימים את חזונם הרטוב של כל מי שידיו בדבר.   

הנומראטי יכולים לאסוף עלינו עוד ועוד נתונים, להצליב, לנתח, להסיק ולנבא, אבל הם לא יכולים להבין אותנו. האירוניה היא שכלל שקל יותר לעקוב אחרי הסביבה כך היא נהיית מורכבת יותר. ככל שמנסים ללמוד אותנו יותר כך יודעים עלינו פחות וככל שפותחים עוד דלתות מגלים שמסתתרות מאחוריהן דלתות נוספות.

אסיים במטאפורה יפה ששמעתי מפרופסור מנחם פיש, לפילוסופיה של המדע: אתה יכול לקחת את השפה הסינית ולמיין אותה לפי סוגים של אותיות, לחלק אותה לקבוצות ולשים בכל קבוצה את האותיות הרלוונטיות. אפשר אפילו לתת לכל קבוצה שם יפה בלטינית ולפרסם ספר עב כרס על המחקר שעשית. ואחרי כל התהליך הזה, אתה עדיין לא מבין סינית.

והרי החדשות: האח הגדול לא צריך להבין סינית.

אשפי המספרים (The Numerati). מאת סטיבן בייקר. הוצאת "מודן". מאנגלית: גיא הרלינג

 

***פורסם לראשונה במגזין "אחר" בעריכת רון מיברג.

תגובות