שוברת קודים
לבלבל את האלגוריתם - ולהחזיר את השליטה על המידע למשתמשים
מחקר חדש קורא למשתמשים להערים על יכולות איסוף הנתונים של חברות הטכנולוגיה באמצעות הזנה מכוונת של מידע שגוי. אם מספיק גולשים ירתמו למשימה, האינטרנט כפי שאנו מכירים אותו עשוי להשתנות מהותית
פיד הפייסבוק שלי גדוש לאחרונה במודעות לפריט אחד - מצעים. אני לא מחפשת מצעים, אבל לפני כמה חודשים החלטתי לנסות לשכנע את האלגוריתם של פייסבוק שסט ציפות הוא משאת נפשי. מאמץ קטן שיסתיר מהרשת החברתית את מה שמעניין אותי באמת. פתחתי מודעות, גלשתי לעמודים של אתרי מוצרים לבית ומדי פעם קראתי תגובות למודעת פרסומת למצעי במבוק. לא ידעתי שמה שאני עושה מכונה “Data Poisoning”, שיטה ידועה בעולמות הסייבר ההגנתי, אך כזו שכמעט ולא זוכה לתשומת לב ככלי להעצמת משתמשים פרטיים נגד מאמצי איסוף הנתונים של ענקיות הטכנולוגיה. לפחות עד כה.
- אחרי אוסטרליה ואירופה: ארה"ב רוצה שפייסבוק וגוגל ישלמו לעיתונים על שימוש בתוכן
- למה פייסבוק חושבת שאיננה צריכה להיפרד מהשליטה באינסטגרם ובווטסאפ?
- פייסבוק מבקשת מביהמ"ש לדחות על הסף את תביעת ההגבלים בארה"ב
מחקר של אוניברסיטת נורת’ווסטרן שפורסם בשבוע שעב מדגים כיצד שימוש בשיטה שהחוקרים מכנים “מינוף נתונים” יכול לשנות את מאזן הכוחות בין הציבור לחברות הטכנולוגיה. שימוש בנתונים כמעין קלף מיקוח מול חברות הטכנולוגיה עשוי לייצר הזדמנויות חדשות “לשנות את התנהגות חברות הטכנולוגיה הקשורה לפרטיות, אי־שוויון כלכלי, פיקוח על תכנים ותחומים אחרים שמעסיקים את החברה ככלל”.
1. התוכן הוא רק תירוץ
פעם מי שחיפשו להתעשר חיפשו זהב, אחר כך הם ניסו לאתר בארות נפט והיום הם מתמחים בכריית נתונים. “התוכן הוא המלך”, היטיב לחזות ביל גייטס אי שם בשנות התשעים כששימש מנכ”ל מיקרוסופט. אבל המילה תוכן מרמזת על ערך שנובע מהעברת ידע, מידע או רעיונות, ועבור ענקיות האינטרנט התוכן הוא לא יותר מכלי שבעזרתו נאספים נתונים ומהנתונים הן מפיקות כמובן מידע ותובנות על המשתמשים הנמכרים ברווח עצום.
המילה תוכן היא ביטוי מכובס ומולבן שנועד להתל במשתמשים ולשוות לפעילות שלהם ברשת ארשת של איכות. אבל האמת המדכדכת היא שלאיכות התוכן שמשתמשים מייצרים על הפלטפורמות הדיגיטליות השונות אין שום השפעה על תפקוד החברות הללו או על שורת הרווח שלהן. לא משנה עד כמה מלהיט יצרים, מבזה, שקרי או מדכא התוכן על הפלטפורמה, מה שחשוב הוא עצם יצירת התוכן, והרבה ממנו ככל הניתן. לכן הרשתות החברתיות מדרבנות אותנו לייצר כמה שיותר נתונים ונמנעו לאורך השנים מפיקוח על תכני משתמשים.
היום ברור כבר שלעידוד המשתמשים ליצור עוד ועוד נתונים תוך כדי מעקב בלתי פוסק של חברות האינטרנט אחריהם היה אפקט הרסני על החברה האנושית. התוצאה כוללת, בין היתר, משבר אמון חמור שמקשה על המשתמש הממוצע להבחין בין אמת לשקר, בין חדשות עיתונאיות לחדשות מזויפות ובין מדע לתיאוריות קונספירציה. בנוסף, חברות הטכנולוגיה גורפות רווחי ענק ומייצרות עבור קומץ אנשים יותר עושר מבכל תקופה אחרת בהיסטוריה.
2. מכונות לייצור נתונים
מערכת היחסים החד־צדדית בין המשתמשים לענקיות האינטרנט קיימת שנים מעטות, אבל כבר התבססה בתודעה כמצב קיים ובלתי ניתן לשינוי. התפיסה הפופולרית גורסת שהדרך היחידה לקטוע את שרשרת הניצול היא לחדול מלהשתמש בכלים הדיגיטליים שפוגעים בפרטיות, מה שמכונה “שביתת נתונים”. המטרה היא לעצור או להאט את הפקת הנתונים באמצעים כמו מחיקת פרופיל הפייסבוק, העמדת מכשולים בדמות חוסמי פרסומות או שימוש בדפדפני רשת שמונעים מעקב כמו Duck Duck Go.
אבל זו פעולה קיצונית במציאות הנוכחית, מעשה של התנתקות ובידוד שהוא בלתי אפשרי עבור אחדים או כרוך במחיר משמעותי עבור אחרים. מדי פעם צצות כתבות בסגנון “ניסיתי להתנתק מגוגל לשבוע” או “מחקתי את כל הפרופילים שלי ברשתות החברתיות”, שמתארות תמיד כאבי גמילה וקושי אמיתי לשמור על קשר ולתקשר או להתעדכן בחדשות.
כעת החוקרים מנורת’ווסטרן מזכירים שמערכת היחסים הזו אינה דטרמיניסטית כפי שהתרגלנו לחשוב. למשתמשים, הם טוענים, יש כוח לא מבוטל לשנות את הדינמיקה הזו משום שהיא נשענת כולה על גורם אחד שאינו נמצא בשליטת חברות הטכנולוגיה - המשתמשים עצמם, וכל האלגוריתמים המפוארים לא שווים דבר בלי ההתמסרות שלהם.
הרעלת נתונים, מסבירים החוקרים, מאפשרת למשתמשים לקחת חלק אקטיבי באימון האלגוריתמים של החברות והיא הרסנית לכל טכנולוגיה שתלויה בנתונים כדי לפעול. ניתן, בין היתר, להזין את אלקסה במלמול בלתי פוסק שלא מעיד דבר על אישיותך, לבחור לנגן ביוטיוב רשימת צפייה רנדומלית לגמרי אך להשתיק את הנגן או לתת לחבר לגלוש בטוויטר תחת שם המשתמש שלך. הזנת נתונים רנדומליים למערכת למידת מכונה מחלישה את הביצועים של התוכנה מכיוון שהיא מסיקה מסקנות על סמך נתונים שאינם משקפים התנהגות אותנטית.
אם משתמשים יצליחו להרעיל את המידע ברמה משמעותית מספיק כדי לפגוע באימון האלגוריתם, החברות יתקשו להבטיח למפרסמים חשיפה מדויקת לקהלים נבחרים והיתרון התחרותי שלהן יצטמצם משמעותית. בהתאם, כשאיכות המוצר נפגעת גם המחיר שניתן לגבות עליו יורד, מה שאולי ידחוף חברות לחפש פתרונות יצירתיים חדשים להשיג את תשומת לב המשתמשים. וזה בסופו של דבר מה שהרעלת נתונים מבקשת לעשות - להפחית את רווחי חברות טכנולוגיה, כדי שאלו יהיו חייבות לשנות את ההתנהגות שלהן.
3. להערים על המכונה
משתמשים רבים אכן נוקטים בשיטה של הרעלת נתונים, אך ההיקף אינו גדול מספיק על מנת להונות את האלגוריתם. כדי לשנות את הגישה של חברות הטכנולוגיה דרושה פעילות מאורגנת ומתאומת, אקטיביזם נתונים. ממש כפי שגורמים בעלי עניין והון מנסים לעוות את השיח ברשתות החברתיות באמצעות בוטים שמייצרים מצג שווא של תעבורת אינטרנט או עניין סביב נושאים מסוים.
מחקרים מעריכים כי כל עוד הרעלת הנתונים נעשית בצורה מתוחכמת, פחות מאחוז בודד מספיק כדי לשנות את הביצועים של מערך נתונים מסוים. גם הרעלות לא מתוחכמות הנעשות בהיקף גדול מספיק יכולות לשבש את הטכנולוגיות שנשענות עליהם. יש שמעריכים שכלים כמו AdNauseam, תוסף שמסיע למשתמש להרעיל את נתוניו האישיים בכך שהוא מקליק על כל מודעה, היה חלק מהסיבה שגוגל עצמה החליטה לאחרונה לנטוש את המעקב ההמוני שלה אחרי גולשים ולשנות את הדרך בה היא מתאימה להם פרסומות.
אם כך הדבר, ההחלטה של גוגל היא איתות מבשר טובות עבור המשתמשים. היא מאששת את ההנחה שהרעלת באר הנתונים המזוהמת יכולה להשיב למשתמשים חלק מהכוח, במטרה לדחוק את החברות להכיר בכך שטכנולוגיה לא מייצרת אמון בין בני אדם ולא מסייעת להם לרכוש כלים לקבלת החלטות מושכלות. הנחת היסוד החדשה של אותן ענקיות צריכה להיות שעידן המידע הפך זה מכבר לעידן הספק.