$
חדשות טכנולוגיה

מחקר: חישוב מחירי נסיעות בתחבורה שיתופית מושפע מצבע עור ומוצא אתני

ממצאי המחקר של אוניברסיטת ג'ורג' וושינגטון, מחזקים את הסברה שאלגוריתמים, בעיקר מבוססי בינה מלאכותית, סובלים מהטיה מובנית בגלל מוצא המפתחים שלהם

רפאל קאהאן 15:3315.06.20

מחקר של אוניברסיטת ג'ורג' וושינגטון ושפורסם בשבוע שעבר, מצא שונות גדולה בחישוב מחירי הנסיעות בשירותיהן של אובר, ליפט ו-Via בהתאם למוצא האתני או לצבע העור של המזמין.

 

על פי דיווח של אתר VentureBeat, במחקר נמצא גם שהסיכוי שהנהג יבטל את הנסיעה גבוה פי 3 עבור נוסע בעל שם אופייני לאוכלוסייה שחורה מאשר למזמין נסיעה בעל שם "לבן".

 

הנתונים עליו התבסס המחקר נאספו בשיקגו בלבד, אך החוקרים, פרופ' איילין קליסקאן והדוקטורנט אקשאת פנדיי, העריכו שאלה יחזרו על עצמם במקומות אחרים.

 

נתוני הנסיעות נאספו דרך משרד הסטטיסטיקה האמריקאי למחקרי קהילה (ACS) ומתבסס על עשרות מיליוני נסיעות. הנתונים מתחשבים במוצא אתני, גיל, מחיר הנדל''ן באזורי ההזמנות ורמת החינוך.

 

המחקר לא טוען שהאפליה המובנית בחישובים מבוצעת באופן יזום או כחלק ממדיניות מפלה. עם זאת הממצאים מחזקים מה שהיה ידוע כבר מזמן וזה שאלגוריתמים, בעיקר מבוססי בינה מלאכותית, סובלים מהטיה מובנית בגלל מוצא המפתחים שלהם.

 

 

אובר אובר צילום: איי פי

 

 הטיה מובנית בגלל מוצא

 

כך למשל מודל תמחור לקורסי הכנה לקבלה לקולג' העלה את המחיר הנדרש לאוכלוסייה ממוצא אסייתי הוא עד פי 3 ביחס לאוכלוסייה לבנה וזאת ללא קשר לרמת ההכנסה. מחקר אחר מצא שמערכות זיהוי דיבור של אפל, אמזון, גוגל, IBM ומיקרוסופט נוטות לזהות פחות טוב משפטים או שיח של דוברים ממוצא שחור מאשר כאלה של דוברים ממוצא לבן.

 

יתרה מכך, מחקר מאשתקד של מכון התקנים והטכנולוגיה הפדרלי מצא שאלגוריתמים לזיהוי פנים נכשלו בזיהוי של פנים אסייתיות או שחורות בין פי 10 לפי 100 לעומת זיהוי פנים של אדם לבן.

 

ההטיה חוזרת על עצמה גם בהקשרי מגדר או באלגוריתמים במסחר מקוון שמציעים מוצרים למשתמשים באתרים כגון אמזון או איביי. נמצא שההטיה אף חוזרת על עצמה אצל נהגי שירותי התחבורה הציבורית שבהינתן עומס עבודה דומה ירוויחו בהיקפים שונים בהתאם לאזורי הפעילות שלהם.

 

"לא לבלבל בין מתאם לסיבתיות"

  

אובר וליפט התייחסו לממצאים של המחקר וטענו שהחוקרים לא התייחסו לנתונים נוספים כמו למשל זמני הנסיעות שנבדקו, מתי הנוסעים הזמינו את הנסיעה מטרת הנסיעה או מבנה השכונות או האיזורים מהם הוזמנו הנסיעות. חשוב לציין שהחברות לא דחו לחלוטין את הממצאים אך ביקשו להעמיק את המחקר תוך התחשבות בסעיפים נוספים שלדבריהן גם נלקחים בחשבון בחישוב מחירי הנסיעות. "חשוב לא לבלבל בין מתאם לסיבתיות", נמסר מאובר.

 

 

 מונית שירות של Via בניו יורק מונית שירות של Via בניו יורק צילום: Via

 

"כאשר משתמשים בנתונים חברתיים במסגרת של למידת מכונה, האלגוריתמים לומדים את ההטיות המובנות שמקורן באפליה היסטורית והטיה חברתית שמובנית בנתונים", הסבירו החוקרים. הסיבה לבחירת שיקגו כמיקום של המחקר נובעת לדבריהם מכך שהעיר העבירה לאחרונה חוק שדורש שיקוף של מחיר הנסיעה מראש. המידע שנאסף בשיקגו כולל כ-100 מיליון נסיעות שבוצעו בעיר בין 2018 ו-2019 וגם בהשוואה לכ-19 מיליון נסיעות במוניות.

 

לאחר סינון של הנתונים שאינם מלאים, נמצא שבשיקגו בה פועלות אובר, ליפט ו-Via (הראשונה עם נתח שוק של 72%, השנייה עם 27% והשלישית כ-1%) החוקרים מצאו שהמחירים זינקו במקרים מסוימים. למשל אצל בני יותר מ-40, בוגרי תיכון ומטה ובמיקומים בהם מחירי הנדל''ן היו נמוכים יותר מהנתון החציוני. כמו כן נמצא שהמחירים נטו להיות גבוהים יותר גם כאשר נקודת ההורדה נמצאת בשכונות בעלות אחוז גבוה של אוכלוסיה לא לבנה.

 

עם זאת חשוב לציין שלא מדובר בגזענות מובנית אלא כנראה גם בחישוב שמתבצע בהתאם למרחק הנסיעה (שכונות עניות יותר רחוקות יותר ממרכזי הערים), אופי הנסיעה וסיכוי למצוא נסיעה נוספת באיזור.

 

יודגש,  שהאלגוריתמים לחישובי מחירי הנסיעות מבוססים על קוד קנייני פרטי וקשה לחוקרים מבחוץ לקבל גישה אליהם ולדרך בה מבוצעים חישובי המחירים. עם זאת מחירים גבוהים ירחיקו אוכלוסיות חלשות יותר משימוש בשירותי תחבורה שיתופית ביחס לאוכלוסייה מבוססת שנוטה בדרך כלל להיות בעלת אחוז גבוה יותר של לבנים.

 

x