סגור
באנר דסקטופ כלכליסט טק
קניות ברשת קניות אונליין הונאות רשת כרטיס אשראי
נתוני האשראי שנאספים עלינו, מתנקזים כולם אל מאגר נתוני האשראי של בנק ישראל (צילום: שאטרסטוק)

נתונים בסכנה
מאגר הנתונים של בנק ישראל? גופי האשראי לא מסתפקים בו כדי לדרג את הציבור

מדובר במאגר מפוקח, כשבמקביל לו גופי האשראי מפעילים מערכות טכנולוגיות לשאיבת מידע עצום בהיקפו שעשוי להוביל לקבלת החלטה המבוססת על אפליה אסורה

הבעיה: שיטות אלטרנטיביות לאיסוף מידע עלולות להוביל לשימוש מפלה בנתונים
בחלק הראשון של סדרה זו ראינו כמה רופף ובעייתי הפיקוח על מאגרי מידע, בחלק השני ראינו שגם ההגנות הקיימות בחוק מסייעות בקושי לאזרח הפשוט, וכעת נראה מה קורה כששניהם נפגשים - כשאיסוף נתונים ממאגרים מרובים ומקורות אלטרנטיביים פוגש אי־שקיפות.
לכתבה השנייה בסדרה - לחצו כאן
לכתבה הראשונה בסדרה - לחצו כאן
נתוני האשראי שנאספים עלינו, שאנו לכאורה יכולים לעיין בהם ולתקן אותם, מתנקזים כולם אל מאגר נתוני האשראי של בנק ישראל. נתונים אלו מוזרמים בכל חודש מאז אפריל 2019 מגופים פיננסיים כמו בנקים, חברות כרטיסי האשראי או חברות אשראי חוץ־בנקאי, וגם מגופים שבהם מתקיימים הליכים משפטיים שונים בקשר לחובות שלא נפרעו כמו לשכת ההוצאה לפועל, בנק הדואר או כונס הנכסים הרשמי. הגישה למידע זה ניתנת רק לשתי לשכות אשראי שקיבלו רישיון. מדובר בחברות שבונות מודלים לדירוג אשראי על בסיס המידע והגישה שהן מקבלות, ואסור להן להשתמש בנתונים מפלים כמו מין או לאום. מנתונים אלו הלשכות מייצרות דירוג אשראי – ציון שמשקף את רמת האמינות של האשראי של הלקוח. את הדירוגים האלה חברות שמעניקות הלוואות יכולות לקנות (לבקשת לקוחות שמבקשים הלוואה), וכך הן יכולות לנהל לעצמן סיכונים ולהציע אשראי ותנאי אשראי בהתאם.
המטרה של כל האירוע המורכב הזה היא להגביר את התחרות בשוק באמצעות יצירת מסלול לשיתוף מידע פיננסי, שעד כה היה בשליטה מוחלטת של הבנקים. אלו מנגנונים שמרכיבים את מה שמכונה היום "הבנקאות הפתוחה" בישראל, שנועדה לחייב גופים פיננסיים "לפתוח" גישה למידע הקיים בידיהם על לקוחותיהם בפני צדדים שלישיים שמספקים שירותי מידע פיננסי. כך מלווים נוספים יוכלו לנהל סיכונים באופן מושכל יותר ולהציע הלוואות באופן תחרותי. אילו הסיפור היה תם כאן, זה היה פחות או יותר פנטסטי: החוק ומשטר שיתוף הנתונים כוללים מנגנונים טובים ומפורטים לצמצום אפליה, והם גם כוללים מנגנונים ברורים לתיקון מידע מהותי. כך שאם צ'ק חזר או נוצר פיגור בתשלום מסיבות שניתן ליישבן, כל אדם יכול להתוודע למידע, לתקן אותו ולשפר את דירוג האשראי שלו.

1 צפייה בגלריה
איור הייטק גופי האשראי
איור הייטק גופי האשראי
(איור: יונתן פופר)
אך נותני האשראי לא מסתפקים במידע מנוהל ומווסת זה, אלא מפעילים מערכות טכנולוגיות לאיסוף מידע אלטרנטיבי נוסף, אחר כך הם מעבדים את המידע ומשלבים אותו במודלים שהם בונים לניהול הסיכונים. על פניו אפשר להבין אותם, מערכות של ביטוח, אשראי ובנקאות עסוקות במלאכת איסוף נתונים מקדמת דנא. למעשה תעשיות אלו היו בחזית ההשקעות, הפיתוח והשימוש במערכות מידע גדולות הרבה לפני העידן נוכחי של שרתי נתונים ומחשוב ענן.
כבר בראשית המאה ה־20 חברות אלו יצרו מערכות סיכונים גדולות ופרטניות, הקימו "חטיבות אינדקס" כדי לתעד, לאחסן ולסווג מידע מפורט על הלקוחות שלהם. חברות ביטוח ממש קטלגו הערכות רפואיות ודו"חות תאונות במטרה להתכונן ל"מהפכה בלתי צפויה" מבוססת על שיטות חדשות "להתאמה אישית של הערכות סיכונים".
המידע האלטרנטיבי שהחברות הפיננסיות אוספות הוא עצום, לא רק בהיקפו אלא גם במגוון שלו, החל מדיבור ברשתות החברתיות, עבור בהשכלה וכלה במיקוד של כתובת המגורים. "אם, למשל, אני מפרסמת בפייסבוק שוב ושוב את הנסיעות המרובות שלי לאיים המלדיביים ומצרפת תמונות של המלון היוקרתי מכולם, אפשר להתוודע לכאורה ליכולות הפיננסיות שלי", מסבירה פרופ' רות פלאטו־שנער, ראש המרכז לדיני בנקאות ורגולציה פיננסית במכללה האקדמית נתניה, שכתבה יחד עם מעיין פרל מאמרים בנושא חיתום האשראי האלגוריתמי בישראל. "ברגע שמלווים מתבססים לא רק על המידע המפוקח של חברות האשראי, אלא שואבים עוד המון מידע, אנחנו כבר לא שולטים על החשש מאפליה. נכון שפורמלית לכאורה לא מתחשבים בתחשיבים אסורים, וגם כשאוספים מידע אלטרנטיבי לא מכניסים קריטריונים נפיצים כמו גזע, צבע או מין. מאוד נזהרים פורמלית, אך למרות זאת עלולה להיגרם אפליה עקיפה בגלל שיטות איסוף וניתוח המידע”.
השיטה: מאגרי המידע האלטרנטיביים שואבים נתונים שחשופים לציבור כמו מיקוד
בעוד המקורות הפורמליים ידועים וממוסדים, והאזרח יכול לעיין בנתונים על אודותיו ולתקנם, המקורות האלטרנטיביים לאיסוף נתונים אינם חשופים לאותם מנגנוני פיקוח ובקרה. על בסיס מקורות מידע אלו המלווים מפתחים מודלים חדשים שפיתחו או רכשו, ובאמצעות מודל פרטי זה הם מבצעים את החיתום, מחליטים לגביו ומתמחרים ריבית. הקשר בין מידע אלטרנטיבי לאפליה, גם אם לא מכוונת, יכול להגיע בכמה אופנים. "כשאת מקבלת הודעת טקסט עם הצעה להלוואה של 100 אלף שקל, באמת הם יכולים לתת לך אותה בתוך דקות ספורות. אבל בין לבין שואלים אותך, למשל, איפה למדת וכמה שנות לימוד יש לך. אומנם זו נראית על פניו שאלה לגיטימית שמעידה על כושר ההשתכרות, אבל בסופו של דבר המנגנונים הללו עלולים לגרום לאפליה תוצאתית", אומרת פרופ' פלאטו־שנער.


דוגמה קלאסית לנתון שעלול להוביל לאפליה היא מיקוד כתובת המגורים. מיקוד נחשב היום לאחד הכלים המוכרים למה שמכונה "אפליה באמצעות פרוקסי", שזה אפליה באמצעות מתווך. אולי חברת החיתום לא משתמשת באופן ישיר בנתון אסור, כמו לאום (יהודי או ערבי), אבל אם מבקשים להזין מיקוד, ניתן לזהות בקלות יחסית מאפיינים שונים של אוכלוסיות. מיקוד נמצא בקורלציה חזקה לגורמים רבים כמו גזע, מוצא ודת, וכך באמצעותו המערכת מקבלת בעקיפין החלטות על בסיס נתונים מפלים. מחשב פשוט יודע לזהות אם המיקוד הוא, למשל, של רהט או כפר שמריהו, ולהעריך סיכון באופן אחר על בסיס נתון זה.
מחקרים רבים בשנים האחרונות מצאו כי גורמים כמו מיקוד ואפילו סוג המחשב שממנו אתה גולש משנים מהותית מחירים שמוצעים למשתמשים ואת ההטבות שאזרחים קיבלו ממערכות הרווחה המקומיות. בלואיזיאנה בארצות הברית נמצא כי בוצעה אפליה שיטתית על בסיס מיקוד האזרחים אחרי שהושקה מערכת תומכת וממיינת לבחינת בקשות לסיוע ברווחה; והמערכות הממוחשבות של אחד ממוסדות ההכנה לאוניברסיטה הגדולים בארצות הברית, The Princeton Review, הציע מחירים שונים לקורסים רק על בסיס המיקוד שהזינו מתעניינים. בשני המקרים ציינו כי ההבדלים לא מכוונים ואין שום כוונה לאפליה מצדם, אך זו בדיוק היתה הבעיה: אפליה המונית התרחשה ממש בלי כוונה. "בדומה, מידע על המוסד להשכלה גבוהה שבו למד הלקוח", כותבות פלאטו־שנער ופרל באחד ממאמריהן, “עשוי לשעתק אפליה על בסיס גזע, אם מבחינה היסטורית מדובר במוסד להשכלה גבוהה שנהגו ללמוד בו בני מיעוטים”.
במחקר שביצע בנק ישראל ב־2019 כבר היו נוכחים סימנים של אפליה מבוססת מיקוד. באותו מחקר בחנו בבנק 88,914 משכנתאות שהועמדו למשקי בית בישראל בין 2010 ל־2013, ומצאו שתושבי הפריפריה משלמים ריבית גבוהה משמעותית על הלוואות משכנתא לעומת תושבי מרכז הארץ. הפער גדל ככל שהשכונות בפריפריה מוחלשות מול שכונות מבוססת במרכז. בשונה מהאינטואיציה, הסיבה לריבית הגבוהה לא נבעה בהכרח מנתונים על המלווים. אם נותני ההלוואות ישתמשו במודל חיתום, אנו עלולים לקבל אפליה על בסיס מקום מגורים.
יש נתונים מתוחכמים הרבה יותר מהמיקוד, שבאמת הפך לנער הפוסטר של "נתונים שמתווכים אפליה". כך, למשל, פעילות בשוק ההון. פעילותן של נשים בשוק ההון היא נמוכה משמעותית מזו של גברים. יש לכך סיבות היסטוריות חברתיות מוצקות, אך שלא מעידות באופן מהימן על גודל או סוג הסיכון שלהן כלוות. לכן אם במסגרת החיתום מבקש ההלוואה נשאל אם יש לו פיקדון ניירות ערך, נוצרת פגיעה לא מכוונת כלפי נשים שאינן פעילות בשוק ההון. "אם היינו הולכים רק על מה שמותר ואסור והשיטות הישנות", מוסיפה פלאטו־שנער, "דברים היו טובים וייתכן שאפליה היתה נמנעת. אם היו משתמשים אך ורק בדירוגי האשראי".
אבל כאמור לא כך הדבר. חברות שמנסות להציע כמה שיותר הלוואות לציבור, עושות כל שהן יכולות כדי להשיג כמה שיותר נקודות מידע. המתוחכמות יותר אוספות מכל הבא ליד. "החברות כל הזמן סורקות את כולנו, אלו מערכות שמסוגלות לאסוף מידע בכמויות אדירות, ואנחנו אפילו לא יודעים מה הפרמטרים או ההוראות של החיפוש", אומרת פלאטו־שנער. אומנם יש מלווים קטנים שאין להם כסף לבנות לעצמם מערכי חיתום או לשלם למישהו שיבנה להם כלים מתוחכמים יותר להערכות סיכונים ולכן הם קונים את הדירוגים ורק על זה מתבססים, אך ככל שהחברות גדולות יותר, ומעניקות יותר הלוואות, כך גם גדל אצלן הסיכוי לאפליה. "אנחנו מתחילים לאבד את השליטה ועולה החשש גם לאפליה וגם לפגיעה בפרטיות אצל מלווים שמשתמשים בדירוג אשראי מהלשכות בצורה מינימלית, כשעיקר החיתום שלהם נעשה על בסיס ביג דאטה ואיסוף וניתוח באמצעות כלים מתקדמים של בינה מלאכותית", אומרת פלאטו־שנער.
באפריל נכנס מדד נוסף חדש למאגר נתוני האשראי – חשבון החשמל. בארצות הברית, שם שיטת דירוגי האשראי מופרטת לחלוטין, כל דבר משמש כלי לקבוע את דירוג האשראי וצרכנים נוהגים למסור בלית ברירה מידע מפורט במיוחד על התנהגותם אם הם רוצים הלוואה או אפילו לפתוח חשבון בנק או להזמין כרטיס אשראי. התאווה לנתונים היא כה גדולה שהמדינה הפכה ידועה לשמצה, ודוחקת בתושביה להשתתף במרוץ עכברים של יצירת נקודות מידע מרובות. אנשים נדחקים להזמין ולנהל כמה חשבונות בנק וכרטיסי אשראי במגבלות שונות, רק כדי להוכיח שהם מסוגלים להשתמש בהם בעקביות, ביעילות ולא לפגר אחרי תשלומי האשראי, שזה אחד המדדים המבטיחים ביותר להצטייר כלקוח בעל אחריות פיננסית גבוהה וכלי מוצהר להעלאת דירוג אשראי פרטני.
בישראל כדי להעשיר את הנתונים הסתפקו בינתיים בתוספת חיצונית אחת – היסטוריית תשלומי חשבונות החשמל. האם זה טוב או רע, ומה המשמעות של זה עבור התושבים? "מצד אחד, כשמשתמשים בנתונים אלטרנטיביים זה עלול להגדיל את החשש לאפליה", אומרת פלאטו־שנער. "מצד שני, יש מחקרים שמראים שכשמשתמשים במידע אלטרנטיבי כמו חשבון חשמל או מים, זה יכול לעזור לאוכלוסיות מסוימות, אלו שהן Credit Invisible. אלו אנשים שאין להם היסטוריית אשראי, למשל צעירים או סטודנטים שצריכים הלוואה ללימודים, אבל אין להם היסטוריית אשראי, ואז רואים בהם לקוחות מסוכנים רק כי אין להם היסטוריה. אז או שלא נותנים להם אשראי או שמתמחרים אותו בריבית גבוהה. מחקרים מראים כי התבססות על מידע אלטרנטיבי כמו חשבונות אלו מאפשרת לבנות תמונה פיננסית טובה יותר לאדם. לכן במצבים רבים דווקא הרחבת השימוש בכמה שיותר נתונים בסופו של דבר גורמת למה שנקרא הכלה פיננסית".
עבור פלאטו־שנער ופרל תוספת מידע זו היא מבורכת כל עוד הכל נעשה במסגרת משטר הדירוג שהמדינה ניסתה לבסס. הבעיה היא כאמור בנותני האשראי שלא מסתפקים במאגרים הקיימים. "אם אני חושבת שבמאגר נתוני האשראי יש טעות, קיימים מנגנונים שלמים לפנות אליהם. אבל מה קורה כשמשתמשים במידע אלטרנטיבי? המערכות לוקחות המון מידע, מנתחות ומעבדות, ואנחנו לא יודעים איך. אין שום חוק שנותן הגנה. ככל שהמודלים מתוחכמים יותר, גם אם לקוח מתעניין ומבין ושואל, נותן האשראי לא תמיד יכול לספק את התשובה איך נוצר הדירוג".
חוסר היכולת להסביר מודלים אלגוריתמיים לדירוגי אשראי גובר ככל שהם הופכים יותר ויותר מתוחכמים. ככל שהם כוללים יותר ויותר נתונים ממגוון רב יותר של מקורות, כך התוצאה שמתקבלת אטומה יותר. "את יכולה לקבל תוצאת דירוג ולהגיד 'זה נמוך מאוד, איך קיבלתי תוצאה כזו?' והם לא יכולים להסביר, לפעמים אפילו לא יכולים להצביע על הנתונים הספציפיים שהשפיעו על הדירוג", אומרת פלאטו־שנער.
מה אפשר לעשות: יש לחייב את נותני ההלוואות להסביר ללקוח איך נוצר דירוג האשראי שלו
"אנו מציעות שני דברים", אומרת פלאטו־שנער. "ראשית, יש לקבוע שלא ניתן לעשות חיתום אשראי בלי יכולת לתת הסבר ללקוח איך נוצר הדירוג. צריכה להיות מידה כלשהי של יכולת הסבר איך המערכת עובדת, משהו ברמה בסיסית שלא תפגע בסודות העסקיים של נותן האשראי, אבל תגלה ללקוח מה היו הנתונים העיקריים שהשפיעו על ההחלטה בעניינו.
"דבר שני הוא דרישה למעורבות אנושית. אני רוצה שתהיה מעורבות אנושית בשלב תיקוף המודל וגם בקרה אנושית, אפילו מדגמית. למשל אחת לכמה זמן לעשות בדיקה מדגמית של חיתום אוטומטי, ואז לתת לפקיד בנק לעשות את אותו החיתוך ולראות אם יש או אין פער גדול בין הדברים, ובעיקר אם אין פער גדול לרעת הלקוח".