שוברת קודיםהאם בינה מלאכותית יכולה לזהות רגשות לפי הבעות פנים?
שוברת קודים
האם בינה מלאכותית יכולה לזהות רגשות לפי הבעות פנים?
רשות הסחר הפדרלית בארה"ב שמה על הכווונת חברות בינה מלאכותית שמבטיחות יותר ממה שהן יכולות לקיים. אחת ההבטחות הללו היא אלגוריתם שמתיימר להצליח היכן שהמדע נכשל: לזהות רגשות על פי הבעות פנים
באחרונה פרסמה רשות הסחר הפדרלית (FTC) אזהרה יוצאת דופן לחברות טכנולוגיה שפועלות בתחום הבינה המלאכותית. בהודעה הובהר כי FTC עלולה להתעניין בחברות שמבטיחות יותר ממה שהן יכולות לקיים, ובכך רומזת להייפ שנוצר סביב התחום בחודשים האחרונים ביתר שאת. הרשות יודעת היטב כי הרגע שבו התחום משגשג באופן יוצא דופן, במיוחד תודעתית, הוא גם המאתגר ביותר רגולטורית – העת שבה רעיונות הופכים בלי מאמץ לעובדות, אחר כך למציאות ולבסוף לעתיד בלתי נמנע.
"במשך דורות סיפרנו לעצמנו סיפורים, תוך שימוש בנושאים של קסם ומדע, על דברים דוממים שאנו מביאים לחיים או סופגים כוח מעבר ליכולת האנושית", כותבים ב־FTC. "מה הפלא שאנו מקבלים את מה שאומרים לנו משווקים על כלים ומכשירים חדשים שמשקפים כביכול את היכולות והיתרונות של בינה מלאכותית?".
אחת ההבטחות שתופסות תאוצה היא "ניתוח רגשות", כאילו אלגוריתם מאומן היטב יכול לזהות "רגשות אוניברסליים" לפי הבעות פנים. כך, למשל, החברה הישראלית אוסטו, ששמה היה פעם AnyVision, שהסבה את תשומת לבי, שביחד עם חוקרים מאוניברסיטת קרנגי מלון היא מתחילה במחקר שנועד להכות את השוק באמצעות הישענות על שינויים במצב הרוח של הסוחרים. המחקר, שיתחיל ברבעון השלישי של השנה, יכלול 70 סוחרים בחברות השקעות אמריקאיות שמצלמות יתעדו את פניהם, שפת הגוף והמרחב הכללי שלהם, כדי לזהות מגמות ולסייע למסחר.
למעשה, כבר היום ישנם מוצרים בשוק שמתיימרים לפענח רגשות באמצעות מודלים של בינה מלאכותית. לאורך השנים מיקרוסופט, אינטל אמזון וגוגל, אם למנות רק את הגדולות, פיתחו כלים דומים לניתוח הבעות פנים של צרכנים, תלמידים, מושאי חקירה, אנשים שעוברים בביקורות גבולות ומרואיינים לעבודה, כדי להעניק לבוחנים את האנשים האלו תובנות מעמיקות, חיצוניות ולכאורה אובייקטיביות על מצבם הנפשי של הנצפים.
אך האם באמת מכונות יכולות לזהות רגשות? מה זה בכלל רגש והאם כולנו מביעים את מצבנו הרגשי באופן דומה, אוניברסלי, אפשרי לתצפית מבוסס מערכי נתונים גדולים? האם תופתעו לדעת שהתשובות לכל שאלות אלו הן – אולי, אך סביר להניח שלא?
קיימת הנחה בסיסית משותפת שאנחנו יכולים "לקרוא פרצופים", ומסוגלים לזהות ולפרש באופן אינטואיטיבי ומדויק מגוון ושילוב של תנועות פנים, התכווצויות שרירים, היווצרותם של קמטי הבעה והתרחבות אישונים כרגשות. את ההנחה הזו מגלגלים בשנים האחרונות אל עבר פיתוחן של מערכות ל"זיהוי רגשות". הרעיון מאחורי מערכות אלו הוא שניתן למדוד, לכמת ולזהות במדויק רגשות של אדם על ידי ניתוח צילומי פנים בזמן אמת.
כל מי שניהל מערכת יחסים כזו או אחרת, יודע שהרעיון שהבעות פנים הן מעין קוד יציב ניתן לקריאה מדויקת הוא הדרך הבטוחה לריב. עם זאת, כבר מעל מאה שנים שמתבססת המשגה כאילו מדעית כי ניתן לפענח במדויק רגשות. תחילה עיקר הניתוח התבסס על מבנה הגולגולת והיחסים בין העצמות השונות (מה שמכונה פיזיונומיה והבסיס לתיאוריות הגזע).
מאוחר יותר פיתח את השיח צ'ארלס דרווין וטען ששרירים, נימים ובלוטות שמופעלים באופן רפלקסיבי בעקבות גירויים ספציפיים מבטאים באופן אובייקטיבי רגשות. דרווין טען, ברוח עבודתו על ההתפתחות האבולוציונית, כי התגובות הפיזיולוגיות הללו הן אבולוציוניות ושהבעות הפנים הן תכונה מולדת שאפשר לזהות, למדוד ולנתח. באותו הזמן החל הנוירולוג הצרפתי גיום בנז'מן אמנד דושן את עבודתו המפורסמת ביותר, ובאמצעות חשמול פניהם של חולים במוסדות נפש ביסס תיאוריה של מצבים פנימיים אוניברסליים. דושון צילם את מטופליו בזמן שגירה את שרירי הפנים באופן מלאכותי, והפיק סדרת תמונות קנונית וחלוצית לרעיון שניתן לבודד הבעת פנים שמבטאת רגש ספציפי כאובייקט קריא.
בשנות השישים והשבעים המשיך את רעיונות אלו פול אקמן, שהגה מערכת קידוד (FACS) להבעות פנים שכללה 40 פעולות של התכווצות שרירים. אקמן טען שכל בני האדם מציגים מספר קטן של רגשות אוניברסליים שהם קטגוריים, מולדים, חוצי תרבות ואחידים, וניתן לזהות שישה "רגשות בסיסיים" שקשורים להבעות פנים אוניברסליות: אושר, עצב, גועל, פחד, כעס והפתעה. כלומר לא רק שניתן לזהות מה אדם מרגיש, אלא לעתים גם ממש להגיד לו מה הוא מרגיש כי האמת האובייקטיבית הזו "כתובה לו על כל הפרצוף". אף ש־FACS לא התייחסה להקשר אינדיבידואלי, חברתי ותרבותי, ואף שזו תיאוריה אחת בחקר הרגש ושלגביה עשרות שנים של מחלוקות מדעיות, היא הפכה שולטת במגזר הטכנולוגיה.
מכאן הדרך של מדעני הבינה המלאכותית הייתה קצרה. באמצעות בסיס רעיוני זה הם החלו במשך השנים להזין את המודלים שלהם בעוד ועוד תמונות ופרצופים, חלקם מבוימים וחלקם ספונטניים, ללמד את המערכות לזהות רגשות על בסיס התפתחות רעיונית זו. חברות טכנולוגיה פיתחו ופרסו כלים שמתיימרים לזהות רגשות "אובייקטיביים" בשדות תעופה, ראיונות עבודה, עבור חברות ביטוח כדי לנסות לאתר הונאות, וכעת למסחר בשוק ההון.
אבל מה עם המדע? הוא כאמור אינו שם. תחום חקר הרגשות עצמו חסר הרבה מאוד קונצנזוס לגבי שאלות שחברות הטכנולוגיה לוקחות כמובן מאליו, למשל מהם רגשות, איך הם באים לידי ביטוי, מה היחס שלהם לגירויים או התפקוד הנוירוביולוגי שלהם. סקירה של המחקרים בנושא על ידי מדענית המוח ליסה פלדמן־בארט מ־2019 מצאה שאין כל ראיה מהימנה לכך שניתן לחזות במצבו הרגשי של אדם באופן מדויק. "לא ניתן להסיק בביטחון אושר מחיוך, כעס מפנים זועפות או עצב מפנים קודרות", כתבה, "כפי שחלק ניכר מהטכנולוגיה הנוכחית מנסה לעשות כשמיישמים את מה שבטעות מאמינים שהם העובדות המדעיות".
למעשה, מחקר רב וסותר מצא כי הבעות פנים משתנות מבחינה תרבותית וחברתית, זאת אומרת שאין "רגש טהור" או אוניברסלי שניתן לזהות באופן אובייקטיבי. אקמן עצמו התנגד לשימוש שעושות חברות טכנולוגיה במחקרו. "עצם מדידת הפנים לא אומר לך אם הפרשנות שלך לזה במקרה זה נכונה או לא נכונה", אמר ל"פייננשל טיימס" ב־2021. "רוב מה שראיתי היה מה שהייתי מכנה פסבדו מדע".
מדע מעורר מחלוקת כאמור לא עוצר את ההתלהבות, המימון הנלהב או פיתוחן ופריסתן של הטכנולוגיות. אולי מיקרוסופט היא היחידה שגילתה איפוק בנושא, אחרי שהפסיקה לפני כמה שנים להציע כלי לניתוח רגשות, בין היתר בשל היעדר הסכמה מדעית, החשש מהטיות, אפליה וחדירה לפרטיות. אבל מלבדה חברות לזיהוי רגשות ממשיכות להפריז ביכולות של הכלים שלהן, כאילו הן יכולות לזהות באופן מדויק וחסר פניות רגשות על סמך הבעות פנים. כך בזמן שהן זקוקות יותר מתמיד להקשרים חברתיים ותרבותיים, שהם חלק בלתי נפרד מזיהוי תגובות רגשיות. זה מסוכן, לא אחראי, וכלל לא מדעי.