$
אינטרנט

ראיון כלכליסט

"זיהוי הפנים עדיין לא מהווה פגיעה אמיתית בפרטיות"

טכנולוגיית זיהוי הפנים המתקדמת שחשפה פייסבוק בשבוע שעבר פותחה על ידי צוות ישראלי ברובו. לדברי יועץ הפרויקט ליאור וולף, מאגר התמונות העצום של הרשת החברתית דחף את התחום קדימה, אך חזון האימה שלפיו ניתן לזהות אדם מתוך מאגר של מיליוני תמונות רחוק

הראל עילם 17:4124.03.14

"אנחנו מגיעים לתוצאות הרבה יותר מתקדמות מאלו שהיינו יכולים לדמיין לפני שנתיים", אומר ל"כלכליסט" פרופ' ליאור וולף, אחד החוקרים שעומדים מאחורי מחקר זיהוי הפנים פורץ הדרך שמובל על ידי פייס.קום — החברה הישראלית שנרכשה על ידי פייסבוק ב־2012.

 

וולף הוא חלק מהפקולטה למדעי המחשב באוניברסיטת תל־אביב, ששימש כיועץ המדעי של פייס.קום לפני שנרכשה על ידי הרשת החברתית.

 

כך מזהה פייסבוק מי אתם בתוך פחות משנייה כך מזהה פייסבוק מי אתם בתוך פחות משנייה

 

לפני כשנה חזר לשתף פעולה עם הצוות, שהציג בשבוע שעבר את המחקר המתקדם בעולם בתחום זיהוי הפנים — טכנולוגיה בשם DeepFace. הטכנולוגיה שפיתח הצוות מאפשרת זיהוי פנים של המשתמש ב־97.25% מהמקרים הנבדקים. אדם ממוצע, לשם השוואה, מצליח לזהות פנים מוכרות ב־97.5% מהמקרים. הטכנולוגיה הזו תסייע לפייסבוק לתייג בתמונות משתתפים ברשת החברתית שלא תייגו את עצמם או תויגו בידי חבריהם, וכך להגדיל את מידת המעורבות שלהם.

 

"זה שיתוף פעולה מלהיב מאוד", אומר וולף. אין לאוניברסיטה גישה למאגרי מידע כל כך גדולים כמו שיש לפייסבוק, ואחת הסיבות שיש התקדמות גדולה כל כך בתחום בשנים האחרונות היא מאגרי המידע העצומים". במסגרת המחקר נותחו 4.4 מיליון תמונות של 4,000 איש שנבחרו בצורה אקראית מתוך משתמשי פייסבוק. לבדיקה נבחרו אנשים ממוצאים אתניים שונים כולל חברי פייסבוק מאינדונזיה, יפן ומדינות נוספות, כך שהיא מסוגלת להבחין בין סוגים שונים של תווי פנים.

 

חתימת פנים קומפקטית לכל אדם

 

מערכת זיהוי הפנים החדשה מנתחת את התמונה ומפרקת את הפנים האנושיות ל־4,000 פרמטרים שונים. המערכת משתמשת בטכנולוגיות של למידת מכונה ורשתות ניורונים - היא מסוגלת ללמוד, להשתפר להתאים את עצמה לסיטואציה. 4,000 הפרמטרים הם לא נתונים שבני אדם מהשורה יכולים להמשיג או לקלוט - הם לא מודדים, למשל, את מרחק העיניים או זווית האף או כל פרמטר אחר שאנחנו רגילים לזהות במהירות. אילו הפרמטרים שהמערכת לימדה את עצמה לחפש, אחרי אינספור נסיונות ושנים רבות של אימונים. הפרמטרים האלו הם, בעצם, איך שהמחשב רואה בני אדם - ראיה יחודית למערכת, שקשה לנו כבני אדם להבין.

 

לפי וולף, מדובר בקפיצת מדרגה משמעותית ביעילות ובדיוק. "80% מכל הפרמטרים מתבטלים לבסוף ומקבלים ערך של 0, כך שחתימת הפנים האישית המתקבלת לכל אדם היא מאוד קומפקטית, מה שמאפשר לנו ליצור מערכת מדויקת ומהירה. למעשה, כמעט אין אלמנט של חיפוש במאגר, והמערכת פשוט מוצאת נקודת השוואה ומעבירה אותה הלאה. במערכות אחרות, לפנים יש מאות אלפי פרמטרים ולכל פרמטר כזה ערך ייחודי. רק לפני כמה שנים, כשעשינו מחקר עם קבוצת סטודנטים, מדדנו כל פנים לפי עשרות אלפי פרמטרים".

 

הדיוק, כאמור, גבוה מאי פעם ועומד על 97.25%. במבחני זיהוי פנים מקבל המחשב כמות גבוהה מאוד של צמדי תמונות וצריך לזהות מתי מדובר באותו אדם בשתי התמונות. עד כה, התוצאה הטובה ביותר של מערכת זיהוי פנים מסחרית עמדה על 96%, בטכנולוגיה שפותחה על ידי מיקרוסופט. המערכת של פייס.קום עמדה בתחילה על יכולת זיהוי של 91%, ועם הזמן השתפרה והגיעה ל־93%.

 

מה הרלבנטיות של ביצוע מבחן השוואה מלאכותי כל כך? הדאגה היא לזהות אנשים בתנאי השטח, לא?

 

"הרעיון הוא ליצור מבחן שמאפשר להשוות את היכולות של בני אדם ומכונה. זה ניסוי מוגדר היטב שמחשב יכול לעמוד בו, וגם אדם. בני אדם לא יכולים לזכור תמונות של אלפי אנשים שלא פגשו. אם תסתכל על מבחני זיהוי פנים בשנות התשעים, תראה תמונות שבהן התאורה היתה זהה והבעות הפנים היו זהות. זה לא המצב היום. אתה משווה בין תמונות שבהן אנשים מחייכים ואף חובשים כובעים ומשקפי שמש, בתנאי תאורה קשים או בחצי פרופיל. פעם המערכת היתה אולי טובה רק לבדיקת תעודות במעבר גבולות. היום הכל אפשרי".

 

העבודה עם פייסבוק לא שינתה דבר

 

יש דאגה משמעותית מההשלכות של קיום מאגר זיהוי פנים מתקדם כל כך שנמצא בידיה של חברה אחת.

 

"הפירצה תמיד היתה קיימת והיא לא השתנתה משום שהטכנולוגיה התקדמה. אם רמת הדיוק היא 91%, 93% או 97%, זה לא שינוי מהותי מבחינת האזרח מהשורה, אלא אבן דרך חשובה מבחינת המחקר. זה לא שאנחנו חשופים יותר עכשיו ממקודם. חזון האימה שבו אנחנו נותנים למחשב תמונה והוא יכול לזהות אדם מתוך מאגר של מיליוני אנשים עדיין לא כאן. כרגע המחשב יכול להשוות בין שתי תמונות או לחפש אדם בתוך מאגר מאוד מצומצם, בן עשרות או מאות אנשים — ובטח שלא בן אלפי אנשים או יותר".

 

"זו גם לא שאלה של כוח עיבוד — גם אם היו לנו מחשבים מאוד חזקים, היה שיפור של בסך הכל שברירי האחוז. יש נקודת רוויה שאחריה קשה יותר ויותר להתקדם".

 

פרופסור ליאור וולף. החוקר שמספר לפייסבוק מי אתם פרופסור ליאור וולף. החוקר שמספר לפייסבוק מי אתם

 

מתי יגיע הרגע שבו האח הגדול יהיה כאן ויידע היכן אנחנו נמצאים בכל רגע?

 

"יש עוד זמן עד שזה יקרה. אבל אתה יודע, כאשר התחלנו לעבוד על הטכנולוגיה סיכוי הזיהוי היה 70%. ההתקדמות בהחלט יותר מהירה ממה שחשבנו, אבל המרחק מפגיעה אמיתית בפרטיות עדיין גדול".

 

אתה עובד עם פייס.קום מאז 2009. יש הבדל בעבודה מולם לאחר הרכישה על ידי פייסבוק?

 

"אני מסתכל על זה כחוקר ואין הבדלים. אנחנו מגישים מחקרים לתחרויות של ניתוח פנים מאז 2008 וכל הזמן מנסים להיות הכי טובים. דבר לא השתנה".

 

מהי באמת רמת הדיוק של בני אדם? גם אנחנו טועים. האם ניתן לעבור אותה?

 

"יש נושא שמאוד מסייע לזיהוי אצל בני אדם שהוא היכרות אישית. אתה לא תתבלבל בזיהוי של אשתך, ואם ראית אדם מאות פעמים — אתה תזהה אותו בקלות. זה היה החיסרון הגדול של מערכות מחשב, אבל גם הוא הצטמצם בשנים האחרונות עם לימוד מכונה".

 

מה השלב הבא?

 

וולף מסביר כי המטרה היא לזהות את נקודות החולשה הקיימות, ולבנות שיטות חדשות שילמדו את המערכת להתמודד עם בעיות נקודתיות כמו זיהוי זקנים או משקפי שמש.

 

"ניצור שורה של מערכות שמתמחות במקרים יותר קשים, וכמה שיהיו לנו יותר דוגמאות, זה יותר טוב. פריצת הדרך הבאה תהיה מבוססת על מבחן אחר מזה שאנחנו משתמשים בו היום. כשאתה מגיע לאחוזי הצלחה כל כך גבוהים, אתה צריך לחשוב על מבחנים אחרים. פריצת הדרך הבאה תגיע כשנבין היכן המערכת הנוכחית טועה".

בטל שלח
    לכל התגובות
    x