פורצי הדרך
CSI בעולם האמיתי: גוגל הצליחה לשחזר תמונות בעזרת בינה מלאכותית
חוקרים של גוגל מצאו דרך להפוך את יכולת שחזור התמונות שנפוצה בסדרות משטרה אמריקאיות למציאות בעזרת בינה מלאכותית שמזהה תווי פנים וממפה נתונים קיימים
קלישאה חבוטה של סדרות וסרטי מתח היא Zoom and Enhance (תקריב והגדלה). אותה יכולת מופלאה של מומחי מחשב לעשות זום לכל חלק בתמונה, ואז לנקות את הרעשים והפיקסלים כך שמתקבלת תצוגה חדה וברורה. יכולת זאת היתה עד עתה בעיקר נחלת דמיונם של תסריטאים עצלים, אבל טכנולוגיה חדשה שפיתחה גוגל הופכת את המדע הבדיוני הזה לקצת יותר מדע, וקצת פחות בדיוני.
- הקולקציה של גוגל: תחבור ל-H&M כדי לעצב שמלות על פי הפרופיל המקוון
- בית המשפט הכריע: גוגל חייבת למסור מידע לקוחות שמאוחסן מחוץ לארה"ב
- גוגל מכרה את חטיבת הלוויינים שלה בתמורה לאחוזים בחברה הרוכשת
חוקרים של גוגל, הצליחו ליצור מערכת מבוססת בינה מלאכותית (AI) שמסוגלת לקחת תמונות פנים מפוקסלות מאוד ובלתי מזוהות, ולשחזר מהן תמונה חדה יותר שמאפשרת לזהות את המצולם בה. "הבעיה של 'סופר רזולוציה' כרוכה בהגברה מלאכותית של תמונה ברזולוציה נמוכה, על מנת לשחזר באופן סביר את הגרסה שלה ברזולוציה גבוהה", נכתב במחקר שפרסמה גוגל בשבוע שעבר. "כשהזום גבוה, התמונה לא מכילה את כל הפרטים הדרושים ליצירת תמונה ברזולוציה גבוהה. האתגר הוא לא רק לנקות את התמונה, אלא ליצור פרטים חדשים שנראים סבירים למתבונן האנושי".
לדברי החוקרים, לא ניתן לשחזר פרטים אלו באמצעות אינטרפולציה פשוטה. "ואולם, באמצעות שילוב ידע קודם על פרצופים וההבדלים הטיפוסיים ביניהם, אמן יכול לצייר פרטים אמינים. במאמר זה, אנו מציגים מערכת שיכולה למלא את מקומו של אמן כזה", נכתב.
מערכת הבינה המלאכותית שיצרה גוגל בנויה על שני אלמנטים. הראשון, שמכונה Prior Network, אומן לזהות תווי פנים והבדלים ביניהם באמצעות סריקת מספר רב מאוד של תמונות פנים, ומשחזר פרטים על סמך הידע שצבר. השני, שמכונה Conditioning Network, ממפה את התמונה הנתונה ומנסה לדלות פרטים מתמונה באיכות גבוהה שמייצגת אלמנט דומה.
המידע שמייצרים שני אלמנטים אלו משמש ליצירת תמונה באיכות גבוהה. התוצאה היא לא בדיוק תמונה חדה ברזולוציה גבוהה, אך כזו שמאפשרת לזהות את האדם או את המקום בדיוק רב ושמצליחה לשחזר נאמנה פרטים רבים של התמונה המקורית.
על מנת לבחון את המערכת, לקחו החוקרים תמונות ברזולוציה גבוהה, הפכו אותן לתמונות ברזולוציה נמוכה ונתנו לה לשחזר אותן. התוצאות הוצגו לצד התמונות המקוריות לנבדקים אנושיים, שנשאלו "איזו תמונה, לניחושך, הגיעה ממצלמה?" לפי המחקר, ב-50% מהמקרים בחרו הנשאלים את התמונה המשוחזרת על פני התמונה המקורית, כאשר בשחזורים המוצלח ביותר בחרו 85% מהנשאלים בתמונה המשוחזרת.
המערכת עדיין רחוקה מיישום מעשי, וגוגל לא הודיעה מתי אם בכלל תצא אפליקציה שמבוססת על הפיתוח. ואולם, לפחות בפעם הבאה שדמות בסדרת טלוויזיה תתבקש לבצע Zoom and Enhance, הבקשה תישמע הרבה פחות מגוחכת.