בינה מלאכותית - זו לא אינטליגנציה, זו סטטיסטיקה
בינה מלאכותית - זו לא אינטליגנציה, זו סטטיסטיקה
בשבועות האחרונים הוצגו כמה “פריצות דרך” בתחום כמו מערכת שיודעת לקרוא טקסט ולהפוך אותו לציור. אבל בין ציורים יפים לבין פיתוח של מערכות שמדמות אינטליגנציה אנושית אין קשר לינארי
עצרו הכל, המשחק נגמר: בינה מלאכותית כללית היא בלתי נמנעת. הגנו על הקודים למשגרים הגרעיניים וקוו לטוב. בשבוע שעבר הודיע ננדו דה פרייטס, חוקר ראשי ב־DeepMind של גוגל, שהאנושות נמצאת ככל הנראה על סף בינה כללית מלאכותית (AGI), ממש עוד במהלך חיינו. “לדעתי, הכל עניין של קנה מידה עכשיו! המשחק נגמר”, צייץ והוסיף: “מדובר בהפיכת מודלים אלו לגדולים, בטוחים, יעילים, ומהירים יותר בדגימה, עם זיכרון חכם יותר...”. ההצהרה של דה פרייטס מתייחסת למחקר שפרסמה לאחרונה DeepMind על מערכת בינה מלאכותית מתוחכמת שפיתחו ושמה Gato. גאטו מסוגלת לבצע שורה מגוונת של משימות כמו “לשחק באטארי, לתת כיתוב תמונה, לשוחח בצ’אט, להעמיס בלוקים עם זרוע רובוט אמיתית ועוד”, כתבו החוקרים בבלוג.
ההודעה של המומחה לא יכולה היתה להגיע בזמן טוב יותר, במיוחד בישראל. בשבוע שעבר זכתה לפרסום מערכת Dall E 2 שפותחה על ידי מעבדת הבינה המלאכותית OpenAI. היכולת של המערכת לתרגם טקסט לאיורים הפכה לשיחת היום, ומהדורות החדשות עסקו דרכה בשאלות מהותיות על מהי יצירה אנושית, מה טיבה של אמנות ומה צופן לנו העתיד בגלל מערכת זו - עולם טוב יותר או רע יותר. בכל מקרה, כך נקבע, העתיד כבר כאן. אבל מהו העתיד הזה? ובאיזה אופן מודלים ממוחשבים אלו מסמלים עתיד?
מומחים שפועלים בתחום הבינה המלאכותית משתמשים בשורה מורכבת של סיווגים, טכנולוגיות וגישות, כל אחד מהם בעל נתיב התפתחות אחר. אך ככלל ולצורך הפישוט ניתן לחלק את ה”טכנולוגיה” לשני סוגים: בינה מלאכותית (AI) “חלשה”, במובן שהיא חלשה יותר מהאינטליגנציה האנושית; ובינה כללית מלאכותית (AGI) שהיא “חזקה” וזהה באופן עקרוני לאינטליגנציה האנושית. כלומר, מכונה שיש לה תודעה ומצבים קוגניטיביים אחרים שאמורים לאפשר לה לעשות הכל מהכל ללא הכשרה מוקדמת ובלי יד מכוונת, להשתמש בשפה ולהבין מושגים מופשטים. במילים אחרות: “ההמצאה האחרונה שאי פעם נצטרך להמציא”.
1. דרייפוס צדק
בינה מלאכותית חלשה נבנית בגישה מבוססת סטטיסטיקה - מכונות לומדות מידע עצום ממאגרי נתונים ממוינים באופן מפוקח. בדרך זו מכונות לומדות “לנחש”, “לחזות” ו”להעריך”, למשל אבחנה רפואית, מזג אוויר או סיכון בנקאי. מכונות אלו לא “יודעות” איך אנו מגיעים לתשובה לשאלה, אבל הן כן יכולות להסיק סטטיסטית מה תהיה התשובה הנכונה בשיעורי הצלחה משתפרים. מערכת חזקה היא סיפור אחר ומעורפל הרבה יותר. עד היום אף אחד לא יודע כיצד לבנות מערכת כזו. למעשה, אנו לא קרובים להבין את זה יותר מאז שאלן טיורינג, אבי תחום הבינה המלאכותית, ניסה להמשיג אותו בשנות החמישים. מדוע פער כה גדול? הפילוסוף יוברט דרייפוס, שהיה אולי אחד הכותבים הראשונים והמשפיעים בנושא, הצביע בשיטתיות מתמשכת ביותר על “מה שמחשבים לא יכולים לעשות”, הוא עשה זאת משנות השישים ועד מותו ב־2017.
דרייפוס טען, במה שאז בוטל בגיחוך והיום נהנה מהכרה רחבה, שהמאמץ לבנות בינה כללית מלאכותית נשען על ההנחה (השגויה) שניתן לתאר עבור מכונות כל תופעה על ידי סמלים ולגרום להן “להבין” כל מה שקיים כאובייקטיבים עם תכונות ויחסים בין עצמים. עם זאת, בפועל בני האדם משתמשים בעיקר בידע לא פורמלי ולא מודע בתהליך החשיבה שמאוחסן ושנשלף באופן אינטואיטיבי כלשהו. מה שלא מבינים ולא מודעים לגביו, הסביר דרייפוס, לא ניתן לבצע כלפיו “הנדסה לאחור”, ולכן לעולם לא תוכל להיות מכונה אינטליגנטית. כשמצליחים בכל זאת ללמד מחשב לעשות משהו, למשל לשחק שחמט, זה מרשים באותו הרגע, אך אחרי שהמשימה הזו הושלמה היא כבר לא נחשבת “אינטליגנטית”. תיאור מפורסם מעורר מחלוקת לבינה מלאכותית הוא “כל מה שמחשב עדיין לא עשה”. כלומר, זו אינה נגזרת של זמן ומאמץ. מודל אחד יותר או מודל אחד פחות, לעולם לא יהיה דבר כזה.
גישה זו שנויה במחלוקת. יש זרם דומיננטי של מדענים שמאמינים שניתן לבנות מכונה אינטליגנטית, מתישהו, איכשהו, ואין ספק בכך. ואף שכאמור לא היתה התקדמות בגישה זו, התיאורים שלהם לעתיד מעסיקים את המחשבה שלנו יותר מהכל. מסיבה כלשהי הם הצליחו לגרום לנו להניח שהתחום כולו הוא ליניארי והתפתחות בתחום AI מובילה להתפתחות בתחום AGI. כלומר, כשמשכללים את יכולותיה של מכונה אחת בתחום ספציפי, אנו מצויים על מסלול ישיר לפתח היגיון בריא או משהו שדומה לאינטליגנציה.
לכן כשמופיע בחיינו מודל שמצליח לייצר תמונה וירטואוזית מטקסט, אנו מעריכים שמשמעות השכלול הזה היא התקדמות לעבר מערכת בינה כללית מלאכותית, מכונה על־אנושית ו”העתיד” שעליו קראנו בספרות מדע בדיוני. לפעמים הדמיון לוקח אותנו לעתיד אוטופי שבו בעיות רבות נפתרות באמצעות היצירה העל־אנושית הזו, ולפעמים לעתיד דיסטופי שבו המכונות יקחו לנו את העבודות וישלטו בעולם.
2. זו רק סטטיסטיקה
הערכת היתר הזו לא מתרחשת במקריות. תחום הבינה המלאכותית מוכר חלומות גדולים כבר שנים רבות. למעשה, עוד בשנות החמישים העריכו כי בינה מלאכותית חזקה תושג בתוך חודשיים, אחר כך ההשערה זזה לשנות השישים, ואז לשנות השבעים, ולפי דה פרייטס מ־DeepMind היא כבר הושגה. הערכות שהן תמיד אופטימיות מדי או מוגזמות לחלוטין. כך, למשל, אין קשר בין המודל הווירטואוזי של Dall E 2 שמתרגם טקסט לתמונה ובין מכונה שיכולה להפיק דברים מקוריים, אמנותיים, באופן לא מפוקח. כמו שאין קשר בין מערכת גאטו של DeepMind שאולי יכולה לבצע באופן מרשים כמה פעולות שונות, לבין מודל שיכול לעשות דברים חדשים ללא הכשרה מוקדמת. דה פרייטס מודה בכך ומכנה את הפיתוח “אינטליגנציה אלטרנטיבית”.
זה לא אומר שהמודלים והמערכות חסרי ערך חלילה. מודלים זה מצוין. היכולת לעבד נתונים בהיקפים גדולים זה נהדר. הסקה סטטיסטית מהירה זה יעיל. והכל ביחד זה חלק מהיכולת שלנו להתקדם אל עבר הבנה מעמיקה יותר לגבי הקיום שלנו. מהאטומים שמרכיבים אותנו לחלל שמקיף אותנו. מכונות אלו גם באמת ובתמים מייצרות דברים מרשימים ושימושיים. לפעמים דברים שממש מגרים ומאתגרים את החשיבה כמו ה”ציורים” של Dall E 2 שהפיק תמונות “חדשות” עם “סגנון” מובחן ואלמנטים “אמנותיים”. מילים אלו נכתבות לא סתם במרכאות. הן הכרחיות כי אף שהיצירות מהדהדות לנו מוכרות, אנושיות ומרשימות, הן בסופו של דבר סטטיסטיקה. הסטטיסטיקה הזו נארזת ומשווקת כאילו היא מדמה תהליך מהותי של מחשבה אנושית, כאילו כמה תוכנות פשוטות (באופן יחסי לאנושיות) יכולות להרכיב עולם ומלואו. אבל זו טענה פשטנית לגבי הקיום האנושי, וגם כזו שמתעלמת מההתקדמות המדעית כפי שהיא בתחום הבינה הכללית המלאכותית, שבסופו של דבר לא קיימת היום בדיוק כפי שלא היתה קיימת אתמול.