"ילד מתפרץ לכביש זה לא דבר שנרצה לבדוק בעולם האמיתי"
רב לבארדיאן, סגן נשיא אנבידיה לטכנולוגיות הדמיה, סיפר לכלכליסט על החזון ל"מודלי עולם", תחום AI שמאפשר להדמות במדויק את חוקי הפיזיקה ותנאי השטח. לדבריו, היכולת להריץ אין־ספור תרחישים לאימון ובדיקה של מערכות רובוטיות "תאיץ תהליכים בתחבורה, בכלי לחימה ובפרמקולוגיה"
מכונית אוטונומית נוסעת במורד הדרך. יום קר, מושלג, הראות מוגבלת. לפתע מתפרץ לכביש ילד. המכונית סוטה ברגע האחרון, והתאונה נמנעת. שוב שלג כבד וראות מוגבלת, שוב ילד מתפרץ לכביש, אך הפעם המכונית אינה מגיבה מהר מספיק, ומתנגשת בילד. עכשיו היא נוסעת באותו כביש בשעת שקיעה של יום שמש בהיר. האם סנוור השמש יקשה על המכונית לזהות את הילד שמתפרץ לכביש? עם תרחישים כאלה ואחרים אמורה להתמודד המערכת האוטונומית של המכונית, אבל איך אפשר לאמן אותה לזה? התשוב היא באמצעות "מודלי עולם", בינה מלאכותית שמאפשרת להדמות באופן מדויק את חוקי הפיזיקה ותנאי השטח. באמצעות המודלים הללו ניתן לייצר ולהריץ אין־ספור תרחישים ותנאים לאימון ובדיקה של המערכת האוטונומית של מכוניות ושל מערכות רובוטיות אחרות. על טכנולוגיית מודלי עולם מבוססים ChatGPT ויישומי בינה מלאכותית גנרטיבית אחרים.
"מודלי עולם יוכלו להאיץ תהליכים בכל הפעילויות שבהן אטומים נעים ממקום למקום או משנים מבנה", אמר לכלכליסט רב לבארדיאן, סגן נשיא אנבידיה לטכנולוגיות הדמיה. בינואר השנה חשפה אנבידיה את קוסמוס, פלטפורמה של מודלי עולם שהיא פיתחה ואמורה להאיץ את הפיתוח של רובוטים ורכבים אוטונומיים. היום תיפתח בסן חוזה (קליפורניה) ועידת המפתחים השנתית של אנבידיה, במהלכה צפויה החברה לחשוף את החידושים האחרונים שלה בתחום שבבי ה־AI והרובוטיקה.
מה השימושים של מודלי עולם?
"אפשר להשתמש בהם לייצור דברים כמו קלט לחיישנים של מודל רכב אוטונומי, כלומר למדל נסיעה של הרכב כך שהקלט המדומה בכל החיישנים יהיה עקבי. הדבר מאפשר ליצור אין־סוף תרחישי נסיעה במגוון תנאים. הרבה פעמים רוצים לבחון איך יתנהג הרכב בתרחישים לא נפוצים, כמו כשילד מתפרץ לכביש. זה לא משהו שרוצים לבדוק בעולם האמיתי. עם מודל עולם אפשר לייצר תרחיש כזה, ולהיות יותר בטוח שה־AI מסוגל להתמודד איתו. אותו תרחיש רלוונטי גם לכטב"מים וצוללות אוטונומיים".
כך גם בנוגע לפעילויות כמו תחבורה, ייצור, אחסון, שרשרת אספקה, פיתוח וייצור תרופות. בתחום הפארמה למשל יתאפשר לדמות הרכבים מולקולריים של תרופות ואת השפעתן על מטופלים. בשרשרת אספקה ניתן ליצור הדמיות בלתי סופיות של נתיבי אספקה מורכבים ושונים ולזהות את היעיל ביותר. בתחומים כמו אחסון וייצור מערכות רובוטיות יוכלו לבצע פעולות מהירות ומדויקות יותר מבני אדם".
לבארדיאן, שעובד באנבידיה 23 שנה, התחיל את דרכו בתחום האפקטים המיוחדים בהוליווד, ועבד עם חברות כמו וורנר ברדרס ודיסני. שם גם החל העניין שלו בהדמיות ממוחשבות של העולם הפיזי. "כשעברתי לאנבידיה התחלתי ליישם את כל הטכנולוגיות האלו על הדמיית תלת־ממד בזמן אמת למשחקי מחשב", אמר.
2 צפייה בגלריה


הדמיות של קוסמוס, פלטפורמת מודלי עולם של אנבידיה. "ברובוט הכוונה למערכת שיש לה יכולת תפיסה, החלטה והפעלה"
מה זה בעצם מערכת רובוטית?
"ברובוט הכוונה למערכת שיש לה שלוש תכונות: תפיסה, היא יכולה לחוש ולהבין את העולם; קבלת החלטות על בסיס הקלט, היא מחליטה מה לעשות כדי להשיג מטרה כלשהי; והפעלה – ברגע שהמערכת מקבלת את ההחלטה היא פועלת בעולם ומשנה אותו.
"לפי ההגדרה הזו, מכונית אוטונומית היא רובוט, וכך גם רחפן משלוחים אוטונומי או מכונה שמכינה פריטים למשלוח במחסן לוגיסטי. אבל גם עיר או בניין יכולים להיות רובוט. בבניין מודרני יש מצלמות וחיישנים, וכשאני נכנס המצלמות מזהות אותי לפני שאני מגיע לאזור מאובטח ויכולות לפתוח לי את הדלתות. מערכות ה־AI בעלות הערך הרב ביותר שנבנה יהיו אלו שיפעלו בעולם הפיזי.
"עם למידת מכונה לא צריך לכתוב אלגוריתם. במקום זה, מזינים למחשב־על דוגמאות. מראים לו מיליוני ומיליוני תמונות של דברים שונים, ואומרים 'זה חתול', 'זה כלב', והוא כותב את האלגוריתם. זה סוג של AI בעולם הפיזי. זיהוי תמונה היה הראשון, והתחלנו לחשוב באנבידיה איך מפתחים את המודלים העתידיים האלה. צריך שני דברים: מחשב גדול והרבה נתונים".
הרעיון עובד מצוין כשמדובר בידע שזמין בצורה דיגיטלית, כמו טקסט ותמונות. אבל מה אם רוצים ליצור מערכות AI שפועלות בעולם הפיזי בצורה אוטונומית? בשביל זה צריך לאסוף נתונים על העולם הפיזי. פתרון אפשרי אחד, שמפתחות מכוניות אוטונומיות כמו גוגל יישמו, הוא להוציא לכבישים מכוניות מצוידות בחיישנים ולתת להן לנסוע מרחקים עצומים כדי לאסוף מידע שניתן להשתמש בו כדי לאמן אלגוריתמים. אלא שכמות המידע שניתן לאסוף באמצעותה מוגבל, והתרחישים האפשריים הם אין־סופיים. כאן מגיע התפקיד של מודלי עולם.
"אי אפשר ליצור מערכת רובוטית חסונה ובטוחה בלי שימוש בסימולציה מתוחכמת", הסביר לבארדיאן. "יש סימולציות קלאסיות, שלא מבוססות על AI אלא על משוואות פיזיקליות מוכרות, אבל הן מוגבלות, מצריכות כמויות אדירות של כוח מחשוב, ומספקות מידע שהוא רק אומדן. בסימולציות מבוססות AI אנחנו מאמנים מודלים ללמוד משוואות פיזיקליות, ונעזרים במידע מהעולם הפיזי.
"מודלי עולם הם הרחבה של סימולציות AI, אבל לכל העולם. הם מנסים להבין את הפיזיקה של העולם, ומבוססים על אותה טכנולוגיה שמשמשת ליצירת מודלי שפה גדולים (LLMs). אבל במקום להבין את כללי השפה או איך עובד דקדוק בשפות שונות, הם מבינים את כללי העולם, ואנחנו יכולים לקבל יכולות דומות לאלו של מודלי שפה. מודל עולם שמבין את חוקי הפיזיקה, את חוקי העולם, יכול לנתח ולפרש מידע שנקלט בחיישן ולייצר ממנו תובנות. אנחנו יכולים לתת למודל עולם תמונה של יום שמשי בכביש, ולהגיד לו ליצור סימולציה של יום שלג באותו כביש. או שאנחנו יכולים להורות לו: 'תייצר נסיעה בכביש ביום גשום בשעה שתיים בצוהריים'".
מאיפה מגיע מידע האימון?
"ראשית, מקורות מידע כתובים הם עדיין מקורות, ספרים שיש להם משוואות פיסיקליות. אבל המקור העיקרי למידע בעבור מודלי עולם הוא וידאו. אין שם את כל המידע שאנחנו צריכים, אבל מספיק כדי שנוכל לבנות יסוד. יש מספיק וידאו באינטרנט כדי לאסוף ידע בסיסי על הפיזיקה של העולם. על הבסיס הזה אנחנו יכולים לאמן ולהוסיף מידע ספציפי יותר. מידע נוסף מגיע מסימולטורים פשוטים יותר, שיכולים לספק נתונים על מהירות, מצב ותנועה של חפצים".
הכותב הוא אורח בוועידת המפתחים השנתית של אנבידיה בסן חוזה