ריאיון"אנו מציעים טיפול יוצא דופן בבלתי צפוי": הענקית המפתיעה שבמרוץ לרכב אוטונומי
ריאיון
"אנו מציעים טיפול יוצא דופן בבלתי צפוי": הענקית המפתיעה שבמרוץ לרכב אוטונומי
בחודש שעבר זכתה אנבידיה בתחרות לפיתוח מודל לנהיגה אוטונומית. בראיון לכלכליסט מספר דני שפירו, סגן נשיא בחטיבת הרכב של ענקית השבבים, על הפיתוח שמשתמש בנתונים ממצלמות וחיישנים ומאומן על תרחישים מהעולם האמיתי, ואומר: "אנחנו מתאמנים על מספר אינסופי של התרחשויות: ילדים שמתפרצים לכביש, דברים נופלים ממשאית או אור מסנוור. בעולם האמיתי אתה לא יכול לשלוט בדברים האלה"
אנבידיה האמריקאית מוכרת כענקית שבבים שכיום שווי השוק שלה עומד על 2.78 טריליון דולר. בכנס CVPR שנערך בחודש שעבר בסיאטל, זכתה החברה במקום הראשון בתחרות לפיתוח מודל קצה־אל־קצה לנהיגה אוטונומית — מודל שמבין את העולם ומסוגל לבצע הכללה לסביבות שלא ביקר בהן קודם. "CVPR הוא כנס שנתי בנושא ראייה ממוחשבת וזיהוי דפוסים. זה כנס מחקר רציני מאוד שמגיעות אליו חברות מכל העולם", אומר דני שפירו, סגן נשיא בחטיבת הרכב של אנבידיה, בראיון לכלכליסט. "במסגרת הכנס היתה השנה תחרות לעשות חיזוי של מסלולים לרכבים אוטונומייים. במודל מסורתי, מפתחי רכב אוטונומי מנתחים ומבינים את הסביבה הפיזית שלו, ועל בסיס זה מתכננים את מסלול הנסיעה. צוות המחקר שלנו עבד עם מודלי שפה גדולים (LLMs), בדומה לאלו שמאחורי ChatGPT, רק עם סוגים שונים של נתונים. במקום מילים ב־ChatGPT, אנחנו השתמשנו בווידאו ממכונית, אבל זה רק נתונים. הצוות שלנו פיתח מודל מקצה־לקצה שעל בסיס שוטף מקבל כקלט שנייה אחת של מידע שנקלט במצלמות ובחיישני הרכב, ומייצר פלט של 4 השניות הבאות של הנסיעה. הוא יכול לעשות את זה מכיוון שאומן על בסיס תרחישי עולם אמיתי וסימולציות מבוססות GenAI, מה שמאפשר לו להיות מדויק יותר ביחס לאופן שבו רכב יכול לנסוע בבטחה. נקודת המפתח כאן היא שהוא לא מאומן על פרטים, אלא על סביבות כלליות. הוא לא מחפש משהו כמו סימון נתיב בכביש שהוא צריך להצמיד אליו ולנווט, כי אם אין סימון נתיב, המכונית עדיין צריכה להיות מסוגלת לנהוג. הגישה הזו היתה הפתרון המדויק ביותר מבין למעלה מ־400 מתמודדים בתחרות".
חיברתם GenAI לנהיגה אוטונומית כדי לייצר תוצאות טובות יותר לנהיגה אוטונומית.
"GenAI היא קריטית ליכולת לפתח את מקרי הקצה, את התרחישים הנדירים והמסוכנים שאתה כמעט לא נתקל בהם בעולם האמיתי. אנחנו יכולים לדמות את המצלמות, את הרדאר, את אותות הלידר שישקפו את המצבים האלה, כדי להבטיח שהמכונית תוכל להתמודד. אנחנו משתמשים בבינה מלאכותית גנרטיבית כדי ליצור את מערכי הנתונים, אבל אז גם כדי לבצע את הבדיקות והאימות. עם GenAI, אנחנו יכולים לקחת נסיעה מסוימת שמכונית היתה עושה ואז ליצור מספר אינסופי של התרחשויות בנסיעה הזו: ילדים שמתפרצים לכביש, דברים נופלים ממשאית, או אור שמש שמסנוור את המצלמות, אירועי מזג אוויר. בעולם האמיתי אתה לא יכול לשלוט בכל הדברים האלה. אם מנסים לאמן מערכת נהיגה אוטונומית ולבדוק אותה בשקיעה, בדיוק בנקודה שבה האור מסנוור את הנהג, יש אולי רק כמה דקות ביום לבדוק את זה. אבל בסימולציה אנחנו יכולים לבדוק את זה 24 שעות ביממה".
וזה פותר את אחת הבעיות המרכזיות של מכוניות אוטונומיות, שבניגוד לבני אדם שיכולים לפתח תגובה מהירה למצב חדש – הן יודעות להגיב טוב רק למצבים שבהם נתקלו כבר, ויש מגבלה של כמות התרחישים שאפשר לייצר למערכת אוטונומית בעולם הפיזי.
"נכון. דבר משמעותי נוסף שסימולציה מאפשרת הוא היכולת לחזור על תרחישים שוב ושוב. אם נגיד, עדכנו את התוכנה במענה לתרחיש שבו ילד רץ מול המכונית בזמן שהשמש שוקעת, לאחר מכן נוכל להפעיל את אותו תרחיש בדיוק ולראות אם פתרנו את הבעיה או לא. בעולם האמיתי, לעולם לא תוכל לחזור על אותם תנאים כדי לראות אם באמת תיקנת את זה".
"רכב אוטונומי עדיף על נהיגה אנושית"
לפני כעשור, הבטיחו לנו שכניסה רחבה של רכבים אוטונומיים נמצאת ממש מעבר לפינה, 2020 או 2021. שזו תהיה מהפכה. ואז התברר שהבעיות מורכבות יותר ולא קל להתגבר עליהן. יש היום מכוניות אוטונומיות מלאות ברחובות, למשל צי הרובוטקסי של Waymo בפיניקס ובסן פרנסיסקו, אבל זה לא קרוב למה שהבטיחו לנו. האם המודל שאנחנו מדברים עליו, זו פריצת הדרך?
"התרחישים הקלים והבסיסיים נפתרו כבר לפני זמן מה, למשל נסיעה בכביש מהיר, שבו כולם נוסעים באותו כיוון ויש סימון נתיב טוב. אבל איך חוזים מה אנשים אחרים הולכים לעשות? זה הדבר הקשה באמת. ואז להיות מסוגל להגיב אפילו אם התחזית לא נכונה. אבל כשמסתכלים על מה שקורה כיום, הרבה חברות בסין וגם טסלה, זה יותר מודל שבו הם מזינים כמויות גדולות של נתונים למערכות שלהם. ההתקדמות שעשתה טסלה היא די מדהימה. זו עדיין לא נהיגה אוטונומית מלאה, אבל זה די טוב. אני נוהג בטסלה כל יום, והמערכת השתפרה מאוד וזה מאוד מרשים. אבל הגישה שלנו היא פנומנלית בטיפול בבלתי צפוי, ביכולת לצפות מראש. ושוב, זה מבוסס על מציאות ולאחר מכן הדמיית מציאות.
"הבעיה היא עדיין שיש הרבה היבטים משפטיים ואנושיים, תפיסות של בני אדם לגבי מה מותר ומה אסור. בני אדם הורגים אלפי אנשים ביום בכבישים. כאנושות, אנחנו מקבלים את זה שזו רק עובדת חיים. ברגע שיש מכונית אוטונומית, אולי יש צי של מכוניות שנוסעות מיליוני מיילים, אבל ברגע שיש תאונה אחת, זו הכותרת הכי גדולה בעולם, נכון? למרות שאולי הצלנו 99 אנשים באותו יום. כחברה, כרגע, אנחנו לא מוכנים לקבל אפילו הרוג אחד ממכונית אוטונומית. וכך אנו ממשיכים לנסות להפוך את התוכנה לטובה יותר ויותר. אנחנו עדיין רואים דרכים שאנחנו יכולים לשפר, אבל אני חושב שבשלב מסוים נשתנה ונבין שאנחנו הולכים לקבל את העובדה שכלי הרכב האוטונומיים האלה טובים בהרבה מהחלופה, שהיא נהיגה אנושית".
באילו מקומות נוספים אנחנו יכולים לפגוש בינה מלאכותית גנרטיבית במכוניות אוטונומיות?
"GenAI היא פריצת דרך יוצאת דופן ואנחנו נמשיך לראות תוצאות מדהימות. LLMs ישנו את האופן שבו אנו מתקשרים בתוך המכונית, יאפשרו מכונית שמודעת יותר לסביבתה ושיכולה לתקשר. למשל, המכונית תוכל להסביר לנוסע מה קורה בזמן הנסיעה ואת ההתנהגות שלה. היא תוכל למשל להגיד לנוסעים אנחנו מאיטים כי הולך רגל חוצה את הכביש, או שיש קורקינט שעבר ברמזור אדום. הבנת הסביבה ותרגומה לשפה אנושית זה המפתח. זה מה שמודלי שפה גדולים האלה עושים".
איפה אנחנו ניצבים עכשיו בדרך לנהיגה אוטונומית מלאה? מה האתגרים שעדיין צריך לפתור?
"אנחנו מתמקדים בבטיחות. יש מתאם ישיר בין כמות המחשוב שיש ברכב לבין רמת הבטיחות. אנחנו מביאים יותר מחשוב לרכב כדי לעבד יותר מידע מחיישנים, להפעיל חיישנים ברזולוציה גבוהה יותר, מגוון חיישנים גדול יותר. יותר מחשוב מאפשר תוכנה טובה יותר. תסתכל על יכולת העיבוד בטלפון היום בהשוואה למה שהיה לפני עשור, ותחשוב מה יהיה בעוד עשר שנים מהיום. אנחנו רואים גם כמות מדהימה של מחקר ופיתוח בצד התוכנה, אלגוריתמים שמאפשרים לעבד את הנתונים בצורה מדויקת יותר ולפרש את הסביבה. השלב הבא הוא התנהגות. היכולת לצפות מה עלולים כלי רכב אחרים על הכביש לעשות, מה הולכי רגל עלולים לעשות. היכולת לזהות לא רק הולך רגל, אלא הולך רגל שדעתו מוסחת, אולי הולך רגל שמסתכל בטלפון ויש סבירות גדולה ירד לכביש ולא ישים לב לכלי הרכב. בדיוק כמו שבן אדם היה קולט מה קורה סביבו ומנסה לצפות".
"אנשים רוצים לנהוג"
האם תעז להמר מתי נגיע לשלב שבו רכבים אוטונומיים יימצאו בכל מקום?
"זה יקרה בזמנים שונים באזורים שונים, יש רגולציה שונה ורמות שונות של קבלה. הרבה קורה בסין, שם רואים התקדמות, פיתוח ענק ומימון. ישנן מדינות מסוימות בארה"ב שבהן זה קורה. יקח עוד זמן עד שזה יהיה בכל מקום כי עדיין יש לנו הרבה אנשים שרוצים לנהוג בעצמם. הטכנולוגיה מספיק בוגרת היום שאם היינו מורידים את כל כלי הרכב מהכביש ופשוט מחליפים אותם בכלי רכב אוטונומיים בלבד, היינו מורידים את שיעור התאונות לאפס, כי כל המכוניות הללו היו מתנהגות בצורה צפויה. הן לא היו עוברות על החוק ולא היו חותכות בכביש אחת את השנייה. בסופו של דבר, אם כל הרכבים יתקשרו זה עם זה נוכל להיפטר מרמזורים".
"התרחישים הקלים נפתרו. הדבר הקשה זה לחזות מה אנשים אחרים הולכים לעשות. ואז להיות מסוגל להגיב אפילו אם התחזית לא נכונה"
אז הטכנולוגיה מוכנה לעולם של רכבים אוטונומיים, אבל לא לעולם מעורב של רכבים אוטונומיים ורכבים רגילים.
"זה האתגר. עדיין יש את הנהגים המוסחים, השיכורים, העייפים, עדיין יש לך אנשים שממהרים – שייצרו את תרחישי הקיצון. ועדיין יש הולכי רגל. בכל מקום שיש את האלמנט האנושי, עדיין יש שם אתגר. הבעיה היא התנהגות בלתי צפויה. זה לא שהם לא יכולים להתמודד עם הולכי רגל. מישהו מתפרץ לכביש, יש מקרים שבהם נהג אנושי לא מסוגל להגיב מספיק מהר. אבל מכונית שנשלטת על ידי מחשב תגיב טוב יותר".
מה התפקיד של אנבידיה באקוסיסטם זה? אתם לא מייצרים מכוניות, חיישנים או מצלמות למכוניות אוטונומיות.
"אנחנו עובדים עם מאות יצרניות רכב, עם יצרניות משאיות, חברות רובו־טקסי, חברות מיפוי, חברות חיישנים, חברות תוכנה אחרות. פיתחנו את הפלטפורמה, שהיא החומרה שנכנסת לתוך המכונית, זו מערכת ההפעלה שלנו DriveOS. ויש אלגוריתמים, יש רשתות ניורונים, מערכות הפעלה לשכבות השונות של חומרת הרכבים האוטונומיים, יישומים לנהגים שאנחנו מפתחים בשיתוף לקוחות כמו מרצדס בנץ, יגואר ולנדרובר. יש לנו מערך מלא של מערכות הפעלה, תוכנה ויישומים ולקוחות יכולים לבחור במה להשתמש. אנחנו גם עובדים איתם על איסוף הנתונים, אימון אלגוריתם וסימולציה".
לאחרונה מיקרוסופט וגוגל דיווחו שבשל ההשקעה שלהן ב־GenAI ובדאטה־סנטרים, פליטות הפחמן שלהן זינקו. זו סוגיה שמטרידה אתכם באנבידיה?
"כן, בהחלט. לכן אנחנו פועלים לפיתוח פלטפורמות עם יעילות אנרגטית גבוהה, איך לספק ביצועים חזקים יותר מבלי להגדיל את צריכת האנרגיה. זה חלק מרכזי בעבודה של צוותי ההנדסה שלנו".