יתלה כביסה ויסדר את הסלון? אמנון שעשוע חושף את ה-Menteebot - רובוט דמוי אדם שמציית לפקודות
יתלה כביסה ויסדר את הסלון? אמנון שעשוע חושף את ה-Menteebot - רובוט דמוי אדם שמציית לפקודות
מפתחת המנטיבוט היא מנטי רובוטיקס, שהקים שעשוע ב-2022 עם החוקרים פרופ' ליאור וולף ופרופ' שי שלו שוורץ. לפי החברה, האב טיפוס של הרובוט שיושק ב-2025, נבדל מהמתחרים ביכולתו להבין הוראות בשפה טבעית, ולבצע בעצמו משימות מורכבות באמצעות שילוב AI בכל רמות ההפעלה שלו
מדובר בחלום עתיק שמלווה את המדע ומצית הדימיון משחר האנושות: רובוט הומינידי (דמוי אנוש) שמסוגלת לציית לפקודות האדם. פילוסופים יוונים, סינים ומצרים בעת העתיקה דיברו עליו. ליאונרדו דה-וינצ'י ניסה להפוך אותו למציאות, אלון מאסק עדיין מנסה. אבל עכשיו, פרופ' אמנון שעשוע, אחד המדענים והיזמים הפוריים בישראל, בטוח שהצליח לפצח את הבעיה.
אחרי כשנתיים של פעילות חשאית, חושף שעשוע את המנטיבוט (Menteebot), רובוט הומינידי מבוסס יכולות בינה מלאכותית (AI) שמסוגל לבצע מעגל פעולות שלם – מפקודה מילולית בשפה טבעית ועד להשלמת משימות מורכבות שכוללות ניווט ותנועה במרחב, הבנת הקשר, זיהוי חפצים, ויכולת להעבירם ממקום למקום. עם זאת, הדגמת היכולות שסיפקה החברה של שעשוע רחוקה מלהרשים, ונראה שהדרך ליישום מסחרי מורכבת.
את הרובוט מפתחת מנטי רובוטיקס (Mentee Robotics), שהקים שעשוע ב-2022 עם פרופ' ליאור וולף, מבית הספר למדעי המחשב של אוניברסיטת תל אביב ולשעבר חוקר בכיר בחטיבת ה-AI של מטא שגם מכהן כמנכ"ל החברה, ועם פרופ' שי שלו שוורץ מבית הספר למדעי המחשב והנדסה באוניברסיטה העברית וסמנכ"ל הטכנולוגיות של מובילאיי. שעשוע מכהן כיו"ר מנטי רובוטיקס. בחברה הושקעו עד היום 17 מיליון דולר מ-Ahren Innovation Capital וממשקיעים נוספים.
"תחום ה-AI נמצא רגע לפני נקודת התכנסות של טכנולוגיות שונות: ראייה ממוחשבת, הבנת שפה טבעית, סימולטורים עוצמתיים ומפורטים, ומתודולוגיות מעבר מסימולציה לעולם האמיתי", אמר שעשוע בהודעה לעיתונות. "במנטי רובוטיקס אנו רואים בשילוב הזה את נקודת ההתחלה לעיצוב רובוטים אנושיים מהלכים לכל מטרה, שיוכלו לנוע בחופשיות בסביבה אנושית ויהיו בעלי יכולת תפיסה שמאפשרת ביצוע משימות ביתיות ולימוד משימות שלא אומנו עליהן באמצעות חיקוי".
חברות טכנולוגיה מנסות לפתח את הרובוטים ההומונידיים זה עשרות שנים, כאשר בין השחקניות הבולטות שפועלות בתחום בתקופה הנוכחית ניתן למנות את טסלה של אלון מאסק (שמפתחת את אופטימוס) ואת בוסטון דיינמיקס הוותיקה. שחקנית בולטת נוספת היא Figure, שבין מדעניה נמנים יוצאי טסלה ובוסטון דיינמיקס, שחשפה לפני שנה רובוט הומינידי אוטונומי בשם Figure 01.
מבחינת היכולות הפיסיות, על פניו אין הבדל מהותי בין המנטיבוט למתחריו. בדומה אליהם, הוא מסוגל ללכת (לא מהר במיוחד) ולבצע פעולות יומיומיות כמו הכנסת חפצים לקופסה, הרמת הקופסה והעברתה למקום אחר. לדברי החברה, מנטיבוט נבדל מהמתחרים ביכולתו להבין הוראות בשפה טבעית ולבצע באופן עצמוני משימות מורכבות בסביבה ביתית או תעשייתית, זאת באמצעות שילוב AI בכל רמות ההפעלה שלו.
בחברה מסבירים שהצליחו להגיע לרמה גבוהה של פעילות עצמונית באמצעות אימון מודל ה-AI של הרובוט בסביבה וירטואלית שעושה שימוש בכמות בלתי מוגבלת של נתונים, מצבים ומרחבים גיאוגרפיים על מנת לדמות ולאמן את הרובוט על תרחישים אפשריים בעולם האמיתי. לכך נוספות יכולות כמו מיפוי סביבה בזמן אמת ושימוש במידע סמנטי על מנת ליצור מודלי תלת-ממד של המרחב שבו נע הרובוט. אלו מאפשרים לו למקם את עצמו במרחב, לזהות פריטים ומיקומים ולתכנן מסלולי תנועה דינמיים תוך הימנעות ממכשולים. על מנת להבין וליישם את הפקודות שהוא מקבל נעשה שימוש במודלי שפה גדולים (LLMs), מהסוג שנמצא בבסיס שירותים כמו ChatGPT.
במנטי רובוטיקה אומרים כי האב הטיפוס שהציגה היום החברה אינו הגרסה הסופית של הרובוט, ונועד רק להדגים את יכולות הפעולה מקצה לקצה שלו. בסרטון הדגמה שהפיצה החברה נראית משתמשת מורה תחילה לרובוט ללכת לשולחן במטבח ולהמתין להוראות. הרובוט מציית (הגם שהתקדמותו אטית). עם הגעתו, מבקשת המשתמשת מהרובוט: "שים את הפירות בקופסה, והנח אותה על המדף". הרובוט, בתגובה, מרים בזה אחר זה שני אפרסמונים שניצב על השולחן, מניח אותם בקופסה ואז אוחז בקופסה, הולך איתה למדף שנמצא מרחק כמה צעדים ממנו ומניח אותה במקומה. השלמת פעולות אלו דורשת מהרובוט כמעט דקה וחצי.
יכולות אלו אינן חריגות במיוחד לעומת יכולות של רובוטים מתחרים. Figure הפיצה בחודש שעבר שורת סרטונים שבהם נראה הרובוט שלה מבצע שורה דומה של פעולות. בסרטון אחד, נראה הרובוט נענה לפקודות מפעיל ומבצע פעולות כמו סידור חפצים. באחר, הוא מרים קופסה ונושא אותה למיקום אחר, בסרטון נוסף מכין הרובוט קפה (תוך שימוש במכונה דמויית נספרסו) בתגובה לפקודת מפעיל. לפני כארבעה חודשים הפיצה טסלה סרטון שבו נראה הדור השני של הרובוט שלה מבצע פעולות כמו הליכה והרמת ביצה והכנסתה, על קליפתה, לסיר. ובניגוד למנטיבוט, שידיו מורכבות רק ממלחציים, לרובוטים של פיגור וטסלה יש חמש אצבעות עם מפרקים בכל כף יד.
עם זאת, בניגוד לסרטונים האחרים, ההדגמה של מנטי רובוטיקס היא היחידה שבה נראה הרובוט מבצע את מגוון הפעולות השונות בסרטון אחד רצוף ונטול עריכות, בתגובה לפקודה קולית ובצורה עצמונית לחלוטין, לפי הצהרת החברה.
מדובר עדיין באבטיפוס שלא מיועד לשיווק מסחרי אלא להדגמת הטכנולוגיה שמפתחת מנטי ומתן מושג לכיוון שאליו היא מתקדמת. בחברה עדיין מגלים אופטימיות ואומרים הרובוט צפוי לצאת לייצור סדרתי ברבעון הראשון של 2025. לדברי החברה, הוא יופעל על ידי חישה מבוססת מצלמות בלבד, מנועים חשמליים שמפותחים במנטי ובינה מלאכותית המשולבת באופן מלא, שתאפשר תהליכי חשיבה מורכבים לצורך השלמת משימות, ניהול שיחות ולמידת משימות חדשות.
ואולם, הפער בין האבטיפוס שהוצג לבין מוצר בעל קיימות מסחרית רחבה הוא עדיין רחב מאוד, ולא ברור איך החברה תצליח לגשר עליו בתוך שנה בלבד, במיוחד לאור העובדה שמאמצים לקדם יכולות תנועה ופעולה פיסיות של רובוטים מתקיימים על ידי חברות וחוקרים שונים זה עשרות שנים, ומתמודדים ומתקשים מול חסמים ואתגרים דומים.