כנס AIמייסד ומנכ"ל AI21 הסביר: מה מיוחד במודל החדש של החברה?
כנס AI
מייסד ומנכ"ל AI21 הסביר: מה מיוחד במודל החדש של החברה?
בכנס AI של כלכליסט טען אורי גושן כי כיום ארגונים מתקשים לאמץ כלי AI בשל מספר גורמים, ביניהם חוסר האמינות של אותם כלים, המחיר הגבוה של טעות ובעיות של ביטחון מידע. לדבריו, מודל ה-JAMBA שהושק לפני כמה שבועות פותר את הבעיות הללו: "זה לא רק עוד מודל שהגדילו"
"כולנו חשופים למהפכה של הג'נרטיב AI, בין אם זה צ'אט GPT או יצירת תמונות, ואין ספק שהכלים האלו מרשימים ומייצרים תוכן ברמה מאוד גבוהה, אבל השוק הגדול והאתגר הגדול הוא בתחום ה-enterprise" - כך פתח את דבריו אורי גושן, מייסד משותף ומנכ"ל משותף ב-AI21, בכנס AI של כלכליסט. גושן סיפר על המודל החדש של החברה, Jamba 1.5 large, המשלב ביצועים איכותיים ברמה הכי גבוהה, וגם יעילות מבחינת חלון context ארוך במיוחד.
AI21 היא חברה הבונה מודלי שפה ומערכות בינה מלאכותית עבור ארגונים, שגייסה כ-336 מיליון דולר ושוויה עומד על 1.4 מיליארד דולר.
לדברי גושן, "בדו"ח שפורסם על ידי אמזון רק 6% מהארגונים אימצו ג'נרטיב AI בפרודקשן. השאלה היא למה? הסיבה הראשית היא שהטכנולוגיה עדיין אינה אמינה מספיק. יש תופעה שנקראת הזיות, יש גם שגיאות לוגיות בסיסיות שהמודלים עושים. אפילו אם תתנו למודל לנסות פעולות אריטמטיות בסיסיות כמו כפל תראו כישלונות ותקבלו תוצאה שגויה למרות שתוצג כנכונה. הדבר השני הוא שקיפות: בעולמות שמחיר הטעות בארגון גבוה, מצפים שמערכות ידעו לתת הסבר ברור לתשובה. שלישית, היעילות של הטכנולוגיה: אותם מודלי שפה מבוססים על ארכיטקטורה בשם טרנספורמר, שלא השתנתה הרבה מאז פורסמה לפני שבע שנים. מעבר לזה, הטכנולוגיה אינה בנויה לנושא של ביטחון מידע. יש המון מידע רגיש בארגונים שלא ששים להעלות לשירותי ענן כי יש סודות מסחריים, חוזים משפטיים ועוד".
לאור כל אלה יש לחשוב אחרת בתוך הארגון. גושן דיבר על שתי מגמות בולטות: "ארכיטקטורות חדשות של מודלים והיכולת של מודלים להכיל קלט מאוד ארוך שמאוד חשוב למודל, והטרנד השני הוא מעבר ממודלים למערכות AI מתוחכמות, מערכות שיהיו מסוגלות להפיק מסקנות בצורה אמינה ולטפל בשאלות אינפורמטיביות אבל גם לקבל משימות עילאיות ומורכבות כמו מחקר בין מניות".
גושן הציג את החדשנות הארכיטקטונית של AI21 – מודל ה-JAMBA שהושק לפני כמה שבועות ."זה לא רק עוד מודל שהגדילו, אלא מדובר על ארכיטקטורה חדשה שמאפשרת לטפל בקלט מאוד ארוך ולטפל בבעיית היעילות. למשל, לקבל מסמך שלם ארוך או סט של מסמכים ולטפל בשאילתות שמשוות בין מסמכים. המודל מייצר כמות פחותה יותר של הזיות. Jamba יהיה זמין בכל העננים המובילים. חברות עם מידע רגיש מעדיפות מודלי AI בתוך החברה והענן שלהם ומאוד זהירות להוציא לענן הציבורי ולכן מציעים מודלים פרטיים לתוך הארגון וחוות השרתים שלהם".