בעקבות השקת הצ'טבוט בארד: החל מרוץ החימוש בין גוגל ל־OpenAi
בעקבות השקת הצ'טבוט בארד: החל מרוץ החימוש בין גוגל ל־OpenAi
בשבוע שעבר השיקה גוגל את הצ’טבוט בארד והחל המאבק על השליטה בתחום ה־AI. בניגוד ל־ChatGPT שמקורות הידע שלו נעצרים ב־2021, בארד מסוגל בין היתר לתת תשובות עדכניות ולשלב תמונות שיתממשקו לתוכנות עריכה ומפות
הוא הושמץ, נטען עליו שהוא מפגר אחרי המתחרים ושממציא תשובות מוזרות - אולם לאחר כמה שבועות של תקופת ניסוי סגורה גוגל פתחה את צ'טבוט הבינה המלאכותית שלה לשימוש רחב ביותר מ־180 מדינות. ההשקה של המוצר החדש הכניסה אותה באופן מלא לתחרות מול OpenAI ומיקרוסופט כשהיא חושפת שורה של חיזוקים מבוססי בינה מלאכותית (AI) גנרטיבית למוצרי ליבה שלה. אף שמרביתם עדיין לא זמינים, הם כבר מייצרים הבטחה משמעותית: העולם המקוון לא יהיה עוד כפי שהכרנו אותו.
"זו היתה שנה עמוסה מאוד ל־AI", אמר מנכ"ל גוגל סונדאר פיצ'אי בפתח כנס המפתחים השנתי Google I/O שערכה החברה בשבוע שעבר ובו מסרה את ההכרזות השונות. "אנחנו בנקודת תפנית מרגשת, יש לנו הזדמנות להפוך AI למועילה יותר לעסקים, למשתמשים ולכולם. אנחנו מעצבים מחדש את כל מוצרי הליבה שלנו סביב AI".
בעין הציבורית, OpenAI נחשבת לחלוצת תחום הבינה המלאכותית הגנרטיבית, הודות להשקות ציבוריות מדוברות של שני מוצרים בולטים: מחולל התמונות Dall-E והצ'טבוט ChatGPT. אולם, Dall-E, לפחות הגרסה שלו שזמינה לציבור הרחב, כבר נחשב למפגר וחלש לעומת מחוללים כמו midjourney שמספקים תוצאות מרשימות הרבה יותר, ובכל הנוגע למודלי שיחה גדולים - גוגל נמצאת בתחום לא פחות זמן והצליחה, לפחות כלפי פנים, לספק תוצאות מרשימות מאוד. כמה מרשימות? ביוני שעבר טען מהנדס בגוגל שמודל השיחה הגדול (LLM) של החברה, LaMDA, פיתח מודעות, עד כדי כך הוא התרשם מיכולות השיחה שלו.
LaMDA הוא המודל שנמצא מתחת למכסה המנוע של בארד, ועכשיו יכולים כולם להתרשם האם הוא אכן תבוני או רק עושה הצגה ממש טובה. החל משבוע שעבר, בארד זמין למשתמשים ביותר מ־180 מדינות, כאשר לצד אנגלית הוא יכול לשוחח גם בקוריאנית וביפנית. בקרוב צפוי בארד לתמוך ב־40 שפות בסך הכל, כולל עברית.
אף שלכאורה הוא מציע יכולות דומות לאלו של ChatGPT, יש לבארד כמה יתרונות ברורים: ראשית, הוא נגיש יותר - מספיק חשבון גוגל שלמרבית הגולשים כבר יש. שנית, מאגר המידע שלו מעודכן על בסיס יומי, בניגוד לזה של ChatGPT שנעצר ב־2021, ולכן הוא מסוגל לספק תשובות רלבנטיות לשאלות אקטואליות. גם האינטגרציה של GPT בבינג מספקת יכולות דומות, וגם היא נפתחה לאחרונה לקהל הרחב, אבל שימוש ביכולות אלו מחייב התקנה של דפדפן אדג', שנכון להיום מחזיק בנתח שוק של פחות מ־5%, מה שיוצר מחסום נוסף בגישה אליו. אף שבארד לא מציג יכולות חדשות, הוא נגיש יותר או מעודכן יותר מהתחרות, וזו תהיה הזדמנות ראשונה בעבור רבים להתנסות בקלות בצ'טבוט AI מתקדם.
במקביל הכריזה גוגל על כמה יכולות חדשות לצ'טבוט, שישולבו בו בתקופה הקרובה. בתחום הוויזואלי, בארד יהיה מסוגל לעשות שימוש בגוגל חיפוש כדי למצוא תמונות רלבנטיות בהתאם לשאילתה. למשל, במענה לשאילתה כמו איך נראה הרובע הצרפתי בניו אורלינס, יידע בארד לשלוף תמונות ולשלב אותן במענה שלו. במקביל יוכל בארד לספק מענה לשאילתות שמשלבות תמונה, כמו בקשה לתת כיתוב מצחיק לתמונה של שני כלבים. לשאילתות בעלות הקשר גיאוגרפי (למשל, אתרי קולג'ים מומלצים באזור מסוים), בארד יוכל להציג את מיקומם על מפה. אפשר יהיה לבקש ממנו להפוך את תצורת המענה לטבלה ולהוסיף בה עמודות שונות, ואז לייצא את התוצאה לתוכנת גיליון נתונים. הוא גם יוכל להתממשק לשירותים שונים כמו אינסטקרט או תוכנות עריכה גרפית של אדובי.
יכולות הבינה המלאכותית־גנרטיבית ישולבו גם בצורה עמוקה במנוע החיפוש של גוגל, בדמות מענה טקסטואלי מבוסס מודל שיחה שיופיע בראש התוצאות של שאילתות רלנטיות ומורכבות, לצד תמונות מתאימות ואפשרות להרחיב את המענה הראשוני, או הפניות למומחים או לחוויות משתמשים. בחיפוש אחרי מוצר (כמו אופניים לרכיבת הרים לאורך 10 ק"מ) יוצג סיכום של מאפיינים חשובים שצריכים להיות במוצר, לצד אופניים מומלצים ומחירם, ולבסוף אפשרות לשאול שאלת המשך.
בחירה בשאלת המשך תשלח את המשתמש למוד שיחה, שפועל בדומה לשיחה עם ChatGPT אך מסוגל לשלב מידע עדכני מהרשת. יכולות אלו בחיפוש של גוגל מאפשרות גם ליצור פוסטים למדיה חברתית, לחולל בוחן אישי או להמציא שם למועדון רכיבה. באירוע הדגימה גוגל איך היכולת משיבה על שאלה כמו "למה לוויינים אוהבים לשיר", בטקסט שכולל כמה נקודות עיקריות, עם אפשרות להרחיב את המענה וקישורים לתוצאות מהרשת.
וגוגל צפויה להציג יכולות AI גנרטיבית בעוד שורה ארוכה של מוצרים ושירותים. בג'ימייל ניתן יהיה להשתמש ביכולת של מודל שיחה בפונקציה שמכונה Help Me Write ומסוגלת לחולל מיילים מלאים בהתאם להוראות קצרים. לדוגמה, אם התקבלה הודעה מחברת התעופה על ביטול טיסה, אפשר יהיה לבקש מג'ימייל לכתוב מייל תגובה שמבקש החזר מלא. המייל שיחולל יכלול פרטי רלבנטיים כמו נתוני הטיסה, ואפשר יהיה לבקש התאמות שונות, למשל מענה מורכב יותר.
בגוגל מפות משיקה גוגל אפשרות לצפות במסלול נסיעה מתוכנן ב־Imeersive View, מוד שמאפשר לצפות בכל מסלול הנסיעה כמעט מנקודת המבט של הרכב, בתוספת משתנים כמו מזג אוויר ועומסים שמוצגים בצורה חיה על המסלול. יושק עד סוף השנה ב־15 ערים גדולות, ובהן לונדון, ניו יורק וטוקיו. בגוגל תמונות ניתן להשתמש ב־AI לביצוע עריכות בתמונה, למשל הסרת פריטים לא רצויים כמו רצועת תיק או עננים שברקע, ואפילו שינוי מיקום של אנשים ועצמים בתמונה, כאשר מודל ה־AI יכול להשלים פריטים חתוכים. התכונה תושק בהמשך השנה.
לחבילת היישומים המשרדיים שלה הציגה גוגל יכולת שתציע למשתמש פרומפטים רלבנטיים בהתאם לפעילותו, שאותם ניתן להזין למודל AI. כך, למשל, במקרה של כתיבת סיפור ניתן להפעיל את המודל שיסרוק את הטקסט ויציע כמו פרומפטים אפשריים שניתן להזין למודל להשלמת הסיפור, לצד אפשרות להזין פרומפט בצורה חופשית.
גם אנדרואיד מקבלת קצת יכולות בינה מלאכותית גנרטיבית: Magic Compose תאפשר לשפצר הודעות שניסח משתמש לפי מצבים שונים, כמו לתת להודעה טון עליז יותר. במסך הנעילה עושה גוגל שימוש ביכולות AI להפיכת תמונת רגילות לתמונות רקע בעלות אפקט תלת־ממדי שמגיב לזווית שבה מוחזק המכשיר. אם אין לכם תמונה מתאימה, אפשר יהיה ליצור תמונה מבוססת AI על סמך הוראות טקסט פשוטות. היכולות יהיו זמינות בהמשך השנה.
מהפכת הבינה המלאכותית הגנרטיבית רק בראשיתה, והמאמץ האמיתי להנגיש את היכולות שלה לציבור הרחב באמצעות שילובן במוצרים ושירותים שבהם הוא עושה שימוש יומיומי בקושי יצא לדרך. גוגל, כך טענו מבקרים, מפגרת אחרי התחרות ביכולות המודלים שלה. אבל השאלה היא לא האם המודלים של גוגל פחות טובים משל המתחרים, אלא האם הם טובים מספיק על מנת לענות על צורכי המשתמשים ולמנוע מהם לנזול לשירותים אחרים. וזו שאלה שגוגל לא תתקשה להציב לה תשובה ראויה.