הכירו את Read It: הפיתוח הישראלי של גוגל שיקריא לכם את האינטרנט
האפליקציה החדשה של גוגל תאפשר להקריא לכם טקסטים ארוכים מתוך אתרים ואפליקציות בקול טבעי. הפרויקט בוצע במסגרת המעודדת את עובדי החברה להשקיע חמישית מזמן עבודתם בפרויקטים אישיים ועלה במהלך ריצת בוקר
היום (ד') השיקה גוגל באופן רשמי את אפליקציית Read It. זו מאפשרת להקריא טקסטים ארוכים מאוד מתוך אתרים או אפליקציות תוך דקלום בקול טבעי. זאת אומרת שהטקסט נשמע כאילו הוקרא בידי אדם. כולל הפסקות בין פסקה לפסקה והתחשבות בסימני הפיסוק.
- אחרי פייסבוק: גם גוגל מבטלת את כנס המפתחים השנתי
- גוגל קלאוד תפטר עשרות עובדים במסגרת ארגון מחדש
- כולנו שפני ניסוי של החברות הגדולות ברשת - ואין לנו דרך לברוח
האפליקציה מצטרפת לשלל אפליקציות הסיוע של גוגל הפועלות על בסיס בינה מלאכותית, כגון Transcribe לתמליל של טקסטים או Live Caption להוספת כתוביות באנדרואיד. האפליקציה הוצגה לראשונה בכנס ה-CES2020 שנערך לפני מספר חודשים בלאס וגאס והיא חלק מיוזמת פיתוח כלי הסיוע של גוגל.
גוגל לא נוהגת לציין היכן פותחה הטכנולוגיה שלה, אך במקרה הזה היא חרגה ממנהגה. כל הרעיון של האפליקציה והפיתוח שלה, מתברר, התבצע בהובלת יוסי מטיאס, סגן נשיא גוגל ומנכ״ל מרכז המחקר והפיתוח בישראל. הפרויקט הובל בידי רוני אמירה, מנהל קבוצת הפיתוח ודויד קדוש שמנהל את מוצר Read It בחברה.
"האפליקציה נובעת מיוזמת AI for social good (בינה מלאכותית חברתית או לטובת החברה - ר''ק)", אמר יוסי מטיאס בשיחה מקדימה עם כלכליסט לקראת השקת האפליקציה. "יוזמה זו היא חלק מהניסיון שלנו לרתום את הטכנולוגיות החדשות לטובת החברה. אנחנו מנסים לאתר דרכים לפתרון בעיות לאנשים עם מגבלה או קושי. כל זאת במסגרת היעד של גוגל להנגיש את המידע לכולם בצורה פשוטה ויעילה".
"הרעיון עלה במהלך ריצת בוקר אחרי שהקשבתי לשתי הביוגרפיות של איינשטיין וסטיב ג'ובס ורציתי למצוא לעצמי חומר קריאה חדש. רציתי למצוא דרך שתאפשר לי לקרוא חומרים שיש בסמארטפון באופן ממושך. אפליקציות ההקראה הקיימות כיום לא סיפקו את הסחורה והקול הרובוטי לא איפשר לי להקשיב לטקסט לאורך זמן".
מטיאס פנה למנהל קבוצת הפיתוח רוני אמירה שבימים כתיקונם עוסק בנושא הרפואה הדיגיטלית. "יוסי דיבר איתי ליד עמדת הקפה וכך עלה הרעיון", אמר, "בניתי את האבטיפוס הראשוני ומשם זה היה נראה כמו התחלה טובה שממנה ניתן להמשיך הלאה. פניתי לגוגל לביקש עזרה והקמנו קבוצה קטנה שתתעסק בזה".
הפרויקט בוצע במסגרת מדיניות "20% מהזמן" של גוגל המעודדת את העובדים להשקיע חמישית מזמנם בפרויקטים אישיים, כפי שרבים ממיזמי החברה נולדו מפרויקטים שכאלה. "המוצר הוא סינרגיה של הרבה מאוד מוצרים שגוגל מפתחת. אסיסטנט, זיהוי דיבור, TTS ועוד. כשאדם רוצה לשמוע תוכן מסוים אנחנו ננגיש לו את התוכן. אנחנו רוצים להפוך כל טקסט או אתר אינטרנט זמין לכולם – מה שאפשר לקרוא, אפשר גם לשמוע", מסביר אמירה.
את המטרה משיגים דרך גוגל אסיסטנט, הסייענית הדיגיטלית של החברה. כלי הבינה המלאכותית שלה מפעילים את האפליקציה דרך טכנולוגיית ה-NLP (יישום שפה טבעית) של גוגל. עם זאת, האפליקציה עדיין נמצאת בפיתוח. "לא ניתן להקריא כרגע בעברית, אבל ב-42 שפות כן. עברית היא שפה בעייתית כי היא נכתבת ללא ניקוד. כדי להבין איך קוראים מילה צריך את ההקשר של המשפט", מסביר מנהל המוצר דויד קדוש.
"גם לא כל הדפים ניתנים לקריאה. הטקסט צריך להיראות כמו כתבה. כך שלא ניתן להקריא תוצאות ספורט או טבלאות כי זה לא קולח. פיתחנו אלגוריתמים המסוגלים לנתח את הדפים ולספק את יכולת ההקראה", הסביר. עוד מגבלה היא שהפעלת התכונה מתבצעת בינתיים על ידי פקודה קולית באנגלית בלבד. אבל בגוגל כבר עובדים קשה על פיתוח טכנולוגיית הבנת ההקשר - מה שתיאורטית אמור לפתור בעתיד לא מעט מהבעיות שישנן כיום עם שפות כגון עברית.
מטיאס אופטימי שגוגל תמצא דרך להנגיש את העברית בהמשך, אך זה ידרוש זמן פיתוח מסוים, כך שקשה לדעת מתי האפשרות הזו תהיה זמינה לדוברי עברית לעת עתה. את אפליקציית Read It, שנראית פשוטה למראה, לקח כ-3 שנים לפתח. עם זאת לא מדובר באפליקציה בלבד. זו גם תושק עם API (ממשק תוכנה) למפתחים וניתן יהיה לשלב אותה באפליקציות שונות ואפילו באתרים תוך צירוף של שורות קוד בודדות בלבד. לדברי מטיאס Read It כבר החלו לעבוד עם מו''לים של אתרים חיצוניים שירצו לשלב את היכולת אצלם.
אפליקציית Read It היא חלק מהרעיון של בינה סביבתית. זו מתחברת לתפיסה העיקרית של גוגל כיום - מחשוב סביבתי - Ambient Computing - במסגרתה החברה רואה את הטכנולוגיה כמשהו שקיים ברקע ומסייע למשתמשים רק כשהם דורשים את העזרה. תפיסה זו הוצגה באירוע הצגת מוצרי הפיקסל האחרון ונראה שבחברה מעוניינים להרחיב אותו גם לשימוש יומיומי במכשירים שאינם רק made by Google.