פיתוח חדש של MIT יוכל לחולל מהפכה בהפעלה הקולית
החוקרים פיתחו מתקן נייד שמזהה גם דיבור שקט במיוחד ע"ב חיישנים שמונחים על עצם הלסת - מה שיאפשר הפעלה קולית גם בסביבות רועשות במיוחד. המטרה: להמציא ממשק טבעי טוב יותר מהכלים של גוגל, אמזון והאחרות
חברות טכנולוגיה רבות מקדמות מערכות הפעלה קולית: אלקסה של אמזון, אסיסטנט של גוגל, סירי של אפל וקורטנה של מיקרוסופט מסוגלות להבין מה שאנחנו אומרים להן ולבצע פעולות בהתאם - חוץ מכשהן לא מצליחות, ואז מבקשות מאיתנו בנימוס לחזור על דברינו. חוקרים מ-MIT הדגימו את הדור הבא של הממשק הטבעי: זיהוי דיבור שקט במיוחד.
- המדענים של הפנטגון מציגים: מכשיר שיהפוך אתכם לחכמים יותר
- כוח טבע: חוקרים פיתחו לוחות עץ חזקים כפלדה וטיטניום
- חיישן על שן: צ'יפ קטן יספר לרופא מה אכלתם ומתי
המכון הטכנולוגי הדגים את AlterEgo, מעין אוזניה שמצמידים לעצם הלסת. הפיתוח, שהוצג בטעות ככזה שיכול "לקרוא מחשבות", מתבסס על מערך חיישנים רגיש במיוחד שמזהה את דברי המשתמש, גם אם מלמל אותם לעצמו או לחש. ב-MIT מכנים את הפיתוח "ממשק לביש לדיבור חרישי".
בשלב זה לא ניתן לבצע פעולות מורכבות יותר מלנווט בתפריטי נטפליקס, למשל - אבל החוקרים אופטימיים ומלמדים את המערכת שלהם יכולות חדשות. אנשי MIT בחנו את ההתקן החדש על עשרה נסיינים והשיגו דיוק של 92% בזיהוי הפקודות. מדובר בנתון שלא נופל משל מערכות זיהוי דיבור בסביבות מבוקרות (וטוב משלהן בסביבה רועשת, כמו משרד או סלון ובו מספר אנשים).
הפיתוח של MIT יכול לקחת את הממשקים הטבעיים לשלב הבא, משום שאינו תלוי בהשפעות סביבתיות כלל: אם אלקסה של אמזון תזהה את הפקודות שאמרתם כל עוד דיברתם די ברור, במרחק קרוב דיו למיקרופונים - הרי שמערכת כמו AlterEgo תוכל לפעול ללא מגבלות סביבה.
בשלב זה מדובר בפיתוח מרשים אם כי בוסרי, וכזה שאינו בשל להפוך למוצר. בנוסף, ההתקן עצמו גדול ומסורבל למראה ולא סביר שאנשים ירגישו בנוח להסתובב איתו בבית או במשרד.