$
מכשירים ומדריכים

פיתוח חדש של MIT יוכל לחולל מהפכה בהפעלה הקולית

החוקרים פיתחו מתקן נייד שמזהה גם דיבור שקט במיוחד ע"ב חיישנים שמונחים על עצם הלסת - מה שיאפשר הפעלה קולית גם בסביבות רועשות במיוחד. המטרה: להמציא ממשק טבעי טוב יותר מהכלים של גוגל, אמזון והאחרות

ניצן סדן 22:1609.04.18

חברות טכנולוגיה רבות מקדמות מערכות הפעלה קולית: אלקסה של אמזון, אסיסטנט של גוגל, סירי של אפל וקורטנה של מיקרוסופט מסוגלות להבין מה שאנחנו אומרים להן ולבצע פעולות בהתאם - חוץ מכשהן לא מצליחות, ואז מבקשות מאיתנו בנימוס לחזור על דברינו. חוקרים מ-MIT הדגימו את הדור הבא של הממשק הטבעי: זיהוי דיבור שקט במיוחד.

 

 

המכון הטכנולוגי הדגים את AlterEgo, מעין אוזניה שמצמידים לעצם הלסת. הפיתוח, שהוצג בטעות ככזה שיכול "לקרוא מחשבות", מתבסס על מערך חיישנים רגיש במיוחד שמזהה את דברי המשתמש, גם אם מלמל אותם לעצמו או לחש. ב-MIT מכנים את הפיתוח "ממשק לביש לדיבור חרישי".

  

 

 

 

בשלב זה לא ניתן לבצע פעולות מורכבות יותר מלנווט בתפריטי נטפליקס, למשל - אבל החוקרים אופטימיים ומלמדים את המערכת שלהם יכולות חדשות. אנשי MIT בחנו את ההתקן החדש על עשרה נסיינים והשיגו דיוק של 92% בזיהוי הפקודות. מדובר בנתון שלא נופל משל מערכות זיהוי דיבור בסביבות מבוקרות (וטוב משלהן בסביבה רועשת, כמו משרד או סלון ובו מספר אנשים).

 

מערכת AlterEgo של MIT מערכת AlterEgo של MIT צילום: MIT

 

 

הפיתוח של MIT יכול לקחת את הממשקים הטבעיים לשלב הבא, משום שאינו תלוי בהשפעות סביבתיות כלל: אם אלקסה של אמזון תזהה את הפקודות שאמרתם כל עוד דיברתם די ברור, במרחק קרוב דיו למיקרופונים - הרי שמערכת כמו AlterEgo תוכל לפעול ללא מגבלות סביבה.  

 

 

בשלב זה מדובר בפיתוח מרשים אם כי בוסרי, וכזה שאינו בשל להפוך למוצר. בנוסף, ההתקן עצמו גדול ומסורבל למראה ולא סביר שאנשים ירגישו בנוח להסתובב איתו בבית או במשרד.

בטל שלח
    לכל התגובות
    x