מבינה עניין: טכנולוגיית הזיהוי הקולי של מיקרוסופט הגיעה לרמת דיוק אנושית
חוקרי הבינה המלאכותית של החברה הכריזו שהטכנולוגיה שפיתחו הגיעה לרמת דיוק של 95% בזיהוי מילים, בדיוק כמו תמלילנים אנושיים מקצועיים. אך זו רק אבן דרך ראשונה בתחום שהשאיפה המרכזית בו היא הבנה ולא זיהוי בלבד
מיקרוסופט פרסמה אתמול (ג') הודעה על "נקודת ציון היסטורית", אליה הגיעה לטענתה. מחקר שפורסם על ידי חוקרי בינה מלאכותית של החברה סיכם שטכנולוגיית הזיהוי הקולי שלה NIST 2000 מגיעה לרמת דיוק של כ-95%, זאת אומרת כמו זו של תמלילנים מקצועיים שרמת השגיאות שלהם עומדת על כ-5.9%. החברה הסבירה שהטכנולוגיה שלה יכולה כעת לזהות מילים במהלך שיחה באותה רמת דיוק כמו אדם.
- החשש הציבורי מבינה מלאכותית גורם לחברות הטכנולוגיה לשתף פעולה
- Facebook at Work פותחת מלחמה חזיתית עם סלאק ומיקרוסופט
- עמק הסיליקון פינת דרך השלום: מיקרוסופט עוברת למתחם תוצרת הארץ בת"א
זאת ועוד, החברה לא הרחיבה על היכולת של הטכנולוגיה לזהות שפות או קולות, אלא רק על ההבנה של המילים שנאמרות בתנאי מעבדה. כמובן שיש להמתין ולראות כיצד היא תתמודד עם מצבים מחיי היומיום כמו הבנה של דוברים בעלי מבטא כבד או שיבושי לשון. בנוסף, הטכנולוגיה עדיין לא מסוגלת להבין את ההקשרים ואת משמעות המילים.
הבנת המשמעות היא למעשה הפתח שדרכו יהפכו מערכות זיהוי הקול לממשק העיקרי דרכו ננהל את ההתקנים בעתיד. רמת דיוק וזיהוי של 95% מספקת יכולת ראשונית חשובה עבור מערכות אלה. השלב הבא, הבנת המשמעות, יהפוך את הזיהוי לממשק אמיתי שיידע לבצע פעולות על בסיס בקשות.
כבר כיום ניתן לבצע פעולות מוגבלות כגון ייזום שיחה או שליחת הודעה בסמארטפונים תוך שימוש במערכות הסיוע הדיגיטליות כגון סירי או גוגל Now. אך סדרה של פקודות שיתבססו על משפט בשפה טבעית עדיין אינו בין הכישרונות שלהן.