חוקרים שידרו צלילים נסתרים שמשתלטים על סייענים קוליים
לטענת חוקרים מאוניברסיטת ברקלי בקליפורניה, באמצעות שימוש בתדרים שהאוזן האנושית לא שומעת, ניתן לשדר פקודות סמויות למפעילות קוליות של הרמקולים החכמים והסמארטפונים
- גוגל חשפה AI שמטלפנת לעסקים במקומכם, השב"כ מחפש סטארט-אפים
- אמזון רשמה פטנט על האזנה מתמדת מרמקולי האקו
- חברת IBM הופכת את ווטסון לסייען חכם שפונה אליך ביוזמתו
היכולות שפיתחו במחקר, מהוות שדרוג של הביצועים שאליהם הגיעו חוקרים אמריקאים כבר ב-2016. אז, יכלו באמצעות רעש לבן ושימוש בסרטוני יוטיוב להעביר את המכשירים הניידים למצב טיסה או לפתוח חלון גלישה מבלי לגעת בהם או לקבל את הסכמת המשתמש.
ליכולות שכאלו עניין הרבה מעבר להישג האקדמי, בעוד שמנעד הפעולות שמציעות אמזון, גוגל ואפל לבצע באמצעות הסייענים הקוליים שמותקנים באופן מובנה במכשיריהן רק הולך וגדל. פתיחת דלתות הבית, הוספה של מוצרים לרשימת הקנייה, גישה ליישומים פיננסיים, הזמנת אוכל, חיוג, שליחת הודעות ואפילו הזמנת כרטיסי טיסה - כל אלו זמינים כבר היום למשתמשי האלקסה, האסיסטנט וסירי.
מניפולציה ממוחשבת על אותן תוכנות מבלי הצורך ביצירת מגע, פריצה למערכות ואפילו משיכת תשומת ליבם של בעלי המכשירים בזכות התדרים הנסתרים - עלולה להפוך לנקודת תורפה מדאיגה, מדובר בפיתוח, שאם יתבסס, יש בו כדי להערים קשיי קליטה נוספים על תעשיית הפקודות הקוליות, שגם כך סובלת מהפחד מחדשנות, החשש לפרטיות וחבלי לידה נוספים.
מדובר בנקודת תורפה שאם מספיק ידע ומשאבים תוכל להיות יעד אטרקטיבי אפילו עבור פעולות רחבות היקף כמו שימוש בשידורי רדיו, טלוויזיה, סרטוני רשת ועוד, כשכל שידור סאונד עלול לשמש להשתלת המסרים הזדוניים. עם זאת, גם שימוש ברמקולים חזקים בעת נסיעה דרך שכונת מגורים עלולה לספק דרך תקיפה.
רגע לפני שנכנסים למקלטים וחוזרים לנוקיה הישן, יש גם סיבה להירגע. הסייעות הקוליות של אמזון וגוגל, אלקסה ואסיסטנט, משתמשות ביכולות של זיהוי קולי על מנת לאבטח את השירות. כך, ללא זיהוי קולו של האדם שהוגדר כאדונה של התוכנה, זו לא תבצע את הפקודות שמוזנות אליה.
בסירי של אפל, עם זאת, ישנה הגנה בסיסית אבל טובה פחות. בטלפונים הניידים והטאבלטים של אפל, סירי לא מעניקה אפשרות לביצוע פעולות כל עוד המכשיר נעול. ובתגובה לדברים, באפל הוסיפו כי הרמקול החכם שלה - ההוםפוד - מנוע מלבצע פעולות כמו פתיחת דלתות. אולם קשה להגיד שהסבר זה מהווה מסר מרגיע.
בעקבות ניסיונות ראשוניים שכבר בוצעו בתעשיית הטלוויזיה והבידור, יש כבר מי שהשתמשו בצלילים מוקלטים בכדי לגרום לסמאטרפונים של הצופים לבצע פעולות מתוכננות. כך למשל, עשו יוצרי הסדרה סאות'פארק שימוש במשך פרק שלם בפקודות קוליות שגרמו למכשירי הצופים לחזור שוב ושוב על אמירות כמו " adolescent obscenities".
שימוש דומה עשתה רשת המזון המהיר ברגר קינג שגרמה לעמודי רשת להיפתח בעת צפייה בסרטון רשת - פתיחה שנועדה לקדם את המכירות של ברגר קינג בקרב קהל הצופים.
בעקבות אותם מקרים ראשוניים, ברשויות בארצות הברית ובאיגודים המקצועיים לטלוויזיה אסרו את השימוש ביכולות האלו. לפי בחינת אותן רשויות את הנושא, פעילות שכזו היא התערבות זדונית באמצעים פרטיים של הצופים כשהיא נוגדת את טובת הציבור.