Пользователи любят обвинять корпорации в том, что те прослушивают их разговоры через умные колонки в маркетинговых целях.
В тех случаях, когда такие факты подтверждаются, любимая отговорка компаний: колонка включилась случайно, среагировав на фразу, которую приняла за кодовое слово.
Исследователи из Ruhr University Bochum и Max Planck Institute for Security and Privacy заинтересовались, как много таких фраз «случайного включения» они смогут найти.
В итоге они обнаружили 1000 фраз, которые приводят к запуску Alexa, Siri, Assistant и Cortana. Порой они весьма неожиданны.
Важный штрих: большое число таких фраз содержится в фильмах, сериалах и телешоу, например, в «Игре престолов», «Карточном домике» и в новостных сводках.
Виновата излишняя проработка чувствительности ПО голосовых помощников, которое ориентировано на распознавание речи владельца даже в условиях помех.
Примеры слов и словосочетаний-триггеров:
Alexa: «недопустимо», «выборы» и «письмо» (unacceptable, election, letter);
Google Home: «Хорошо, круто» и «Хорошо, кто читает» (OK, cool и Okay, who is reading);
Siri: «город» и «эй, Джерри» (a city и hey jerry);
Microsoft Cortana: «Монтана» (Montana).
По словам исследователей, когда устройства запускаются, они записывают часть сказанного и передают эти записи производителю. Затем аудио может быть выборочно расшифровано и проверено сотрудниками в попытке улучшить распознавание слов. Таким образом, фрагменты потенциально приватных разговоров могут попасть в журналы компании.
О скандалах, связанных с этой частью процесса улучшения работы голосовых помощников (на примерах Google, Apple и Microsoft) мы писали ранее неоднократно.
Официальные комментарии на исследование пока дал только Amazon, заверивший, что ложные триггеры «срабатывают только в редких случаях», а системы распознавания речи «улучшаются с каждым днем».
Читайте также на АКБ: