Умные колонки включаются из-за 1000 случайных фраз

Опубликовано 03.07.2020 at 16:30 | admin

Пользователи любят обвинять корпорации в том, что те прослушивают их разговоры через умные колонки в маркетинговых целях.

В тех случаях, когда такие факты подтверждаются, любимая отговорка компаний: колонка включилась случайно, среагировав на фразу, которую приняла за кодовое слово.

Исследователи из Ruhr University Bochum и Max Planck Institute for Security and Privacy заинтересовались, как много таких фраз «случайного включения» они смогут найти.

В итоге они обнаружили 1000 фраз, которые приводят к запуску Alexa, Siri, Assistant и Cortana. Порой они весьма неожиданны.

Важный штрих: большое число таких фраз содержится в фильмах, сериалах и телешоу, например, в «Игре престолов», «Карточном домике» и в новостных сводках.

Виновата излишняя проработка чувствительности ПО голосовых помощников, которое ориентировано на распознавание речи владельца даже в условиях помех.

Примеры слов и словосочетаний-триггеров:

Alexa: «недопустимо», «выборы» и «письмо» (unacceptable, election, letter);

Google Home: «Хорошо, круто» и «Хорошо, кто читает» (OK, cool и Okay, who is reading);

Siri: «город» и «эй, Джерри» (a city и hey jerry);

Microsoft Cortana: «Монтана» (Montana).

По словам исследователей, когда устройства запускаются, они записывают часть сказанного и передают эти записи производителю. Затем аудио может быть выборочно расшифровано и проверено сотрудниками в попытке улучшить распознавание слов. Таким образом, фрагменты потенциально приватных разговоров могут попасть в журналы компании.

О скандалах, связанных с этой частью процесса улучшения работы голосовых помощников (на примерах Google, Apple и Microsoft) мы писали ранее неоднократно.

Официальные комментарии на исследование пока дал только Amazon, заверивший, что ложные триггеры «срабатывают только в редких случаях», а системы распознавания речи «улучшаются с каждым днем».