Алгоритм сокрытия голоса в реальном времени блокирует микрофонный шпионаж

1
Различные детали о FPS, о которых вы должны знать

Исследователи Колумбийского университета разработали новый алгоритм, который может блокировать несанкционированное прослушивание звука через микрофоны в смартфонах, голосовых помощниках и подключенных устройствах в целом.

Алгоритм может работать предиктивно. Он определяет, что пользователь скажет дальше, и в режиме реального времени генерирует препятствующий прослушиванию фоновый шум (шепот), чтобы перекрыть звук.

Пока что система работает только с английским языком и имеет процент успеха около 80%. Громкость шума относительно низкая, что сводит к минимуму беспокойство пользователя и позволяет комфортно вести беседу.

Как показали реальные испытания, система может сделать речь неразличимой для технологии автоматического распознавания речи, независимо от используемого программного обеспечения и положения микрофона.

Объявление университета также обещает, что в будущем разработка будет направлена на изучение большего количества языков, где лингвистика позволяет добиться аналогичных результатов и сделать шепот совершенно незаметным.

Сложная проблема

Микрофоны сегодня встроены практически во все электронные устройства, и пользователи сталкиваются с высоким уровнем автоматического подслушивания, когда получают рекламу товаров, упоминаемых в частных разговорах.

Многие исследователи ранее пытались снизить этот риск, используя белый шум, который до определенного момента мог обмануть автоматические системы распознавания речи.

Однако использование любого из существующих методов сокрытия голоса в реальном времени в практических ситуациях невозможно, поскольку звук требует почти мгновенных вычислений, что невозможно при современном оборудовании, говорят исследователи.

Единственный способ решить эту проблему — разработать прогностическую модель, которая будет следить за человеческой речью, определять ее характеристики и генерировать деструктивный шепот, основываясь на том, какие слова ожидаются следующими.

Нейронный голосовой камуфляж

Основываясь на моделях прогнозирования глубоких нейронных сетей, применяемых для сокрытия потери пакетов, исследователи Колумбийского университета разработали новый алгоритм, основанный на модели, которую они называют «предиктивными атаками».

То есть учитывается каждое произнесенное слово, расшифровке которого обучены модели распознавания речи, предсказывается, когда пользователь произнесет эти слова, и в нужный момент генерируется шепот.

Они обучали свою модель в течение двух дней с помощью восьми графических процессоров NVIDIA RTX 2080Ti на 100-часовом наборе данных речи, который был скорректирован для этой цели с помощью проходов назад и вперед.

Как объясняют исследователи в технической статье, они обнаружили, что оптимальное время предсказания составляет 0,5 секунды в будущее.

В ходе экспериментов алгоритм тестировался с различными системами распознавания речи, и общий уровень ошибок в словах, вызванных шепотом, составил 80%.

Кроме того, ученые представили несколько реалистичных тестов в помещении, а также результирующий текст, идентифицированный системами распознавания речи в каждом случае.

Примечательно, что эксперименты показали, что небольшие слова, такие как «the», «our» и «they», труднее маскировать, в то время как более длинные слова, как правило, легче атаковать алгоритму.

Последствия

Это исследование и разработка системы защиты от подслушивания речи являются доказательством системного сбоя в регулировании против безудержного сбора данных для целевого маркетинга.

Даже если эти системы защиты от шпионажа будут широко применяться в будущем, разработчики ИИ почти наверняка попытаются скорректировать свои методы распознавания, чтобы преодолеть разрушающий шепот или обратить его эффект вспять.

Чем сложнее будет ситуация, тем более непреодолимой станет для людей задача защиты своей частной жизни.

Например, установка дома или в офисе бесшумных средств защиты от подслушивания создает новую точку потенциального риска, поскольку даже если эти средства заслуживают доверия, их использование для получения доступа к прогнозируемым данным в режиме реального времени будет, по сути, косвенным подслушиванием.

Последнее обновление 5 месяцев назад — GameZoom

0 0 голоса
Рейтинг статьи
Подписаться
Уведомить о
guest

0 комментариев
Межтекстовые Отзывы
Посмотреть все комментарии