Ученые-компьютерщики из Университета Ватерлоо обнаружили метод атаки, который позволяет успешно обходить системы безопасности голосовой аутентификации с вероятностью успеха до 99% всего после шести попыток.

Голосовая аутентификация, которая позволяет компаниям проверять личность своих клиентов с помощью предположительно уникального «голосового отпечатка», все чаще используется в дистанционном банковском обслуживании, колл—центрах и других критически важных для безопасности сценариях.

«При регистрации на голосовую аутентификацию вас попросят повторить определенную фразу вашим собственным голосом. Затем система извлекает уникальную голосовую подпись (voiceprint) из этой предоставленной фразы и сохраняет ее на сервере», — сказал Андре Кассис, кандидат наук в области компьютерной безопасности и конфиденциальности и ведущий автор исследования, подробно описывающего результаты исследования.

«При будущих попытках аутентификации вас попросят повторить другую фразу, и извлеченные из нее функции сравниваются с голосовым отпечатком, который вы сохранили в системе, чтобы определить, следует ли предоставлять доступ».

После того, как была введена концепция голосовых отпечатков, злоумышленники быстро поняли, что могут использовать программное обеспечение «глубокой подделки» с поддержкой машинного обучения для создания убедительных копий голоса жертвы, используя всего пять минут записанного аудио.

В ответ разработчики ввели «меры противодействия подделке» — проверки, которые могли бы изучить образец речи и определить, был ли он создан человеком или машиной.

Исследователи из университета Ватерлоо разработали метод, который позволяет избежать мер противодействия подделке и может обмануть большинство систем голосовой аутентификации в течение шести попыток. Они определили маркеры в аудио deepfake, которые выдают, что оно сгенерировано компьютером, и написали программу, которая удаляет эти маркеры, делая его неотличимым от подлинного аудио.

В недавнем тестировании системы голосовой аутентификации Amazon Connect они добились 10% успеха за одну четырехсекундную атаку, при этом менее чем за 30 секунд этот показатель вырос до более чем 40%. Используя некоторые из менее сложных систем голосовой аутентификации, на которые они ориентировались, они добились успеха в 99% случаев после шести попыток.

Кассис утверждает, что, хотя голосовая аутентификация, очевидно, лучше, чем отсутствие дополнительной защиты, существующие меры противодействия подделке имеют серьезные недостатки.

«Единственный способ создать защищенную систему — это мыслить как злоумышленник. Если вы этого не сделаете, то вы просто ждете нападения», — сказал Кассис.

Руководитель Kassis, профессор компьютерных наук Урс Хенгартнер добавил: «Продемонстрировав ненадежность голосовой аутентификации, мы надеемся, что компании, полагающиеся на голосовую аутентификацию в качестве единственного фактора аутентификации, рассмотрят возможность внедрения дополнительных или более строгих мер аутентификации».

Исследование Кассиса и доктора Хенгартнера «Нарушение голосовой аутентификации, критически важной для безопасности» было опубликовано в материалах 44-го симпозиума IEEE по безопасности и конфиденциальности.

От c77956