С небольшой помощью труб из ПВХ исследователи из Висконсина обманули некоторые системы голосовой идентификации
2024-01-08 09:00
Шимаа Ахмед — аспирант Университета Вашингтона в Мэдисоне. Она исследовала, можно ли изменить резонанс или определенные частотные колебания голоса, чтобы обойти устройства автоматической идентификации говорящего.
Можно ли обмануть компьютерные системы, использующие голос человека в качестве пароля? Некоторые инженеры из Висконсина говорят, что ответ положительный, и что они сделали это частично с помощью пластиковой трубы, которую можно найти в хозяйственном магазине.
Некоторые системы онлайн-банкинга используют автоматическую идентификацию говорящего — проще говоря — голос владельца счета в качестве пароля. Профессор электротехники и компьютерной техники UW-Мэдисон Кассем Фаваз говорит, что пользователи Яблоко айфон, вероятно, знакомы с виртуальным помощником Сири, который отвечает только на запросы владельца.
"Причина, по которой Сири отвечает только вам, заключается в том, что они используют технологию, называемую идентификацией говорящего. Таким образом, они получают своего рода голосовой отпечаток, похожий на отпечаток пальца, и могут определить, исходил ли он от вас или от кого-то другого. И именно так Сири может убедиться, что с ней разговаривает пользователь или владелец телефона."— говорит Фаваз.
Но Фаваз и два доктора философии из Университета Вашингтона в Мэдисоне. студенты являются частью усилий нескольких университетов по улучшению цифровой безопасности. Итак, они ищут способы обмануть компьютерные системы. Они и другие уже работают над клонированием человеческого голоса и заставить компьютер говорить, как этот человек.
Совсем недавно, по словам Фаваза, инженеры поняли, что могут отказаться от цифровых технологий и перейти на аналоговые, чтобы обмануть многие системы идентификации говорящих.
"И именно так у нас возникла идея разработать некое аналоговое устройство, не имеющее никакой цифровой электроники и позволяющее выдавать себя за других."— говорит Фаваз.
Кандидат наук. Студентка Шимаа Ахмед говорит, что сначала она попробовала говорить через картонную трубку, которую можно найти во многих рулонах бумажных полотенец, подражая знаменитостям.
"И это сработало. Когда я пропустил голоса некоторых знаменитостей через трубку от кухонных бумажных полотенец, предсказания этих знаменитостей изменились:"Ахмед говорит.
В конце концов Фаваз купил немного пластика.ПВХ трубаиз отдела сантехнических запчастей в хозяйственном магазине, и команда начала его использовать.
Кассам Фаваз, доцент кафедры электротехники и вычислительной техники Инженерного колледжа Университета Висконсин-Мэдисон, на студийном портрете 15 февраля 2022 года. Фаваз — один из двенадцати лауреатов награды «Выдающееся преподавание» 2022 года. Премия (ДТА). (Фото Алтеи Дотзур / Университет штата Вашингтон – Мэдисон)
Фаваз говорит, что они поняли, что у трубок есть недостатки.
"Обычные водопроводные трубы имеют фиксированные размеры, верно? Длину можно контролировать, обрезав ее. Но вы не можете контролировать диаметр. Для некоторых экспериментов нам понадобились трубки особого диаметра, которых нет в Туз Аппаратное обеспечение. Итак, что нам нужно было сделать, чтобы изготовить эти трубки, и самый простой способ изготовить трубки — это напечатать их на 3D-принтере."— говорит Фаваз.
Команда обратилась к тогдашнему студенту, а теперь доктору философии. студент Яш Вани, который напечатал несколько трубок на 3D-принтере. Вани говорит, что эта работа изменила его академический фокус.
"Честно говоря, было очень здорово, что именно так я защитил докторскую диссертацию. Для меня было достаточно круто продолжать это делать,"он говорит.
Исследователи разработали алгоритм или строгие инструкции, которые определяли размеры трубы, необходимые для преобразования резонанса (то есть интенсивности и качества тона) практически любого голоса для имитации другого.
В одной из записей Ахмед читал из обычного набора речевых данных и говорил немного как актриса Лиза Кудроу — ну, вы знаете, Фиби из Друзья.
"На камне ничего не было,"пошел читать. Ахмед также попробовал подражать актрисе Келли Рейли, снимающейся в сериале. Йеллоустоун."«Понятия не имею, — ответил Филипп, —"- сказал Ахмед на записи.
Это не были точные имитации. Но они были достаточно хороши, чтобы пройти через фильтры цифровых атак системы голосовой аутентификации и обмануть ее. Инженеры Университета Вашингтона в Мэдисоне, используя в своем эксперименте голоса других студентов, сообщают, что при тестировании с участием 91 голоса они обманывали системы безопасности в 60% случаев.
Достаточно хорошо, чтобы написать статью, а Ахмед представил результаты на симпозиуме по безопасности в этом месяце в Калифорнии.
"Людям было любопытно, как мы можем делать устройства, похожие на трубки, но более сложные, что мы можем выдавать себя за любого человека."Ахмед говорит.
Фаваз говорит, что все производители систем идентификации говорящих — Яблоко, Google, ИБМ, Майкрософт и другие — знают о различных недостатках своих технологий и пытаются их исправить.
Спонсорами исследования UW являются Национальный научный фонд и ДАРПА — крупное исследовательское подразделение Министерства обороны.