Ilustrační snímek

Ilustrační snímek

Ověření totožnosti hlasem nepřelstí imitátor ani počítač, říká expert

  • 22
Lidský hlas je stejně jedinečný jako otisk prstu. Speciální software dokáže rozpoznat, kdo mluví. „Algoritmus, který dnes používáme, je schopen rozlišit tisíc různých charakteristik hlasu,“ říká Břetislav Beránek, ředitel pro bezpečnostní systémy americké firmy Nuance. Ověření totožnosti volajícího pomocí hlasem začne ve svém call centru využívat Česká spořitelna.

Jaké jsou největší výhody hlasové biometrie proti jiným metodám ověření?
Když to srovnáme s PIN nebo heslem, je to pro klienty lehčí, nemusejí si nic pamatovat. Jenom mluví. A na rozdíl od ověření pomocí otisku prstu či obličejem, nejsou připoutáni k jednomu zařízení, funguje to odkudkoliv. Otisk prstu může být nejlehčí způsob, jak se dostat do aplikace, hlasová biometrie pak poskytne druhý stupeň ověření pro rizikovější transakce. U otisku prstu neexistuje žádná detekce podvodného přístupu, s pomocí škodlivého kódu může útočník ovládnout celý telefon a uživatel se to nedozví. To je největší slabina biometrických systémů, které jsou vázány na konkrétní zařízení.

V případě hlasové biometrie se zase útočník může dostat na server, kde jsou nahrávky...
Teoreticky je to možné. Samotný hlasový vzorek ale hackerům nijak nepomůže k prolomení hlasové biometrie. Systém umí detekovat, zda mluví s živým člověkem nebo s nahrávkou sestříhanou z nahraných hlasových vzorků. Navíc bezpečnostní opatření v podnikovém prostředí jsou mnohem větší než na zařízení. Ve firmách na tom obvykle pracují celé týmy. Na konferencích se často zmiňuje, že až 98 procent zařízení s operačním systémem Android má v sobě nějaký škodlivý kód, malware.

Podvodníci dostali novou překážku, banka ověřuje totožnost podle hlasu

Proč tedy Google nebo Apple nejdou směrem hlasové biometrie?
Oni hlasovou biometrii mají také, ale používají ji pro virtuální asistenty. Umí rozpoznat váš hlas. Ale spíše než bezpečnostní opatření je to užitečná věc. Je možné, že bezpečnostní prvky jednou zahrnou, ale jejich byznys model není stejný jako náš. Jejich cílem je prodat víc zařízení, my nabízíme bezpečnostní systémy pro podniky.

Je aplikace hlasové biometrie dražší než ostatní metody?
Záleží, jak se to počítá. U otisku prstu musí mít každý přístroj senzor, čtečku, která není levná. U hlasové biometrie je investice pro podniky celkem velká, ale když to rozpočítáte na všechny uživatele a zákazníky, kteří to využijí, už to začne být zajímavější. Pokud to firma používá v call centru, uspoří náklady. Naši klienti, například ve Velké Británii, ušetřili miliony dolarů za provozní náklady a výdaje na bezpečnost.

Kdo jsou vaši klienti?
Máme více než 500 klientů po celém světě, kteří používají hlasovou biometrii. Jsou to hlavně banky, ve Velké Británii máme například HSBC, v Kanadě Royal Bank of Canada, v USA Wells Fargo, na Slovensku Tatra banku. A také telefoničtí operátoři jako Vodafone, T-Mobile, Verizon, ale ne v Česku.

Hlasová biometrie se dnes používá hlavně v anglicky mluvících zemích. Ale myslím, že až to Česká spořitelna začne používat, obrátí se na nás i další firmy. Z jiných zemí máme zkušenost, že to jde docela rychle. Podvodníci se obvykle zaměřují na ty největší firmy, a když to ten největší nainstaluje, začnou útočit na toho druhého či třetího. Třeba ve Velké Británii to v roce 2012 nainstalovala Barclays a v dalších bankách začaly rychle narůstat ztráty způsobené podvodnými útoky.

Jak to přesně funguje? Dostane klient nějaký text, který musí přečíst, aby se v bance uložil jeho hlasový vzorek, který se pak porovnává?
Vzorek se vytvoří během běžného rozhovoru s operátorem na lince. Zavoláte do banky, například chcete udělat nějakou změnu, hovor se nahraje, zpracuje a vytvoří se vzorek. Když zavoláte podruhé, už je možné vás podle vzorku identifikovat.

Břetislav Beránek (36)

  • Je ředitelem pro bezpečnostní systémy v americké softwarové společnosti Nuance. Narodil se v Československu, ale když mu byly dva roky, přestěhoval se s rodiči do Kanady.
  • Vystudoval řízení na McGill University v Montrealu a podnikání na prestižní Massachusetts Institute of Technology v Bostonu. Kariéru v oblasti bezpečnostních systémů odstartoval před 16 lety v montrealské firmě Genetec, která se zabývá sledováním pomocí videa. Mimo jiné řídil globální expanzi, včetně nasazení video monitorování na pražském letišti.
  • Spoluzakládal společnost Viion Systems, která se zabývá rozpoznáváním obličeje, patenty v roce 2010 prodali. Vedle své současné pozice je také v představenstvu dvou kanadských startupů.

Jak dlouhý ten text musí být, abyste mohli vzorek použít?
Teoreticky nám stačí sekunda nahrávky, ale pak nebude ten vzorek zcela kvalitní. Ideálně je to 30 až 60 sekund, jak je to i v České spořitelně. Nesmí to být čtený text, protože ve vzorku musejí být i různé modulace. Hlasová biometrie se odlišuje od prostého rozpoznání textu. Tam je důležité, co říkáte, ale my potřebujeme vědět, jak to říkáte. Je jedno, o čem text je, operátoři mohou lidi rozmluvit i běžnými konverzačními dotazy.

Kde jinde se dá, kromě zákaznických center, hlasová biometrie využít?
I v mobilních aplikacích. Ale v Česku to zatím nebylo spuštěno. Třeba jedna z australských bank to bere jako dodatečné ověření pro komplikovanější operace, které z hlediska bezpečnosti nepovažuje za bezpečné. Třeba pro platby na vyšší částky, řekněme přes 10 tisíc dolarů. Ale hlasovou biometrii používají už dlouho také vlády, tajné služby, bezpečnostní složky či armáda. Je to stejná technologie, která se používá i v bankovních aplikacích. A pokud jsou schopny identifikovat někoho s pomocí hlasu, je to pro ně velký pomocník při vyšetřování.

A kde vláda získá ten vzorek, s nímž pak hlas porovnává?
Ve Velké Británii existuje poměrně široká spolupráce mezi bankami a bezpečnostními složkami. A 12 lidí už na základě hlasu bylo zadrženo a vyšetřováno. Banka poskytla vyšetřovatelům hlasový vzorek a policie díky němu zločince dopadla. Na rozdíl od druhého možného způsobu, což jsou zákonné odposlechy celých telefonických rozhovorů podezřelého, získá policie v tomto případě méně osobních informací. Takže je to menší zásah do soukromí.

Kdyby třeba člověk mluvil cizím jazykem, dokážete správně rozpoznat jeho hlas?
Stačí mít nahraný vzorek jen v jednom jazyce. Testoval jsem to i češtině – ve které nemluvím tak plynule jako anglicky nebo francouzsky – ale přesto mě hlasová biometrie rozpozná. Fyzické charakteristiky jsou stejné, tvar a velikost hrtanu, i všechny orgány, kudy hlas jde. Charakteristiky týkající se chování mohou být trochu odlišné, ale jsme schopni rozpoznat, jaké rozdíly jsou přirozené a jaké jsou nepřirozené. Když jste ve velkém stresu, možná budete mluvit rychleji, to je přirozená změna chování a algoritmus si s tím poradí.

A umí se adaptovat i na nepřirozené změny – třeba lidé, kteří podstupují změnu pohlaví a vlivem hormonální terapie se jim mění hlas. Hlasový vzorek se adaptuje. Platí to i obecně, čím častěji člověk hlasovou biometrii používá, tím lepší pak je výsledek. S hlasovými vzorky se průběžně pracuje, kalibrují se.

Obejít hlasovou biometrii je pro zločince nákladné

Co jsou fyzické charakteristiky, které zkoumáte?
Algoritmus, který dnes používáme, je schopen poznat tisíc různých charakteristik hlasu. Když se podíváme na většinu čtečku prstu, tak je 25 bodů, které se měří. Náš systém pozná, když vám vypadne zub, má to vliv – nepatrný – na hlas. Nejdůležitější je ale hrtan, protože tam hlas vzniká. Dělali jsme i testy u jednovaječných dvojčat, která mají podobné hlasy. Technologie je vždycky schopná to rozpoznat, ale rozdíly mezi nimi jsou malé, systém musí taky mít nějakou toleranci.

Když se někdo pokusí napodobit můj hlas – třeba imitátor – jaká je pravděpodobnost, že uspěje?
Imitátoři mohou změnit behaviorální charakteristiky, začnou mluvit stejně jako vy, ale fyzické charakteristiky nejsou schopni změnit. Hlasová biometrie s tím proto nemá problém. Pro lidské ucho to možná zní stejně, ale algoritmy jsou schopny rozpoznat, že charakteristiky jsou úplně jiné.

A co zvuková nahrávka?
I v tomto případě by bylo problematické systém podvést. Hlavní algoritmus sice řekne, ano, to je hlas toho člověka, fyzikální i behaviorální charakteristiky jsou stejné, ale pak existují i jiné algoritmy, které dokáží rozpoznat, že jde o nahrávku. I lidské ucho pozná, že nahrávka není živý hlas. Chybí v ní například hlasové frekvence na okrajích spektra, hloubky a výšky. Dochází ke ztrátě dat během nahrávky i při přehrávání.

Ale pak existují i syntetické hlasy, kdy konkrétní lidský hlas napodobuje počítač...
K tomu zase existují další algoritmy. Navíc pokud by podvodník chtěl postupovat tímto způsobem, v call centru to velmi pravděpodobně odhalí operátor na lince, rozpozná, že něco není v pořádku. První implementace hlasové biometrie je z roku 2001 a od té doby jsme neměli žádný úspěšný podvodný útok s nahrávkou či syntetickým hlasem. Neříkám, že to není možné, teoreticky jde všechno, ale počítáme i s tím, že obejít hlasovou biometrii je pro zločince nákladnější než třeba s pomocí malware, který nainstaluje do telefonu zákazníka. Naše systémy stavíme od počátku tak, aby se útočník nedostal dovnitř, ani když někde získá nahrávky vašeho hlasu.

Jak často se stává, že systém správně nerozpozná hlas, odmítne ověření?
U finančních institucí se falešné odmítnutí může pohybovat kolem dvou až čtyř procent, protože chceme mít velkou úroveň bezpečnosti, aby se do systému nebyli schopni dostat podvodníci. U telefonních operátorů není to riziko tak vysoké, tam to může být o něco nižší, kolem jednoho procenta.

Jaká budoucnost čeká hlasovou biometrii?
Velký potenciál je například u virtuálních asistentů. Třeba Alexu vytvořil Amazon hlavně proto, aby usnadnil nákup přes internet. Ale lidé budou od virtuálních asistentů požadovat víc a s tím porostou i nároky na bezpečnost. Budoucnost je i v asistentech v autech. Naši klienti jsou i některé německé automobilky. Vznikají systémy, kdy bude možné ovládat řadu systémů pomocí hlasu. Aplikace podle hlasu pozná, kdo řídí, a podle toho nastaví třeba klimatizace nebo pustí oblíbenou hudbu. A hlasem půjde například systém použít třeba na bankovní operace či na update statusů na sociálních sítích.

Mluvíte ještě s někým z Česka, kdo by mohl začít používat vaše řešení?Mluvíme se spoustou organizací, ale zatím nemohu říct nic konkrétnějšího.