Budoucnost falešných zpráv: za tři roky budou videa nedůvěryhodná

aktualizováno 
Kvůli fotomontážím se už dlouho nedá jen tak věřit fotografiím. Nové technologie povedou ke stejně přesvědčivým manipulacím i v oblasti lidského hlasu a dokonce i videí. Falešné zprávy nedaleké budoucnosti tak mohou obsahovat libovolnou osobnost, která řekne svým hlasem cokoli, co se jí zadá.

Uměle vytvořené video Barracka Obamy | foto: stanford.edu

Šíření falešných zpráv se věnuje poměrně dost pozornosti, zejména v kontextu „ultrastranických“ politických serverů. Na internetu se uchytí i zjevný nesmysl, třeba zpráva o tom, že se dají vědomosti do mozku nahrát jako ve filmu Matrix. S přibývajícími technologickými pokroky a rozvojem umělé inteligence budou ovšem podvrhy čím dál tím přesvědčivější a nebudou se omezovat jen na text nebo fotky upravené v grafickém editoru.

Falešný Obama

Tři výzkumníci z Washingtonské univerzity nedávno předvedli, že to není nijak vzdálená budoucnost. V článku „Synthesizing Obama: Learning Lip Sync from Audio“ popisují, jak zvládli za využití strojového učení (machine learning) vytvořit fotorealistické video minulého amerického prezidenta, jak pronáší některý ze svých prezidentských proslovů. Jejich výsledek je mnohem přesvědčivější než dosavadní pokusy a zároveň potřebuje jako vstupní data jen zvukovou nahrávku řeči.

Podobný projekt ze Stanfordovy univerzity, Face2Face, dokázal v reálném čase přenášet mimiku živého „herce“ do videa, kde stejné pohyby obličeje prováděl například George Bush nebo Arnold Schwarzenegger. U nové metody pak není vůbec potřeba, aby žádané pohyby někdo vykonával, sám je vytvoří z nahraného slovního projevu. Nejprve je však potřeba, aby se algoritmus naučil, jak to má vypadat. Proto byl k imitaci zvolen právě Barack Obama, u kterého jsou veřejně dostupné hodiny videonahrávek proslovů ve vysokém rozlišení. Program se na nich učil, jak hýbe pusou při kterém fonému, stejně jako další prvky jeho mimiky. Poté dokázal tyto pohyby uměle vytvořit jen z audio nahrávky Obamova projevu.

Výzkumníci si zde zjednodušili práci tím, že tuto „syntetizovanou“ pusu a její okolí vložili do existujícího videa Obamova projevu, a nevytvářeli tedy pohyby hlavy ani mimiku horní části obličeje. Ale i toto omezení nabízelo dost využití. Mohli například vzít projev z roku 2016 a velmi přesvědčivě ho vložit do videa o mnoho let mladšího nebo třeba vzít zvukovou stopu z nějakého rozhovoru s prezidentem a udělat z ní oficiální televizní projev. Možnosti podvrhu jsou zde zatím spíše omezené, je to spíše demonstrace toho, jak může vývoj dále postupovat.

Algoritmus nevytvořil zcela nové video, pouze pozměnil jeho část, a pracoval tak s originální nahrávkou osoby, část jejíž mimiky měl imitovat. Synchronizovat pohyby úst jednoho člověka s projevem pocházejícím od někoho se zcela odlišným způsobem mluvy bude samozřejmě mnohem složitější, stejně jako umělé vytvoření celých pohybů hlavy a nejen samotné pusy.

U většiny lidí se však nedá dostat k takovému množství video materiálu, aby bylo možné dosáhnout dost dobrého výsledku. To je vidět třeba u podobného pokusu, kdy byla slova poradkyně prezidenta Trumpa Kellyanne Conwayové vložena do úst francouzské zpěvačky Françoise Hardyové.

Zde se (odlišný) algoritmus učil jen z jejích hudebních videí, která samozřejmě nejsou tak dobrým zdrojem jako prezidentské projevy a video výstup je mnohem méně kvalitní.

Ale již tyto prvotní úspěchy ukazují, že samotný princip je funkční a není nijak zvlášť složitý. S pokroky strojového učení pak budou videa čím dál kvalitnější a nároky na materiál potřebný k jejich vytvoření se budou stále snižovat.

Umělý hlas

Vše se stává ještě děsivější v okamžiku, kdy k „umělému Obamovi“ a Face2Face přidáme technologie na syntetizaci lidského hlasu, které jsou taktéž ve vývoji.

Společnost Adobe, jejíž Photoshop způsobil, že se již nedá věřit fotografiím, teď pracuje na VoCo, programu, který má stejně dobrou editaci přinést i pro práci s hlasem. Ten dokáže například přeházet slova ve větě, kterou někdo řekl, nebo jeho hlasem pronést i zcela jiná slova. Samozřejmě po „natrénování“.

Podobný projekt Lyrebird pak dokonce chce dosáhnout toho, že bude stačit jen minuta něčí mluvy pro to, aby program dokázal tímto hlasem pronést cokoliv. Již dnes nabízí ukázky toho, jak dokáže hlasem Trumpa, Obamy nebo Hillary Clintonové pronést jednu větu v mnoha odlišných intonacích.

Zatím se dá velmi snadno poznat, že jde o počítačem syntetizovaný projev, ale to se zcela jistě změní. Bude pak teoreticky možné napsat úplně cokoli, vytvořit z toho zvukovou nahrávku s hlasem amerického prezidenta a posléze ji vložit do programu, který vytvoří odpovídající pohyby rtů a vloží ji do existujícího videa či dokonce vytvoří zcela nové. V tomto případě už jsou potenciální podvrhy velmi nebezpečné.

V budoucnu tedy bude ještě mnohem těžší rozeznat falešnou zprávu od té pravdivé. Podle některých odhadů je přitom doba přesvědčivě působících falešných videí vzdálená už jenom tři roky.

Budou samozřejmě možnosti, jak autenticitu videa ověřit. Kromě obrazových chyb se mluví o vyžadování metadat ukazujících, kdy a kde bylo video natočeno, nebo kryptografickém podpisu. Ale to vše také nutně nemusí pomoct v situaci, kdy je šíření falešné zprávy přímo něčím cílem.

Velké množství lidí bez důkazu uvěřilo tomu, že CNN vysílalo porno nebo že je možné nahrát schopnosti pilotování letadla přímo do mozku. Příchod realistických videí, kde libovolná osobnost říká svým hlasem cokoli, co se tvůrci falešné zprávy zachce, bude pak obrovskou výzvou. Zvlášť pokud to bude zpráva, které lidé budou chtít věřit.

Mohlo by vás zajímat: Černobyl

Černobylská havárie se stala 26. dubna 1986 v černobylské jaderné elektrárně na Ukrajině (tehdy část Sovětského svazu). Vzpomínka na tragédii v těchto dnech oživila televizní minisérie Černobyl.

Téma Černobyl v článcích Technet.cz:
Brzda místo plynu a plyn místo brzdy. To byl Černobyl
Havárie neskončí před rokem 2065. Černobyl polyká tuny vody a miliardy eur
Výbuch roztavil beton a tisícitunový poklop létal vzduchem. Černobyl 1986

Nejčtenější

Scéna jako z hororu. Na střeše mrakodrapu vrtule rozsekala cestující

Havárie vrtulníku N619PA na střeše budovy PAN AM 16.5. 1977

Části zdeformované vrtule se do ulic New Yorku řítily jako smrtící neřízené projektily. Vrtulník společnosti New York...

Třímachový zabiják letadlových lodí Suchoj T-4 byl velkým žroutem rublů

Suchoj T-4

Historie letectví se pozoruhodnými stroji jenom hemží. Jedním takovým byl i sovětský bombardér Suchoj T-4. Vznikl pouze...

Osudový omyl. První a poslední přistání proudového letadla v Olomouci

MiG-21F trupového čísla 0618 s nímž v Olomouci tragicky havaroval kadet Omran...

Bylo mu 23 let, když se u Přerova učil létat na vysoce výkonném letounu Mig-21F. Podcenil však zadání úkolu a při...

Kilogram má novou definici. Jeho fyzická podoba ztratila 50 mikrogramů

Kopie originálu kilogram z Paříže v americké laboratoři Sandia. Podobné vzory

Od 20. května začala platit nová definice kilogramu. Ta již nebude mít fyzickou podobu, ale bude odvozená od pevné...

Jarní aktualizace Windows 10 je ke stažení. Microsoft se moc nepředvedl

Světlý motiv v jarní verzi Windows 10  2019

Microsoft uvolnil ke stažení velkou jarní aktualizaci Windows 10. Nečekejte však žádné velké změny. Většina se odehrála...

Další z rubriky

Google připravuje funkci automatického mazání záznamů o poloze a webech

(Ilustrační snímek)

Společnost Google se rozhodla vyslyšet stížnosti řady uživatelů a připravuje funkci, která umožní automaticky po určité...

Z velké kryptoburzy ukradl trpělivý hacker miliardu korun v bitcoinech

Virtuální měna Bitcoin zažívá ohromný vzestup. Je to bublina?

Burza Binance oznámila, že jim neznámý hacker či hackeři ukradli sedm tisíc bitcoinů. Útočník shromáždil velké množství...

Tipy weby: objevte síť pražských parků a hřišť či závadné výrobky

Ilustrační foto - příroda

V české metropoli je několik stovek dětských hřišť a parků. Kde se nacházejí a co mohou nabídnout ukazuje web...

Najdete na iDNES.cz