Je vám člověk na následující fotografii povědomý? Pak to bude shoda náhod. Tohoto člověka jste nikdy nemohli vidět, protože neexistuje. Jde o obrázek, který vygenerovala „umělá inteligence StyleGAN“ podle náhodných parametrů.
S největší pravděpodobností jste tak jediní, kdo tuto „fotografii“ kdy uvidíte. A při příštím načtení článku uvidíte zase jinou fotografii, což si můžete vyzkoušet stisknutím tlačítka pod obrázkem.
Většina vygenerovaných fotografií vypadá podivuhodně realisticky. Při zkoumání detailů ovšem často narazíte na drobné nesmysly, třeba na nerealistické stíny, podivně protažené vlasy nebo pozadí, které nedává žádný smysl.
Fotografie vygenerována pomocí StyleGAN (NVIDIA)
Pokud narazíte na obzvláště zajímavý obličej, podělte se o úlovek se čtenáři Technet.cz na Facebooku nebo na Twitteru.
Pokud nechcete obnovovat stránku a generovat nové a nové obličeje, posbírali jsme pro vás stovku náhodně vybraných, počítačem vygenerovaných tváří.
Prohlédněte si 100 obličejů vygenerovaných počítačem |
Jak to funguje? Fotka je výsledem „souboje“ dvou sítí
Kdykoli slyšíte o neuronových sítích nebo „umělé inteligenci“, měli byste se ptát, z jakých dat tyto sítě vycházejí, na jakých datech se učily. To je důležité, protože tato data v sobě mohou zahrnovat nějaké – úmyslné, či neúmyslné – zkreslení. StyleGAN se učila na obličejích nalezených na platformě Flickr. Není to ovšem tak, že by využívala a kombinovala prvky z různých existujících fotografií, rozhodně ne přímo.
StyleGAN vytváří fotografie způsobem, který můžeme přirovnat k souboji dvou neuronových sítí (proto GAN, tedy generative adversarial networks, generativní adversiální sítě), přičemž každá má svou úlohu:
- tvůrce– tvůrčí síť má za úkol generovat takové fotografie, které budou k nerozeznání od skutečných fotografií
- soudce– třídící síť má za úkol poznat, které fotografie jsou pravé a které ne
Tvůrce začne generováním obrázků s velmi malým rozlišením (čtyři krát čtyři pixely). Soudce trénoval na reálných fotografiích a snaží se odlišit vygenerované fotky od těch reálných. Ve chvíli, kdy tvůrčí síť dokáže tohoto soudce oklamat, naučí se něco o tom, jak vypadá a jak nevypadá obličej. Zpětná vazba slouží k posílení parametrů a celý proces se opakuje mnoho hodin.
Postupně se rozlišení zvyšuje a zvyšuje, až je síť schopna generovat fotografie lidí, respektive obrázky připomínající fotografie lidí.
Jak funguje StyleGAN (video Technet.cz):
Celý proces je samozřejmě mnohem zajímavější a složitější, podrobněji jsme jej popsali v našem předchozím článku o StyleGAN. Důležitá je především schopnost sítě StyleGAN kombinovat různé styly, což umožňuje tvorbu kombinovaných obličejů, které mají některé atributy z jedné fotky a jiné z druhé.
Fotografie vygenerovaná ze tří fotografií (vlevo). Z každé zdrojové fotografie si vzala některé „styly“.
Každá vygenerovaná fotografie je tak vlastně souborem velkého množství parametrů (celkem jich je přes 26 milionů). Náhodné fotografie jsou pak výsledkem náhodně generovaných parametrů.
K čemu použít vygenerované fotky? Zábava i dezinformace
Důsledky takového nástroje pro generování fotografií mohou být zajímavé. V tomto článku si hrajeme s jedním využitím: generováním jedinečného obsahu. Každý čtenář uvidí jiný obličej. Toho by šlo využít třeba u počítačových her, v umění nebo při výuce jazyků.
Dalším využitím je samozřejmě výzkum strojového učení nebo možnost naučit počítač lépe chápat a popisovat obličejové rysy (vědci z Nvidia nyní sbírají trénovací data).
Kromě zábavných využití si samozřejmě umíme představit i různé formy zneužití. Podvodní prodejci by třeba takto mohli generovat tváře k recenzím, dezinformační kampaně k vytváření reálně vypadajících, avšak nedohledatelných profilových fotografií. Kromě toho umí StyleGAN generovat i fotografie neexistujících, ovšem reálně vypadajících aut, ložnic nebo zvířat.
Síť lze vytrénovat i na fotkách aut nebo ložnic (Nvidia):
Opět tedy článek zakončujeme, jako to u článků o novinkách ve strojovém učení děláme poměrně často, jemným varováním. Je nejvyšší čas uvědomit si, že hranice mezi tím, co je reálné a co smyšlené, je zase trochu hůře rozpoznatelná a falšování o hodně dostupnější.