Premium

Získejte všechny články
jen za 89 Kč/měsíc

Stačí jedna fotografie a umělá inteligence ji rozezpívá, třeba Monu Lisu

  18:04
Jak se stále více vylepšují schopnosti generování obsahu za pomoci umělé inteligence, ukazuje se, že si budeme muset dávat velký pozor na to, čemu budeme věřit. Nový projekt vědců z Alibaby například ukazuje, jak se za pomoci AI z jedné fotografie člověka vytvoří poměrně realisticky vypadající obličej, který mluví nebo zazpívá, co mu zadáte.

Stačí spojit zvukovou stopu s fotografií a umělá inteligence vygeneruje zpívající tvář. | foto: Institute for Intelligent Computing, Alibaba Group

Projekt Sora od společnosti OpenAI ukázal, že generativní umělá inteligence dokáže na základě jednoduchého textového zadání vygenerovat poměrně realistickou filmovou scénu. Jedním z prvních výtvorů tohoto systému byla i asijská dívka procházející se po městě, která se tak stala symbolem této generativní AI.

16. února 2024

Nyní tento produkt umělé inteligence vzali odborníci z Institutu pro inteligentní IT, který provozuje Alibaba Group, a naučili ji „povídat a zpívat“. Sora, jak dívku přezdíváme, ale nebyla jediná, na které si vyzkoušeli schopnosti svého difúzního modelu, který nazvali EMO. Zkratka vychází z názvu Emote Portrait Alive, což je jejich systém pro generování portrétních videí pomocí difúzního modelu.

Difúzní modely

Trénink difúzních modelů se provádí tak, že se do obrázků přidává šum, který se následně učí model odstraňovat. Při generování obrázků model využívá tento proces obnovy, a vytváří tak realistické obrazy z původního šumu.

Zdroj: AI dětem

Vědci z institutu uvádí, že stačí poskytnout fotografii a zvukový soubor a EMO následně dokáže generovat AI videa, kde mohou lidé mluvit a zpívat.

„Naše metoda dokáže generovat hlasová videa s expresivními výrazy obličeje a různými polohami hlavy a zároveň dokáže generovat videa s libovolnou délkou trvání v závislosti na délce vstupního videa,“ vysvětlují autoři.

Jak je na přiloženém videu vidět, výrazy jsou velmi důvěryhodně.

Celý proces je podle jeho tvůrců nastaven tak, aby se v první fázi extrahovaly rysy z předloženého snímku, a výsledek je pak použit k vytvoření série rozpohybovaných snímků. Druhou je fáze difúzního procesu, kdy předem natrénovaný zvukový kodér zpracovává zvukové vložky.

Jak to celé probíhá, popisují tvůrci v tomto obrázku:

Popis postupu generování videa ze zdrojového snímku a zvukové stopy.

Autor:
  • Nejčtenější

Zázrak! NASA po pěti měsících obdržela od sondy Voyager smysluplnou zprávu

v diskusi je 173 příspěvků

23. dubna 2024  13:37

Když se v únoru letošního roku stále nedařilo navázat smysluplnou komunikaci s jedním z...

Herečce Slávce Budínové by bylo 100 let. Zemřela opuštěná, bez zájmu veřejnosti

v diskusi je 30 příspěvků

21. dubna 2024

Před 100 lety, 21. dubna 1924, se v Ostravě narodila známá česká herečka Slávka Budínová.

{NADPIS reklamního článku dlouhý přes dva řádky}

{POPISEK reklamního článku, také dlouhý přes dva a možná dokonce až tři řádky, končící na tři tečky...}

Unikátní exkurze. Nahlédněte do francouzské jaderné ponorky před vyplutím

v diskusi je 16 příspěvků

20. dubna 2024

Není obvyklé, aby reportéři mohli nahlédnout do jaderné ponorky v aktivní službě. Agentura AP nyní...

Proč umělá inteligence lže a proč kvůli ní zhloupneme. Počítačový expert vypráví

v diskusi je 17 příspěvků

22. dubna 2024

Premium Zatímco průmyslová revoluce zaváděla masivní využití strojů, které nahradily lidské svaly, nyní...

{NADPIS reklamního článku dlouhý přes dva řádky}

{POPISEK reklamního článku, také dlouhý přes dva a možná dokonce až tři řádky, končící na tři tečky...}

Byla to druhá nejjasnější hvězda. V budoucnu může svítit jako druhý Měsíc

v diskusi je 17 příspěvků

21. dubna 2024

Velmi neobvyklá hvězda éta Carinae v devatenáctém století náhle zjasnila a stala se druhou...

Pomník Jana Žižky na Vítkově vznikal skoro 30 let

v diskusi je 10 příspěvků

27. dubna 2024

27. dubna 1924 zahájil Spolek pro zbudování pomníku Jana Žižky na Žižkově veřejnou sbírku na jeho...

Přistávat s vrtulníkem je jako balancovat na míči a zůstat při tom něžný

v diskusi jsou 4 příspěvky

27. dubna 2024

Mysli na to, že při záchraně druhých nesmíš sebe ani nikoho jiného ohrozit. Tak zněla jedna z...

Učili jsme se od alpských záchranářů, líčí pilot počátky letecké záchranky

v diskusi jsou 4 příspěvky

26. dubna 2024

Exkluzivně Za kniplem vrtulníku strávil přes 9 250 hodin. Stál u zrodu letecké záchranné služby, létal s...

Sphere jako osmý div světa? Zábavní komplex ve Vegas je technologický zážitek

v diskusi je 17 příspěvků

25. dubna 2024

Uvidíte v ní famózní obraz s nejvyšším rozlišením na světě, do uší zahraje sto šedesát tisíc...

Bývalý fitness trenér Kavalír zrušil asistovanou sebevraždu, manželka je těhotná

Bývalý fitness trenér Jan Kavalír (33) trpí osmým rokem amyotrofickou laterální sklerózou. 19. dubna tohoto roku měl ve...

Herečka Hunter Schaferová potvrdila románek se španělskou zpěvačkou

Americká herečka Hunter Schaferová potvrdila domněnky mnoha jejích fanoušků. A to sice, že před pěti lety opravdu...

Tenistka Markéta Vondroušová se po necelých dvou letech manželství rozvádí

Sedmá hráčka světa a aktuální vítězka nejprestižnějšího turnaje světa Wimbledonu, tenistka Markéta Vondroušová (24), se...

Horňáci versus dolňáci. Víme, čemu muži dávají přednost, a je to překvapení

Ženské tělo je pro muže celkově velmi atraktivní a nabízí jejich očím mnoho zajímavých partií. Největší pozornosti se...

Hello Kitty slaví padesátiny. Celý svět si myslí, že je to kočička, jenže není

Kulatý obličej se dvěma trojúhelníkovýma ušima, drobný čumáček, vousky a červená mašle na uchu. Taková je Hello Kitty,...