Premium

Získejte všechny články
jen za 89 Kč/měsíc

Stačí jedna fotografie a umělá inteligence ji rozezpívá, třeba Monu Lisu

  18:04
Jak se stále více vylepšují schopnosti generování obsahu za pomoci umělé inteligence, ukazuje se, že si budeme muset dávat velký pozor na to, čemu budeme věřit. Nový projekt vědců z Alibaby například ukazuje, jak se za pomoci AI z jedné fotografie člověka vytvoří poměrně realisticky vypadající obličej, který mluví nebo zazpívá, co mu zadáte.
Fotogalerie1

Stačí spojit zvukovou stopu s fotografií a umělá inteligence vygeneruje zpívající tvář. | foto: Institute for Intelligent Computing, Alibaba Group

Projekt Sora od společnosti OpenAI ukázal, že generativní umělá inteligence dokáže na základě jednoduchého textového zadání vygenerovat poměrně realistickou filmovou scénu. Jedním z prvních výtvorů tohoto systému byla i asijská dívka procházející se po městě, která se tak stala symbolem této generativní AI.

16. února 2024

Nyní tento produkt umělé inteligence vzali odborníci z Institutu pro inteligentní IT, který provozuje Alibaba Group, a naučili ji „povídat a zpívat“. Sora, jak dívku přezdíváme, ale nebyla jediná, na které si vyzkoušeli schopnosti svého difúzního modelu, který nazvali EMO. Zkratka vychází z názvu Emote Portrait Alive, což je jejich systém pro generování portrétních videí pomocí difúzního modelu.

Difúzní modely

Trénink difúzních modelů se provádí tak, že se do obrázků přidává šum, který se následně učí model odstraňovat. Při generování obrázků model využívá tento proces obnovy, a vytváří tak realistické obrazy z původního šumu.

Zdroj: AI dětem

Vědci z institutu uvádí, že stačí poskytnout fotografii a zvukový soubor a EMO následně dokáže generovat AI videa, kde mohou lidé mluvit a zpívat.

„Naše metoda dokáže generovat hlasová videa s expresivními výrazy obličeje a různými polohami hlavy a zároveň dokáže generovat videa s libovolnou délkou trvání v závislosti na délce vstupního videa,“ vysvětlují autoři.

Jak je na přiloženém videu vidět, výrazy jsou velmi důvěryhodně.

Celý proces je podle jeho tvůrců nastaven tak, aby se v první fázi extrahovaly rysy z předloženého snímku, a výsledek je pak použit k vytvoření série rozpohybovaných snímků. Druhou je fáze difúzního procesu, kdy předem natrénovaný zvukový kodér zpracovává zvukové vložky.

Jak to celé probíhá, popisují tvůrci v tomto obrázku:

Popis postupu generování videa ze zdrojového snímku a zvukové stopy.

Autor:
  • Nejčtenější

Podívejte se na letadlo, které bude řídit konec světa. Dovolá se ponorkám

Firma Northop Grumman zveřejnila obrázky plánovaného letounu E-130J pro americké námořnictvo. V případě třetí světové války má za úkol obstarat spojení s raketonosnými ponorkami. Používá k tomu...

Těšíte se? Na trh míří řada famózních televizorů, některé nás překvapily

Las Vegas (Od zpravodaje Technet.cz) Některé jsme čekali, jiné překvapily. Na veletrhu CES 2025 jsme viděli velké množství skvělých televizorů i nových televizních technologií, které míří na trh. Některé dorazí letos, na jiné si možná...

Majitel Amazonu vyzývá Muskovu SpaceX. První let rakety ale odložil

Zakladatel Amazonu Jeff Bezos chce dobývat vesmír podobně jako Elon Musk. Jeho firma Blue Origin provozuje nosiče New Shepard a chystá se stavět na oběžné dráze soustavu komunikačních družic Kupier,...

Odkud pochází syfilida? Nová studie ukončuje staletí sporů o původu nemoci

Premium

Kde se zrodila bakterie Treponema pallidum pallidum vyvolávající syfilidu? Letitou „přehazovanou“, kdy se za místo vzniku choroby střídavě označovaly Evropa a Amerika, by měla ukončit nová genetická...

Bezos poprvé vypustil svou raketu, která může konkurovat Muskově SpaceX

Firma Blue Origin zakladatele Amazonu Jeffa Bezose úspěšně vypustila z floridského mysu Canaveral svou novou raketu New Glenn. Po několika odkladech způsobených počasím a naposledy i technickým...

Mussolini si chtěl před 100 lety pojistit moc, ale zapomněl na dělníky

Itálie schválila před 100 lety kontroverzní „plurální volební zákon“. Někteří lidé v Itálii měli mít při volbách do Sněmovny až tři hlasy. Platnost zákona ale vydržela pouhý jeden den, Mussolini...

19. ledna 2025

Vyberte z druhé várky ten nejlepší model. Autor má šanci vyhrát knihu

Soutěž

Navazujeme na první sérii fotografií modelářských výtvorů a nyní si dokončíme prezentaci zaslaných příspěvků. Opět máte možnost vybrat, který model se vám nejvíce líbí. Pět nejlépe hodnocených...

19. ledna 2025

Podívejte se na zázrak. Maličká krabička má výkon jako sálový superpočítač

Las Vegas (Od zpravodaje Technet.cz) Nvidia představila na veletrhu CES maličký počítač nazvaný Project Digits. Je určený na práci s umělou inteligencí, výkonově a efektivitou násobně převyšuje cokoli, co jste si zatím mohli domů nebo...

19. ledna 2025

Stalin vyhrál před 100 lety mocenský souboj mezi bolševiky s Trockým

Osmnáctého ledna 1925 Stalin zvítězil nad Trockým. Ruský bolševický revolucionář Lev Trockij tehdy přestal být potenciálním Leninovým nástupcem. Ústřední výbor bolševické strany ho totiž „vyhodil“ z...

18. ledna 2025

Tomáš Vartecký nastupuje do léčebny. Je to větší, než jsem myslel, říká

Tomáš Vartecký (54) se svěřil s tím, že nastupuje do léčebny. Muzikant uznal, že situace je horší, než si myslel a je...

Eva Adamczyková je maminkou. Olympionici prozradili jméno miminka

Snowboardistka Eva Adamczyková (31) a herec Marek Adamczyk (37) se stali rodiči. Narození jejich prvního potomka na...

Zvládla jsem tisíc mužů za dvanáct hodin. To je rekord, říká Bonnie z OnlyFans

Pornoherečka Bonnie Blue (25) svůj obsah na OnlyFans a sociálních sítích považuje za vzdělávací. Za cíl měla v...

Herec Hynek Čermák a jeho o dvacet let mladší manželka Veronika se rozešli

Herec Hynek Čermák (51) a jeho manželka Veronika Čermák Macková (31) se po necelých deseti letech vztahu rozešli. V...

Miliardář Leon Tsoukernik po užití léku zkolaboval. Není jasné, zda se probudí

Miliardář a blízký přítel Ivany Gottové Leon Tsoukernik (51) zkolaboval ve svém sídle v Chodové Plané. Podle médií se...