Premium

Získejte všechny články
jen za 89 Kč/měsíc

Nachytali byste se? Vytvořili jsme kopii hlasu kolegy, vysloví cokoli

  0:01
Byla by to krásná hračka a praktický nástroj, kdyby se ho padouši okamžitě nesnažili zneužít. Naučit model umělé inteligence mluvit hlasem vašeho kolegy, šéfa, kamaráda nebo známého herce a nechat ho přečíst libovolný text je až překvapivě snadné. Vyzkoušeli jsme to na kolegovi i prvním prezidentovi Československa.

Jedním z mediálně „nejpropíranějších“ startupů produkujících umělé generování a klonování hlasu pomocí systému umělé inteligence je americký startup ElevenLabs. Jednak proto, že se díky obřím investicím mnoha společností stal „jednorožcem“, tedy firmou, jejíž hodnota se raketově dostala přes metu jedné miliardy dolarů, a jednak proto, že podle expertů právě jeho nástroje a algoritmy stojí za falešnými telefonáty amerického prezidenta Joea Bidena.

Ačkoli si někdo může autory těchto podvržených hlasů představovat jako „ajťáky“ v mikinách s kapucí, kteří se hrbí před monitory s ubíhajícími řádky programového kódu v zelené barvě, reálná práce s potřebnými nástroji je mnohem méně romantická.

Vyzkoušeli jsme to právě s nástroji od ElevenLabs. Stačilo si vytvořit účet, vybrat vhodný balíček předplatného, zaplatit… a pak už se otevře elegantní webového rozhraní, jehož prostřednictví máte ke všem nástrojům přístup.

Dnes si ukážeme jen jednu z funkcí – naklonujeme cizí hlas a necháme ho přečíst text, který nikdy neřekl.

Stačí krátká nahrávka

První, co je potřeba udělat, je vytvořit hlasový profil. K tomu slouží jednoduchý formulář, kde vyplníte jméno a nahrajete nejméně jeden, nejvíc dvacet pět zvukových vzorků, z nichž každý může mít až 10 MB. Audio by mělo mít aspoň minutu. Samozřejmě, pokud nahrajete dělší vzorek, výsledek bude přesnější.

Systém musí dostat nahrávku pouze s jedním hlasem, který chcete naklonovat, proto pokud chcete systém učit třeba z rozhovoru, je potřeba ho napřed sestříhat – my k tomu úspěšně používáme bezplatné Audacity. Kvůli příkrému limitu ve velikosti souboru, který systém od ElevenLabs akceptuje, jsme vzorky komprimovali do formátu MP3.

ElevenLabs

Společnost založili v roce 2022 Piotr Dąbkowski, bývalý inženýr strojového učení společnosti Google, a Mateusz Staniszewski, plánovač nasazování software ve společnosti Palantir. Oba vyrostli v Polsku a inspirací pro založení ElevenLabs jim údajně bylo sledování nepovedeně dabovaných amerických filmů.

zdroj: Wikipedia

Součástí dialogového okna, ve kterém tvoříte hlasový profil, je možnost vložit identifikační štítky a popis hlasu. Dialog je v angličtině a tak jsme to dodržovali. Nakonec musíte čestně prohlásit, že máte práva k užití hlasu a že výsledek nepoužijete k nějakým nekalostem. Tím je profil připraven a můžete ho kdykoli použít ke generování „podvrženého“ hlasového projevu.

My jsme takto vytvořili hlasový profil kolegy Vladimíra Vokála, jehož hlas znáte například z pořadu Rozstřel, načtených historických knih vycházejících v rámci Podcastů iDNES.cz nebo zpráv Rádia Impuls. Model jsme natrénovali na sedmiminutovém vzorku načtené knihy a asi třech minutách živého rozhlasového rozhovoru.

Hlas umělého Vladimíra

U zvoleného hlasového profilu – s naším středním předplatným „Creator“ za dvacet dva dolarů měsíčně si jich můžeme uložit až třicet – stačí kliknout na Use (použít) a do připraveného okna zkopírovat připravený text (text to speech). Můžete také nahrát zvukový soubor s mluveným slovem, který systém namluví znovu zvoleným hlasem (speech to speech).

Formulář pro vytvoření podvrženého hlasového záznamu

V sekci nastavení si můžete pohrát s parametry vytváření hlasu, ideální je na kratším vzorku textu vyzkoušet víc nastavení a celý text (limit je pět tisíc znaků na jeden výsledný zvukový soubor) načíst až s vhodným nastavením. Každý balíček předplatného má totiž měsíční limit na počet znaků (u balíčku Creator je uvedeno sto tisíc, reálně jsme jich dostali minimálně o třicet tisíc víc), tak je dobré neplýtvat.

Nastavení hlasové syntézy

Je možné si vybrat z několika AI modelů, nicméně čeština je pouze v Multilingual V2, takže v tomto případě je volba nejspíš jednoduchá.

Výběr jazykových modelů

A pak už stačí kliknout na „Generate“. Po několika desítkách sekund se spustí přehrávání již namluvené části, která postupně přibývá – někdy se reprodukce na chvilku zastaví, jindy to systém stihne odbavit rovnou pro poslech. Každopádně je vygenerování zvukové verze textu otázkou desítek sekund až jednotek minut – odbavuje se na serverech společnosti, evidentně mají zatím dostatek volné kapacity.

Vladimír dopadl (skoro) výborně, ale…

Jak dopadlo namluvení textu hlasem Vladimíra Vokála generovaným nástroji od ElevenLabs, se můžete přesvědčit sami v úvodním článkovém videu. Je v něm pro srovnání i kus skutečně načteného textu – výňatek z jednoho ze vzorků, který jsme použili pro trénování.

Zaměnit vygenerovaný hlas za skutečný Vladimírův projev by bylo docela snadné. Varováním by mohly být snad jen ne vždy dobře trefené pauzy na nádechy, případně kladení důrazu tam, kam nepatří. Ale kolik lidí takové detaily „praští do ucha“ ve chvíli, kdy o kvalitě projevu nepřemýšlejí?

Ne vždy se ale dílo podařilo. Ukázalo se, že trénovaný hlas profesionálního moderátora je pro klonování pomocí AI ideální. Není v něm totiž mnoho chyb a fonetických nedokonalostí a navíc je nahrán ve vysoké zvukové kvalitě. Zejména z druhého důvodu jsme poněkud narazili s nápadem nechat hlasem prvního československého prezidenta Tomáše Garrigua Masaryka přečíst novoroční projev současného prezidenta Petra Pavla. V „jakés takés“ kvalitě jsme našli jen úplné minimum dobových nahrávek – a na výsledku to bylo znát. Ostatně, poslechněte si sami.

Nepřesvědčivě dopadl pokus o stejnou realizaci, tentokrát ale s hlasem prvního prezidenta České republiky Václava Havla. Jeho charakteristické ráčkování se AI model nenaučil a pro Havla specifická dynamika a kladení důrazů se do výsledku taky nedostaly. Výsledek měl sice podobnou barvu, ale že nejde o záznam skutečného projevu, bylo docela zřejmé.

Nástroje od ElevenLabs umí i další triky, například vytvoření vlastního hlasového avatara pomocí mnohem preciznějšího učícího procesu. Ale to si vyzkoušíme příště.

Nejčtenější

Kolik stojí Oneplay, na čem se dá sledovat a jaký je přechod z Voyo a O2 TV

Televize O2 TV se sloučila s internetovou streamovací platformou televize Nova Voyo a vznikla nová služba Oneplay. Kolik stojí nové tarifní balíčky? Na kolika zařízeních je možné kanály sledovat? A...

Pozor, letadlovka! Se stotisícitunovým ocelovým kolosem se srazit nechcete

Nedávná srážka americké letadlové lodě s obchodním plavidlem dopadla celkem dobře. Nedošlo ke zraněním. Materiální škody byly zřejmě jen malé. Ne každý, kdo se pohyboval v blízkosti letadlové lodě...

Možná se blíží konec rakety, která měla vozit lidi k Měsíci i Marsu

Je to raketa, která měla vrátit americké astronauty na Měsíc a jednoho dne je poslat k Marsu. Teď se nad ní ovšem vznáší reálná hrozba až jistota zrušení. Jmenuje se SLS (Space Launch System,...

Proč ten poprask? Oneplay má fajn aplikaci, hodně obsahu, technicky nenadchne

Premium

Na šesti různých zařízeních jsme vyzkoušeli novou službu Oneplay, která nahradila Voyo a O2 TV. Prozkoumali jsme jak aplikace a nabídku, tak technická omezení podporovaných zařízení i příslušné...

Zbraně, smrt a sklady pokladů. Zima 1945 byla v Sudetech tou nejkrutější

V minulém díle našeho miniseriálu k příležitosti osmdesátého výročí konce druhé světové války jsme si připomněli, jakou roli hrál Liberec jako centrum nacistické moci. Nyní se opět vracíme do oblasti...

Vynalezli ruchadlo v roce 1825, či o dva roky později? Národní listy měly jasno

V březnu 1925 slavily české Národní listy sto let od velkého vynálezu: ruchadla bratranců Veverkových. Obecně se spíš uznává pozdější datum: rok 1827.

16. března 2025

Možná se blíží konec rakety, která měla vozit lidi k Měsíci i Marsu

Je to raketa, která měla vrátit americké astronauty na Měsíc a jednoho dne je poslat k Marsu. Teď se nad ní ovšem vznáší reálná hrozba až jistota zrušení. Jmenuje se SLS (Space Launch System,...

16. března 2025

Ojedinělá prohlídka. Podívejte se do šachty pod vodní turbínou staré továrny

Pří opravách opěrného zdiva Jizerskohorského technického muzea – původně přádelny – nastala jedinečná příležitost prozkoumat náhon a vývařiště vodní turbíny, která celý provoz kdysi poháněla....

15. března 2025  17:09

Herečka Adamová excelovala vedle Wericha. Proslavily ji pohádky, rozhlas i dabing

Před 100 lety, 15. března 1925, se narodila česká divadelní, filmová, rozhlasová a dabingová herečka Jaroslava Adamová.

15. března 2025  13:20

Z USA odstartovala raketa Falcon 9, vyzvedne dva astronauty uvázlé na ISS

Z mysu Canaveral na Floridě ve Spojených státech úspěšně odstartovala raketa Falcon 9 společnosti SpaceX se čtyřmi astronauty na palubě. Mise umožní návrat dvou astronautů, kteří po nevydařeném...

15. března 2025  7:12

Model messerschmittu v maďarských barvách připomíná příběh leteckého esa

„Maďarské stroje nejsou příliš často zobrazované, na druhou stranu k nim je dost historických fotek,“ vysvětluje modelář Petr Záras důvod, proč oblékl „svůj“ Messerschmitt Bf-109F do kamufláže...

15. března 2025

Akční letáky
Akční letáky

Všechny akční letáky na jednom místě!

Umělá inteligence bude řídit výrobu vodíku. Revoluční prototyp zvýší účinnost

Brněnský startup Nano Advanced představil průlom v oblasti zelené energetiky. Jeden ze zakladatelů firmy Jakub Drnec spolu s ministrem průmyslu a obchodu Lukášem Vlčkem (STAN) dnes spustili...

14. března 2025  17:46

Astronomové přehlédli supermasivní černou díru. Váží jako 600 000 Sluncí

Ve středu Velkého Magellanova mračna nejspíš sedí černá díra podobná té uprostřed naší vlastní Galaxie. Je však přibližně sedmkrát lehčí. Její přítomnost naznačuje analýza drah hvězd, které...

14. března 2025  14:02,  aktualizováno  14:02

Páteční zatmění Měsíce uchvátilo fotografy po celém světě. Podívejte se

Pokud vám oblačnost neumožnila vidět ani kousek ze začátku zatmění Měsíce, které bylo z Česka možné pozorovat v pátek ráno, můžete si to vynahradit na snímcích fotografů. Ti jej zachytili po celém...

14. března 2025  13:40

Zatmění Měsíce je za námi. Ve videu jej tentokrát uvidíte nejlépe

V noci na pátek byl měsíc úplňku a zároveň se postupně schovával za Zemi tak, až ho zakryl celý její stín. Plné zatmění Měsíce však začalo až krátce před osmou hodinou ranní, kdy už nebylo z našeho...

13. března 2025  17:33,  aktualizováno  14.3 8:59

Američané obnovují letiště, ze kterého startovaly bombardéry na Hirošimu

Soustava ranvejí a stojánek na tichomořském ostrově Tinian byla na konci druhé světové války největší na světě. Sloužila bombardérům B-29 Superfortress, včetně dvou strojů, které shodily atomové...

14. března 2025

Měli vystřídat uváznuvší posádku ve vesmíru. Sami nyní musí čekat na odlet

Dvoučlenná posádka testovacího letu lodi Boeing přesluhující již řadu měsíců si počká na Mezinárodní vesmírné stanici patrně o několik dní déle. Astronauté, kteří je měli vystřídat, totiž v noci na...

13. března 2025  11:11