Český rozhlas (ČRo) a Karel Gott Agency ji představí ve čtvrtek 13. července, v předvečer zpěvákových nedožitých 84. narozenin. Projekt GOTT NAVŽDY by nevznikl bez katedry kybernetiky Západočeské univerzity (ZČU), řekl mluvčí ZČU Pavel Korelus.
„V roce 1939 se v Plzni narodil Karel Gott, v roce 2023 se na naší univerzitě znovu zrodil jeho hlas,“ uvedl. ČRo se podle Koreluse na tým syntézy řeči výzkumného centra NTIS Fakulty aplikovaných věd ZČU obrátil koncem loňského roku. „Myslím, že v podmínkách a časových možnostech, jaké byly, jsme dosáhli výborného výsledku,“ řekl vedoucí týmu Jindřich Matoušek.
Katedra kybernetiky ZČU pracuje s technologií syntézy řeči od 90. let. Z poslední doby je známý například její projekt automatické konzervace hlasu, který vznikl hlavně na pomoc nemocným, jimž hrozí, že přijdou o hlas. „S 1. Lékařskou fakultou UK a softwarovými firmami SpeechTech a CertiCon jsme navrhli proces, kterým si lidé doma nahrají svůj hlas, dokud ještě mohou hovořit, a my z nahrávek vytvoříme jeho kopii, jíž pak promlouvají z různých přístrojů. Tyto zkušenosti jsme využili i při vytváření hlasu Karla Gotta,“ řekl Matoušek.
Fakultu aplikovaných věd ZČU oslovil ČRo prostřednictvím její spin-off firmy SpeechTech, s níž spolupracuje na zavádění hlasových technologií založených na umělé inteligenci. „Vědci museli během jednoho až dvou měsíců dokázat, že vytvoří co nejvěrnější kopii Gottova hlasu. Data jim poskytl rozhlasový archiv, neboť zpěvák v letech 2011 až 2015 na stanici Dvojka moderoval vlastní pořad Zpátky si dám tenhle film,“ uvedl Korelus.
Karel Gott díky AI promluví i po smrti. Byl by nadšený, věří Ivana Gottová |
Dostali 200 hodin nahrávek. „Po prostříhání zbylo asi 20 hodin záznamu bez šumu, slov v cizím jazyce nebo písní v podkresu,“ řekl Matoušek. První ukázku ČRo představil podle Koreluse vdově Ivaně Gottové, která loni v prosinci rozhodla, že se bude pokračovat. „V lednu a únoru jsme už odevzdávali první a začátkem června poslední kapitolu,“ uvedl.
Na rekonstrukci hlasu pracoval šestičlenný tým. „Na základě nahrávek a odpovídajících přepisů jsme pak mohli natrénovat model syntézy řeči založený na moderních hlubokých neuronových sítích tak, že hlasem Karla Gotta přečte zadaný psaný text,“ řekl vědec. Hlas nakonec vznikl v šesti verzích, z nichž mohl ČRo vybírat. „Díky tomu, že zvuk ještě prošel náročnou postprodukcí, zní finální produkt asi nejlépe, jak znít mohl,“ uvedl.
Podle Matouška tím ČR ukázala, že umí dělat výzkum a vývoj řečových technologií i umělé inteligence na světové úrovni. „Aby byl počítačový hlas plnohodnotným partnerem člověka v hlasovém dialogu, nestačí jen přečíst daný text. Syntéza musí také dokonale porozumět tématu konverzace, umět vyjádřit postoj mluvčího, náladu, emoce, mít paměť... Takové úlohy na řešení teprve čekají,“ řekl.
Četbu na pokračování odvysílá ČRo Dvojka o prázdninách, bude mít 49 dílů. Celkem je dílů 73 a v nezkrácené podobě vyjdou v audioknize na podzim. ČRo připravil projekt GOTT NAVŽDY ke 100. výročí zahájení pravidelného vysílání na území republiky.