Premium

Získejte všechny články mimořádně
jen za 49 Kč/3 měsíce

VIDEO: Počítače nám vzaly i řeč. Umí mluvit čínsky naším hlasem

Vývojová divize Microsoftu předvedla systém, který převádí mluvená slova z jedné řeči do druhé a přitom zachová charakteristiky vašeho hlasu. Zatím však není jasné, kdy a zda vůbec bude i v našich počítačích.

Poslední dny nebyly k Microsoftu zrovna přívětivé. Pomalý rozjezd Windows 8 a podle všeho nepříliš zářné prodejů tabletů Surface následoval rychlý odchod šéfa divize Windows.

Mezi nepříliš pozitivní zprávami zanikla zajímavá novinka, kterou firma představila už na konci října v Číně. Rick Rashid z vývojové divize Microsoft Research promluvil 25. října k profesorům a studentům univerzity ve městě Tchien-ťin. Mluvil na ně anglicky, ale publikum slyšelo jeho hlas v čínštině. Jak je vidět z přiloženého videa, program se dokonce snaží napodobit hlas mluvčího (celou přednášku můžete shlédnout zde).

Výsledek nebyl rozhodně dokonalý, to pozná i neškolené ucho, ale zřejmě přesvědčivý. Každou z osmi vět, kterou Rashid pronesl, tak diváci ocenili aplausem. Systémy na převod lidského hlasu do počítačového samozřejmě již známe, Microsoft v tomto oboru rozhodně není sám. Převod hlasu samotného mluvčího by mohl tento oboru posunout znovu o významný kousek dál.

Nejde jenom o pouhé kopírování, jak jsme psali v našem předchozím článku založeném na prvních informacích o systému. Stejně jako lidé by měl například měnit výslovnost některých hlásek podle kontextu. 

Základ softwaru pod "hlasovým modulem" tvoří statistický model rozpoznávání řeči, založený na překladači Microsoftu Bing Translator. Jeho filozofie je podobná jako u Google Translate a konečně i hlasových asistentů typu Siri, je tedy založena na analýze milionů a miliard výrazů a vět. Silové řešení pomocí rozboru mnoha údajů se osvědčilo lépe než jiné přístupy a dnes se používá nejvíce.

Výsledky dnes nejsou samozřejmě dokonalé. Špatně může být i klidně každé čtvrté nebo páté slovo, jak je vidět v některých chvílích i na přepisu videa, který běží na plátně nad Rashidem.

Ale zpět k imitaci hlasu. Je založena na modelu "učenlivého systému" (přesněji na modelu tzv. neuronové sítě), která se na základě zpětné vazby postupně učí napodobit váš hlas. Nejde to úplně snadno, Rashid údajně potřeboval zhruba hodinu čistého času, aby dosáhl prezentovaného výsledku.

Podle Microsoftu by přizpůsobení počítačového hlasu mělo zlepšit porozumění a není důvod o tom pochybovat. Strojové hlasy jsou hůře srozumitelné než lidské. Jaké jsou však další plány s vývojem této technologie, není úplně jasné. Podle všeho jde stále o vývojový projekt, který má k reálnému nasazení stále poměrně daleko.

  • Nejčtenější

Sověti neuměli zkonstruovat těžký tank. Pomohl jim až německý inženýr

v diskusi je 51 příspěvků

19. května 2024

Když je řeč o sovětských těžkých tancích, výčet zpravidla začíná pětivěžovým typem T-35. Jenže...

Pět věcí, které byste s Windows měli dělat, ale možná neděláte, a naopak

v diskusi je 11 příspěvků

15. května 2024

Možná prakticky ihned po instalaci, při prvním spuštění nového PC nebo později deaktivujete některé...

{NADPIS reklamního článku dlouhý přes dva řádky}

{POPISEK reklamního článku, také dlouhý přes dva a možná dokonce až tři řádky, končící na tři tečky...}

Panasonic překvapil, jeden opuštěný operační systém nahradily dva nové

v diskusi je 15 příspěvků

17. května 2024

Düsseldorf (Od zpravodaje Technet.cz) Když odhlédneme od kvality zobrazovacího panelu a obvodů zpracovávajících obraz, je operační systém...

Kennedy ho vybral jako prvního černocha. Do vesmíru letěl až teď, v 90 letech

v diskusi je 12 příspěvků

21. května 2024  7:42

Do vesmíru ho vybral jako prvního černošského adepta už prezident John Kennedy. Na svůj let ale...

{NADPIS reklamního článku dlouhý přes dva řádky}

{POPISEK reklamního článku, také dlouhý přes dva a možná dokonce až tři řádky, končící na tři tečky...}

Nejzajímavější sluchátka na trhu? Novinka Sonosu je první svého druhu

v diskusi je 16 příspěvků

21. května 2024

Úderem patnácté hodiny skončilo embargo na první sluchátka společnosti Sonos, které po krátkém...

Vědci zkoumají, jaký šum nám nejvíce prospívá. Místo bílého nastupuje růžový

v diskusi nejsou příspěvky

22. května 2024

Premium S pojmem bílý šum se patrně setkala většina z nás. Někteří slyšeli i o dalších barvách šumu, o čemž...

Microsoft vám chce dát do kanceláře nového kolegu a sází na malé AI

v diskusi nejsou příspěvky

21. května 2024  23:42

Microsoft ukázal, jakou budoucnost generativní umělé inteligence si představuje. Vedle velkých...

Nejzajímavější sluchátka na trhu? Novinka Sonosu je první svého druhu

v diskusi je 16 příspěvků

21. května 2024

Úderem patnácté hodiny skončilo embargo na první sluchátka společnosti Sonos, které po krátkém...

HBO MAX se v noci proměnil v MAX. Nabídne víc obsahu za víc peněz

v diskusi je 29 příspěvků

21. května 2024  9:54

Služba videa na přání HBO MAX se v noci z pondělí na úterý proměnila ve službu MAX. S novou...

Akční letáky
Akční letáky

Všechny akční letáky na jednom místě!

Nejhorší noční můra, řekla žena, která v botě syna objevila cizí AirTag

Mého syna někdo sleduje. S takovým pocitem několik týdnů žila žena z Floridy poté, co na svůj iPhone začala dostávat...

Anální sex je výzva. Nejvíc tabu je však v Česku jiná praktika, říká průzkum

Erotické hračky nepředstavují podezřelou exotiku, v ložnicích jsou jako doma. Ostatně jako masturbace. I orální sex....

Svěrák se na mě nedíval jen jako na hezkou buchtu, říká Radka Pavlovčinová

Jan Svěrák ji vidí jako robotku. Radka Pavlovčinová v nové hře filmového a teď už i divadelního režiséra hraje umělou...

Zásnubní šaty elegantní princezny. Spustily Kate efekt, návrhářku zničily

Seriál Když si jeho šaty oblékne některá z členek královské rodiny, obvykle to každý návrhář oslavuje jako životní úspěch....

BMW prohrálo soud s budějovickým prodejcem ojetin o právo na užití loga

Exkluzivně Může nezávislý prodejce ojetých aut používat na provozovně logo automobilky, i když s ní nemá žádnou smlouvu? Vrchní...