Konec datlování. Přichází program, který umí přepsat i českou mluvu do PC

Dá se to nazvat malou revolucí. Po mnoha letech náročné práce je na světě program, který bude moci i běžný český uživatel využít k diktování textu přímo do počítače. Vyzkoušeli jsme NEWTON Dictate a vy můžete také. Zdarma.

Nový program společnosti Newton, který vznikl ve spolupráci s Libereckou univerzitou, si poměrně dobře poradí s diktováním textu, který pak přímo přepisuje do počítače. Úspěšnost velice závisí na orálních schopnostech uživatele a také na nastaveném slovníku, který v programu využívá.

Firma totiž nabízí několik slovníkových souborů, které se liší podle potřeby využití. Nejčastěji se počítá s prací s obecným slovníkem, ale zatím se díky spolupráci s některými soudy spíše využívají právnické a lékařské slovníky. Cena programu je u všech slovníků stejná a činí 24.600 Kč bez DPH za jednu licenci. V ceně je zahrnuta roční aktualizace slovníku a upgrade programu.

Všeobecný slovník přitom využívá 370 tisíc slov, což v praxi znamená 98 % pokrytí běžného textu. I když se to může zdát poměrně hodně, zdaleka tam nejsou všechna. Stačí si jen uvědomit, že například různých příjmení, která registruje ministerstvo vnitra, je zhruba 250 tisíc. Platí tedy: čím víc slov, tím univerzálnější je i rozpoznávací systém. Oborové slovníky jako justiční (340.000 slov), lékařský - radiologický (110.000 slov) a patologický slovník (120.000 slov), zase lépe využijí specialisté. 

Zároveň se ale výrazně zvyšují nároky na výpočetní sílu počítače, který vše zpracovává. To je také důvod, proč se mohl tento systém v češtině představit až na konci uplynulého roku, zatímco v angličtině podobné programy výborně fungují již několik let.

Čeština je velmi složitým jazykem, především kvůli své ohebnosti, tj. skloňování a časování. Zatímco například v angličtině mívá podstatné jméno pouze dva tvary (jednotné a množné číslo), v češtině to může být až 14 tvarů (7 pádů v jednotném a množném čísle). U přídavných jmen a u sloves je tento nepoměr ještě větší. Důsledek: v češtině existují více než 2 miliony různých slovních tvarů a slovník pro přepis češtiny musí být nejméně desetkrát větší než u angličtiny.

To klade nejen větší nároky na tvorbu slovníku a tzv. jazykového modelu, ale zejména na rozpoznávací modul, který musí průběžně pracovat ne s miliony, ale s miliardami dílčích hypotéz. Diktovací systém vyvinutý na Technické univerzitě Liberec obsahuje ve svém standardním slovníku přes 330 tisíc nejfrekventovanějších slov, která jsou reprezentována téměř 400 tisíci výslovnostními variantami.

Slovní zásoba navíc prochází neustálým vývojem. Když se např. před lety v tisku častěji začalo objevovat jméno Barack Obama, bylo potřeba zahrnout ho i do slovníku českého přepisovacího systému. Zatímco u anglického systému stačilo přidat pouze dvě nová slova (křestní jméno a příjmení), ve slovníku českého systému už existuje několik desítek odvozených tvarů jména i příjmení (např. Obamu, Obamou, Obamův, Obamová, Obamovi, obamovský, protiobamovské, Barackův, Baracku! atd.)

Jak je těžké rozpoznat text

Pokud bychom měli k něčemu přirovnat systém na rozpoznávání řeči, byl by to asi šachový počítač. Pracuje se tu totiž se statistickými modely, které odhadují, co bylo pravděpodobně řečeno. Nevyhodnocují se přitom jen jednotlivá slova, ale i slovní spojení.

Prakticky to vypadá tak, že je každých 10 milisekund vyhodnocován pomocí spektrální analýzy signál z mikrofonu. Z výsledků se pak průběžně vytvářejí návrhy na to, jaké jednotlivé hlásky, slova a nakonec i celé věty se v diktátu vyskytují.

Je to velmi složitý a výpočetně náročný proces. Při přepisu jedné věty o několika slovech se tak postupně vyhodnocuje i přes miliardu různých návrhů. Aby se to dalo zvládnout v reálném čase, dekódovací algoritmus průběžně zjišťuje, jak pravděpodobné jsou jednotlivé dílčí návrhy, a ty méně nadějné či pravděpodobné "zapomíná". Na závěr je na obrazovku vypsána věta, které získala v tomto procesu nejvyšší "skóre".

Systém totiž nemůže tušit, kolik slov bylo řečeno, jaká sekvence slov byla řečena a v jakých časových okamžicích začínala jednotlivá slova. Zda byla všechna vyřčená slova ze slovníku, který má k dispozici, a také například jestli to byla skutečně jenom řeč, nebo i další zvuky a hluky.

Malá ukázka, jak systém může pracovat s větou "zavolá premiér a předseda".

| - | zavolá | - | premiéra | předseda | - |

| - | za | vola | premiéra | předsedá | - |

|-| zvolá | prima | éra | před | sebou | - |

| - | zavolej | premiéra | předsedo | - |

| - | zavolá | - | premiér | a | předseda | - |

Zdroj: Newton

Úspěšnost přepisu je dána zejména dvěma faktory: slovníkem, tedy jeho velikostí a složením, a tzv. jazykovým modelem. Jazykový model při rozpoznávání řeči pomáhá tím, že bere v úvahu statistiky výskytu jednotlivých slov a jejich kombinací. Testovaný systém používá velice rozsáhlý slovník, který má navíc podporu v analýze více než deseti gigabajtů textů, které využívají databázi Newton Media obsahující texty za období posledních 20 let. Model je podle výrobce unikátní také tím, že bere v úvahu statistiky týkající se výskytu až šesti slov za sebou.

Úspěch rozpoznávání závisí také na dalších okolnostech, zejména na kvalitě signálu a kvalitě výslovnosti. Čím srozumitelnější je výslovnost dané osoby, tím budou výsledky lepší. Především rychlost pak ovlivňuje výkon počítače. Doporučená HW konfigurace počítače je procesor Intel Core 2 Duo 1.8 GHz nebo Intel Pentium 4 na 2.4 GHz a lepší, 1 GB paměti, běžná zvuková karta a kvalitní mikrofon. 


Historie rozpoznávání řeči v ČR

Systém pro rozpoznávání mluvené češtiny vyvíjeli na technické univerzitě od konce 90. let. První funkční prototyp byl představen odborné veřejnosti na konferenci v roce 2005. Tehdy ovšem pracoval "pouze" se slovníkem o velikosti cca 100 tisíc slov, což pro obecnou češtinu bylo stále ještě málo. Koncem roku 2006 byla pracovníkům ministerstva spravedlnosti prezentována první verze přizpůsobená speciálně pro potřeby soudnictví. Z různých důvodů však byla nasazena do zkušebního provozu na soudech až v roce 2008.

Co umí a co ne

Hned na začátku je potřeba říci, že stoprocentní úspěšnost nelze očekávat. Pokud si však uživatel dá pozor na výslovnost a používá vlastní hlasový profil, může se těšit z výsledků nad 90 procent.

NEWTON Dictate parametry 

Po krátké instalaci trvající zhruba 5 minut je potřeba vybrat si oborový slovník podle použití a poté hlasový profil. Systém pracuje se dvěma základními hlasovými profily, mužským a ženským.

NEWTON Dictate nastveni vzhledu

Pak je rovnou možné po stisknutí jednoho tlačítka začít diktovat a sledovat psaný text na obrazovce. Využít lze i předem nadiktovaný text, který si posléze systém sám zpracuje.

Program zvládne desetinná čísla, na která lze narazit například u peněžních údajů, poradí si i s příkazy na vytvoření nové řádky, odstavce či čárky ve větě. Poměrně slušně zvládne i českou gramatiku. Ostatně většina tohoto článku byla nadiktována právě prostřednictvím Newton Dictate a gramatické úpravy byly jen minimální.

Příklad přepisování v programu Newton Dictate

Problém, především při automatickém přepisu, je, když program nesprávně vyhodnotí několik slov. Pak se může přepisování třeba celého odstavce zvrhnout ve změť nesmyslných vět.

Pro optimální práci programu je potřeba vytvořit si vlastní hlasový profil. Není to nijak složitý proces, zabere však i několik desítek minut. Uživatel totiž musí přečíst 120 vět, podle kterých se program nastaví tak, aby měl větší úspěšnost při rozpoznávání hlasu konkrétního mluvčího.

NEWTON Dictate hlasová profilNEWTON Dictate hlasová adaptace

Takových hlasových profilů lze přitom vytvořit, co hrdlo ráčí. Jen je vždy potřeba si při spuštění programu vybrat ten správný. Určitě se to vyplatí, neboť úspěšnost správného přepisu se dále zvýší.

NEWTON Dictate makro

Systém podporuje hlasová makra a také umožňuje v reálném čase text upravovat. Lze diktovat do libovolného místa v textu, využít lze i funkci Vyjmout a Vložit, která může pracovat i se zvukem.

Exportovat lze text, nejlépe ve formátu RTF, ale třeba i zvuk spojený s textem pomocí časových značek.

Z našich zkušeností vyplývá, že nejlepší výsledky jsou při diktování čistém a zřetelném, kdy si člověk dává na výslovnost pozor. Systém je poměrně citlivý na kvalitu záznamu, který by měl být přímo na mikrofon.

vyzkoušejte SI program zdarma

Vážení čtenáři,

ve spolupráci s firmou Newton Technologies, a.s., a Technickou univerzitou v Liberci vám nabízíme unikátní možnost vyzkoušet si program Newton Dictate zdarma.

Pokud zašlete e-mail s žádostí o vyzkoušení na adresu test@diktovani.cz, bude vám přidělen licenční klíč a získáte přístup ke stažení programu zdarma (cca. 300 MB).

  • Nejčtenější

K čemu „ty brýle od Applu“ vlastně jsou? Odpovídáme na překvapivý dotaz

v diskusi je 162 příspěvků

22. února 2024

K čemu to je? To byla nejčastější reakce na headset Apple Vision Pro pod článkem, kde jsme jej jako...

Návrat USA na Měsíc po více než 50 letech. První soukromý modul úspěšně přistál

v diskusi je 95 příspěvků

22. února 2024  16:09,  aktualizováno  23.2

Měsíční přistávací modul Nova-C pojmenovaný Odysseus se v pátek dostal na povrch Měsíce. Splnil tak...

{NADPIS reklamního článku dlouhý přes dva řádky}

{POPISEK reklamního článku, také dlouhý přes dva a možná dokonce až tři řádky, končící na tři tečky...}

Vtipně překonali „neřešitelný problém“, astronauti na ISS jsou nadšení

v diskusi je 30 příspěvků

27. února 2024  14:16

Barcelona (Od zpravodaje Technet.iDNES.cz) Udržet se třeba půl roku v uzavřeném nehostinném prostoru v dobré psychické i fyzické kondici je...

Nejvzdálenější sonda ve vesmírném prostoru neodpovídá. NASA neví, co s tím

v diskusi je 41 příspěvků

22. února 2024

Premium Je to více než deset let, co sonda Voyager 1 vyletěla jako první stále funkční lidský výtvor...

{NADPIS reklamního článku dlouhý přes dva řádky}

{POPISEK reklamního článku, také dlouhý přes dva a možná dokonce až tři řádky, končící na tři tečky...}

To že má nahradit recepční? Největší exponát vyvolal spíš rozpaky

v diskusi je 12 příspěvků

26. února 2024  9:30

Barcelona (Od zpravodaje Technet.iDNES.cz) Velký zájem a údiv v různém smyslu slova vzbudil v předvečer veletrhu Mobile World Congress exponát...

VIDEO: Střílej po mně! Kameraman natočil téměř celý útok v centru Prahy

Premium Ve čtvrtek zemřelo rukou střelce Davida K. 14 obětí, 25 lidí je zraněných, z toho deset lidí těžce. Jedním z prvních na...

Máma ji dala do pasťáku, je na pervitinu a šlape. Elišku čekají Vánoce na ulici

Premium Noční Smíchov. Na zádech růžový batoh, v ruce svítící balónek, vánoční LED svíčky na baterky kolem krku. Vypadá na...

Test světlých lahvových ležáků: I dobré pivo zestárne v obchodě mnohem rychleji

Premium Ležáky z hypermarketů zklamaly. Jestli si chcete pochutnat, běžte do hospody. Sudová piva totiž dopadla před časem...

T-Mobile se chystá na festivaly. Mobilní vysílač zprovozní za 30 minut

v diskusi nejsou příspěvky

29. února 2024

Barcelona (Od zpravodaje Technet.iDNES.cz) Festivaly, koncerty, velké sportovní události, demonstrace… Velká shromáždění lidí generují...

OBRAZEM: Jediná maďarská zubačka jezdí v Budapešti. Patří mezi nejstarší

v diskusi nejsou příspěvky

29. února 2024

Zubačky „zakleté“ v katastru jednoho města nejsou jen tak obyčejná věc, a přeci dvě takové...

Chytrý telefon nahradí kartičkami a televizorem. Nevíme, zda nejdou pozdě

v diskusi je 13 příspěvků

28. února 2024  9:21

Barcelona (Od zpravodaje Technet.iDNES.cz) Překlenout „digitální propast“ mezi těmi, co mohou a nemohou, případně umí a neumí se snaží německý...

POZOR VLAK: Víte, jak se vyrábějí nejmodernější pražce? Je to věda

v diskusi nejsou příspěvky

28. února 2024

Víte, kolik je železničních pražců v síti Správy železnic? Napočítali byste jich 23,208 milionu....

Akční letáky
Akční letáky

Všechny akční letáky na jednom místě!

Zemřela slovenská moderátorka, oblíbený byl její pořad, který pomáhal dětem

Zemřela moderátorka a logopedka slovenské dětské televizní stanice JOJko Lucia Palugyayová. Bylo jí 47 let. Na...

Šlo o rozhovor, hájí Gondíková s Benešovou focení do pánských časopisů

Herečky Adéla Gondíková (50) a Lucie Benešová (49) jsou spolužačky z konzervatoře a přátelí se už přes třicet let. V...

Menzelová pomáhá nemocnému Víznerovi. Byl bys hrdý, vzkázala manželovi

Olga Menzelová (46) poslala prostřednictvím Instagramu dojemný vzkaz svému zesnulému muži Jiřímu Menzelovi k jeho...

Soused topí v krbu, zahradu máme plnou sazí a smradu. Jak se bránit?

Náklady na topení v rodinných domech bývají výraznou složkou celkového rozpočtu domácnosti. Každý hledá možnosti, jak...

Princ William zrušil na poslední chvíli z osobních důvodů účast na akci

Britský princ William (41) odřekl svou účast na úterní vzpomínkové slavnosti na hradě Windsor. Na bohoslužbu za...