Vědci učí počítače rozumět řeči. Z mumraje slov odhalí třeba i zločin

  17:50aktualizováno  17:50
Systémy, které vyvíjejí na Fakultě informačních technologií brněnského VUT, dokážou vyhledávat slova v mluvené řeči. Konkrétní výrazy rychle najdou i v tisících nahrávek. Díky tomu je ocení bezpečnostní složky, pomáhají ale i v call centrech.

S VUT spolupracuje třeba firma Phonexia, která se zabývá hlavně dolováním bezpečnostních informací z řeči. Na snímku uprostřed jsou její zakladatelé Petr Schwarz a Radim Kudla. | foto: Anna Vavríková, MAFRA

Systém umí rozpoznávat slova v mluvené řeči a převádět promluvy do psané podoby. Díky tomu je pak například možné pomocí klíčových slov vyhledávat ve zvukových nebo audiovizuálních záznamech - třeba z přednášek.

„Indexuje se to automaticky systémem pro rozpoznávání řeči, rozhodně to není tak, že by seděl nějaký otrok a přepisoval to,“ žertuje o své práci vedoucí skupiny BUT Speech@FIT při Vysokém učení technickém Jan Černocký.

Výzkumníci z Fakulty informačních technologií se rozpoznáváním řeči zabývají už skoro dvě dekády a celosvětově patří ke špičce v oboru. V závislosti na tématu a kvalitě promluvy jejich systémy dosahují při identifikaci slov vysoké přesnosti - přes 90 procent.

Uživatelské rozhraní, přes které si studenti brněnské fakulty informatiky mohou...

Uživatelské rozhraní, přes které si studenti brněnské fakulty informatiky mohou jednoduše vyhledávat v audiovizuálních záznamech přednášek.

Spolupracují s firmami, které dolování v řeči již používají ve svých produktech dostupných na trhu. Třeba společnost Phonexia cílí právě na zmíněné získávání bezpečnostních informací z řeči, prodává však i aplikace pro call centra a banky (rozhovor čtěte zde). Firma Lingea se zase soustředí na vyhledávání hlasem ve slovnících.

Schopnosti systému je možné využít například k diktování protokolů či lékařských zpráv, které jsou převedeny do psaného textu.

„Nyní jsme schopni rozpoznávat dobře v prostředí, kde je klid, člověk mluví srozumitelně přímo do mikrofonu. S těžkým prostředím, jakým je třeba zakouřená hlučná hospoda, je ještě potíž. Chceme ale, aby počítače v budoucnu dokázaly přepisovat řeč, detekovat mluvčího a informace z mluvené řeči i ve složitých případech a lépe než člověk,“ nastínil Černocký s tím, že je rád, že výsledky projektu přispěly ke vzniku reálných produktů pro zákazníky.

Člověk má výhodu, zná kontext

Podle něj je rozdíl, jestli má systém rozpoznávat pojmy z debaty o počasí nebo promluvy na mnohem složitější témata. Snadné to není také proto, že při běžné mezilidské komunikaci člověk většinou zná kontext setkání i samotného hovoru.

„Zná preference či politické a náboženské přesvědčení svého protějšku, které do promluvy mohou vstupovat. Má o něm a priori informace. Při porozumění řeči nezáleží jen na řeči samotné, plete se tam reprezentace znalostí celého lidstva. Není to jednoduchý úkol. Když se někdo bude bavit o tuningu rádiem ovládaných aut, tak standardní rozpoznávač vyhoří,“ dodal s tím, že systém učí i adaptaci na méně známé jazyky či dialekty.

Naučit systém nový jazyk jim nyní trvá zhruba půl roku, závisí na jeho obtížnosti a počtu slov. Třeba čeština s půl milionem slov ve spisovné podobě není nic lehkého. Spolupracují při tom s jazykovými odborníky - fonetikem a lingvistou.

V budoucnu by se však dosud neznámé jazyky mohly systémy učit samostatněji.

Projekt podpořila i Technologická agentura

„Pracujeme na algoritmech ‚učení bez učitele‘, aby rozpoznávače byly schopné se samy doučovat a samy trénovat na nové jazyky. Nejraději bychom jen napíchli počítač na internet a řekli systému: Stáhni si vše potřebné a nauč se to sám. Tohle je ale otázka spíš několika dalších desítek let,“ připustil Černocký.

Jednu z etap projektu podpořila skoro 24 miliony korun i Technologická agentura ČR. „Technologie tohoto typu tvoří vysokou přidanou hodnotu díky minimálním nákladům a možnosti vysokých příjmů z prodaných licencí za software,“ objasnil ředitel agentury Petr Očko, proč grant poskytli.

Podle něj jde o velmi důležitý výzkum s potenciálem přinést České republice významné zvýšení podílu hi-tech technologií v ekonomice a uplatnění na mezinárodních trzích.

Nejčtenější

Slavná vězenkyně Věra Sosnarová v gulagu nikdy nebyla, doložil historik

Podle životního příběhu Věry Sosnarové vznikla kniha Krvavé jahody.

Věra Sosnarová je známá jako jedna z posledních českých pamětnic sovětských koncentračních a pracovních táborů. Už před...

VIDEO: Smrt v autě přímo před vámi. Policie varuje před únavou při řízení

Nehoda

Záběry z hrozivé srážky, při níž se minulý týden čelně střetla dvě auta na tahu z Brna na Vídeň, zveřejnili policisté...

Erata čeká operace, dál chce hrát. Plekanec podepsal na rok s Kometou

Zadumaný Tomáš Plekanec na brněnské střídačce.

Hokejový útočník Tomáš Plekanec bude v další extraligové sezoně hrát za brněnskou Kometu. Na jaře přitom pomohl...

POHLED: Ardeleanu znovu píská v Brně! Tak ne, není to bezpečné

Rozhodčí Petr Ardeleanu měl ve 290. derby pražských S plné ruce práce.

Hodně krátkou paměť musel mít v českém fotbalovém prostředí ten, kdo rozhodoval o delegaci rozhodčích na 1. kolo druhé...

Bouřky se prohnaly Českem. Strhlá střecha na Karvinsku poškodila několik aut

Silný vítr strhl v Českém Těšíně střechu autoservisu (21. července 2019)

Přes Česko se prohnaly bouřky spojené se silným větrem. Nejvíce škody evidují hasiči v Moravskoslezském a Jihomoravském...

Další z rubriky

Věrní diváci přijdou do letního kina i za deště, říká jeho organizátorka

Monika Šimková ze spolku Noční motýl se stará o letní kino na nádvoří radnice...

Momenty, kdy vítr strhl plátno letního kina nebo kdy chlapík z bufetu zachraňoval vlastním DVD představení, či týdny,...

Bál jsem se mluvit na učitele, líčí buddhistický mnich studium v Brně

Buddhistický mnich Dharmapriya Sraman při stáži na Masarykově univerzitě...

Ze Srí Lanky do Brna se vydal buddhistický mnich Dharmapriya Sraman letos v únoru. Na šestiměsíčním studijním pobytu ho...

Z parkování v modrých zónách teče Brnu méně peněz, než odhadovalo

V brněnských ulicích začaly přípravy na rezidentní parkování. Pracovníci...

Příliv peněz z rezidentního parkování a z pokut od motoristů, který měl pokrýt další rozvoj modrých zón v Brně, vázne....

Jak naučit děti anglicky? Zkuste to během sportu nebo relaxace
Jak naučit děti anglicky? Zkuste to během sportu nebo relaxace

Hledala způsob, jak propojit učení s pohybem a naučit děti jazyk nenásilnou formou. Tereza Dědková založila před 4 lety projekt Little Bubbles, ve kterém spojila tři velké vášně: jógu, angličtinu a práci s dětmi. Jak to funguje a pro koho jsou Bublinky vhodné?

Najdete na iDNES.cz