Vědci učí počítače rozumět řeči. Z mumraje slov odhalí třeba i zločin

  17:50aktualizováno  17:50
Systémy, které vyvíjejí na Fakultě informačních technologií brněnského VUT, dokážou vyhledávat slova v mluvené řeči. Konkrétní výrazy rychle najdou i v tisících nahrávek. Díky tomu je ocení bezpečnostní složky, pomáhají ale i v call centrech.

S VUT spolupracuje třeba firma Phonexia, která se zabývá hlavně dolováním bezpečnostních informací z řeči. Na snímku uprostřed jsou její zakladatelé Petr Schwarz a Radim Kudla. | foto: Anna Vavríková, MAFRA

Systém umí rozpoznávat slova v mluvené řeči a převádět promluvy do psané podoby. Díky tomu je pak například možné pomocí klíčových slov vyhledávat ve zvukových nebo audiovizuálních záznamech - třeba z přednášek.

„Indexuje se to automaticky systémem pro rozpoznávání řeči, rozhodně to není tak, že by seděl nějaký otrok a přepisoval to,“ žertuje o své práci vedoucí skupiny BUT Speech@FIT při Vysokém učení technickém Jan Černocký.

Výzkumníci z Fakulty informačních technologií se rozpoznáváním řeči zabývají už skoro dvě dekády a celosvětově patří ke špičce v oboru. V závislosti na tématu a kvalitě promluvy jejich systémy dosahují při identifikaci slov vysoké přesnosti - přes 90 procent.

Uživatelské rozhraní, přes které si studenti brněnské fakulty informatiky mohou...

Uživatelské rozhraní, přes které si studenti brněnské fakulty informatiky mohou jednoduše vyhledávat v audiovizuálních záznamech přednášek.

Spolupracují s firmami, které dolování v řeči již používají ve svých produktech dostupných na trhu. Třeba společnost Phonexia cílí právě na zmíněné získávání bezpečnostních informací z řeči, prodává však i aplikace pro call centra a banky (rozhovor čtěte zde). Firma Lingea se zase soustředí na vyhledávání hlasem ve slovnících.

Schopnosti systému je možné využít například k diktování protokolů či lékařských zpráv, které jsou převedeny do psaného textu.

„Nyní jsme schopni rozpoznávat dobře v prostředí, kde je klid, člověk mluví srozumitelně přímo do mikrofonu. S těžkým prostředím, jakým je třeba zakouřená hlučná hospoda, je ještě potíž. Chceme ale, aby počítače v budoucnu dokázaly přepisovat řeč, detekovat mluvčího a informace z mluvené řeči i ve složitých případech a lépe než člověk,“ nastínil Černocký s tím, že je rád, že výsledky projektu přispěly ke vzniku reálných produktů pro zákazníky.

Člověk má výhodu, zná kontext

Podle něj je rozdíl, jestli má systém rozpoznávat pojmy z debaty o počasí nebo promluvy na mnohem složitější témata. Snadné to není také proto, že při běžné mezilidské komunikaci člověk většinou zná kontext setkání i samotného hovoru.

„Zná preference či politické a náboženské přesvědčení svého protějšku, které do promluvy mohou vstupovat. Má o něm a priori informace. Při porozumění řeči nezáleží jen na řeči samotné, plete se tam reprezentace znalostí celého lidstva. Není to jednoduchý úkol. Když se někdo bude bavit o tuningu rádiem ovládaných aut, tak standardní rozpoznávač vyhoří,“ dodal s tím, že systém učí i adaptaci na méně známé jazyky či dialekty.

Naučit systém nový jazyk jim nyní trvá zhruba půl roku, závisí na jeho obtížnosti a počtu slov. Třeba čeština s půl milionem slov ve spisovné podobě není nic lehkého. Spolupracují při tom s jazykovými odborníky - fonetikem a lingvistou.

V budoucnu by se však dosud neznámé jazyky mohly systémy učit samostatněji.

Projekt podpořila i Technologická agentura

„Pracujeme na algoritmech ‚učení bez učitele‘, aby rozpoznávače byly schopné se samy doučovat a samy trénovat na nové jazyky. Nejraději bychom jen napíchli počítač na internet a řekli systému: Stáhni si vše potřebné a nauč se to sám. Tohle je ale otázka spíš několika dalších desítek let,“ připustil Černocký.

Jednu z etap projektu podpořila skoro 24 miliony korun i Technologická agentura ČR. „Technologie tohoto typu tvoří vysokou přidanou hodnotu díky minimálním nákladům a možnosti vysokých příjmů z prodaných licencí za software,“ objasnil ředitel agentury Petr Očko, proč grant poskytli.

Podle něj jde o velmi důležitý výzkum s potenciálem přinést České republice významné zvýšení podílu hi-tech technologií v ekonomice a uplatnění na mezinárodních trzích.

Nejčtenější

Hašek titul JUDr. neměl získat. Jeho práce by propadla i jako seminárka

MF DNES získala rigorózní práci Michala Haška

Rigorózní práci, díky které Michal Hašek získal titul JUDr. ve slovenském Sládkovičově, exhejtman 7 let tají. MF DNES...

Eda z Mostu! je moje role snů. Lidé mě zdraví „drž úhel“, říká Isteník

Michal Isteník hraje výčepního Edu, který v Mostě provozuje hospodu Severka....

Seriál Most! protkaný nekorektním humorem trhá divácké rekordy. Diváky baví i impotentní výčepní Eda, ztvárněný...

Cinklé sázky na fotbal? Podezření padlo na klub ze Znojma

Korupce ve fotbale - ilustrační foto

Druholigové fotbalové Znojmo čelí podezření. Jeho zápasy v zimní přípravě mohly být zmanipulované. Problémy na jih...

Špinavé fotbalové pavučiny. Jak hluboký je problém, který řeší Znojmo?

Stadion fotbalového Znojma

Znělo to jako mimořádně lákavá nabídka. Tak lákavá, že je až s podivem, že nevzbudila podezření. Když tajemní...

Plekanec se rozloučil s Kometou. Gól nedal, ale v bránění byl vzorem

Zadumaný Tomáš Plekanec na brněnské střídačce.

V seznamu střelců hokejové Komety byste jeho jméno hledali marně, přesto si služeb hvězdného Tomáše Plekance v Brně...

Další z rubriky

Tanec pomáhá lidskému mozku, zlepšuje pozornost i řeč, ukázal výzkum

Ilustrační snímek

V rytmech country, jazzu i afrických tanců se půl roku pravidelně vlnili zdraví lidé nad 60 let a lidé s mírnou...

Vědecký park za čtvrt miliardy je na obtíž, prodělává a spolupráce vázne

Budova v Králově Poli nabízí zázemí technologickým firmám. VUT očekávalo, že...

Vysoké učení technické v Brně začíná dávat ruce pryč od soukromého vědecko–technologického parku u výzkumného institutu...

Na vesnicích vybudují společné zahrady. Poslouží k výuce i setkávání

Ilustrační snímek

Na jižní Moravě vzniknou sdílené zahrady. Poslouží dětem k výuce i k příjemnému posezení. Takovou cestou jdou zatím tři...

Najdete na iDNES.cz