Premium

Získejte všechny články
jen za 89 Kč/měsíc

Vědci učí počítače rozumět řeči. Z mumraje slov odhalí třeba i zločin

  17:50
Systémy, které vyvíjejí na Fakultě informačních technologií brněnského VUT, dokážou vyhledávat slova v mluvené řeči. Konkrétní výrazy rychle najdou i v tisících nahrávek. Díky tomu je ocení bezpečnostní složky, pomáhají ale i v call centrech.

S VUT spolupracuje třeba firma Phonexia, která se zabývá hlavně dolováním bezpečnostních informací z řeči. Na snímku uprostřed jsou její zakladatelé Petr Schwarz a Radim Kudla. | foto: Anna Vavríková, MAFRA

Systém umí rozpoznávat slova v mluvené řeči a převádět promluvy do psané podoby. Díky tomu je pak například možné pomocí klíčových slov vyhledávat ve zvukových nebo audiovizuálních záznamech - třeba z přednášek.

„Indexuje se to automaticky systémem pro rozpoznávání řeči, rozhodně to není tak, že by seděl nějaký otrok a přepisoval to,“ žertuje o své práci vedoucí skupiny BUT Speech@FIT při Vysokém učení technickém Jan Černocký.

Výzkumníci z Fakulty informačních technologií se rozpoznáváním řeči zabývají už skoro dvě dekády a celosvětově patří ke špičce v oboru. V závislosti na tématu a kvalitě promluvy jejich systémy dosahují při identifikaci slov vysoké přesnosti - přes 90 procent.

Uživatelské rozhraní, přes které si studenti brněnské fakulty informatiky mohou jednoduše vyhledávat v audiovizuálních záznamech přednášek.

Spolupracují s firmami, které dolování v řeči již používají ve svých produktech dostupných na trhu. Třeba společnost Phonexia cílí právě na zmíněné získávání bezpečnostních informací z řeči, prodává však i aplikace pro call centra a banky (rozhovor čtěte zde). Firma Lingea se zase soustředí na vyhledávání hlasem ve slovnících.

Schopnosti systému je možné využít například k diktování protokolů či lékařských zpráv, které jsou převedeny do psaného textu.

„Nyní jsme schopni rozpoznávat dobře v prostředí, kde je klid, člověk mluví srozumitelně přímo do mikrofonu. S těžkým prostředím, jakým je třeba zakouřená hlučná hospoda, je ještě potíž. Chceme ale, aby počítače v budoucnu dokázaly přepisovat řeč, detekovat mluvčího a informace z mluvené řeči i ve složitých případech a lépe než člověk,“ nastínil Černocký s tím, že je rád, že výsledky projektu přispěly ke vzniku reálných produktů pro zákazníky.

Člověk má výhodu, zná kontext

Podle něj je rozdíl, jestli má systém rozpoznávat pojmy z debaty o počasí nebo promluvy na mnohem složitější témata. Snadné to není také proto, že při běžné mezilidské komunikaci člověk většinou zná kontext setkání i samotného hovoru.

„Zná preference či politické a náboženské přesvědčení svého protějšku, které do promluvy mohou vstupovat. Má o něm a priori informace. Při porozumění řeči nezáleží jen na řeči samotné, plete se tam reprezentace znalostí celého lidstva. Není to jednoduchý úkol. Když se někdo bude bavit o tuningu rádiem ovládaných aut, tak standardní rozpoznávač vyhoří,“ dodal s tím, že systém učí i adaptaci na méně známé jazyky či dialekty.

Naučit systém nový jazyk jim nyní trvá zhruba půl roku, závisí na jeho obtížnosti a počtu slov. Třeba čeština s půl milionem slov ve spisovné podobě není nic lehkého. Spolupracují při tom s jazykovými odborníky - fonetikem a lingvistou.

V budoucnu by se však dosud neznámé jazyky mohly systémy učit samostatněji.

Projekt podpořila i Technologická agentura

„Pracujeme na algoritmech ‚učení bez učitele‘, aby rozpoznávače byly schopné se samy doučovat a samy trénovat na nové jazyky. Nejraději bychom jen napíchli počítač na internet a řekli systému: Stáhni si vše potřebné a nauč se to sám. Tohle je ale otázka spíš několika dalších desítek let,“ připustil Černocký.

Jednu z etap projektu podpořila skoro 24 miliony korun i Technologická agentura ČR. „Technologie tohoto typu tvoří vysokou přidanou hodnotu díky minimálním nákladům a možnosti vysokých příjmů z prodaných licencí za software,“ objasnil ředitel agentury Petr Očko, proč grant poskytli.

Podle něj jde o velmi důležitý výzkum s potenciálem přinést České republice významné zvýšení podílu hi-tech technologií v ekonomice a uplatnění na mezinárodních trzích.

  • Nejčtenější

Budou se měnit učebnice? Vědci z Brna zobrazili reálnou podobu chromozomu

Obrázky chromozomu, které vídáme v učebnicích biologie, se zřejmě budou muset brzy proměnit. Vědcům v Brně se totiž jako prvním na světě podařilo zobrazit reálnou podobu chromozomu, o což se dosud...

18. července 2024  14:22

Bára občas vzplane jako benzin. Odchod do šatny není taktika, říká Kartus

Premium

Je to už více než rok, co tenisový trenér Aleš Kartus nevede Barboru Krejčíkovou, jejich pětiletá spolupráce skončila loni před Wimbledonem. Ze špičky okruhu WTA se pak Kartus sice stáhl, svoji...

15. července 2024

{NADPIS reklamního článku dlouhý přes dva řádky}

{POPISEK reklamního článku, také dlouhý přes dva a možná dokonce až tři řádky, končící na tři tečky...}

Cizoložství skončilo lynčem. Dav žen hnal nebožačku na provaze, nevěrník utekl

Premium

Odhalená nevěra, rozběsněný dav i zbabělý starosta v žaláři figurují v dalším dílu seriálu Stoleté mordy. Kauza z Lukovan, stará dlouhých 172 let, si připomenutí zaslouží, i když smrtí neskončila....

21. července 2024

V Brně se jeden čas nedalo pít pivo, říká historik. Bylo nápojem chudých

Chmelový mok je s českým národem spjatý od nepaměti. A to i na jižní Moravě, kterou si všichni spojují spíše s vínem. Historik pivovarnictví Filip Vrána se zaměřil na počátky i současnost pivní...

17. července 2024  10:24

{NADPIS reklamního článku dlouhý přes dva řádky}

{POPISEK reklamního článku, také dlouhý přes dva a možná dokonce až tři řádky, končící na tři tečky...}

Mezi Lednicí a Břeclaví vykolejil historický vlak, škoda jsou dva miliony

Historický osobní vlak, který v turistické sezoně jezdí mezi Břeclaví a Lednicí na Břeclavsku, v neděli po poledni vykolejil poblíž Lednice. Jedna část vlaku zůstala na kolejích, vykolejily vagony, v...

14. července 2024  17:18

Jih Brna mění tvář, dostane modernější střih. Starousedlíci ale vzdorují

Investoři chystají na území Brna-jih velké projekty. Přinesou stovky bytů a ještě vyšší počty pracovních míst, zároveň však do oblasti přivedou další množství automobilů. Lidé z dotčených oblastí z...

22. července 2024  5:25

Cizoložství skončilo lynčem. Dav žen hnal nebožačku na provaze, nevěrník utekl

Premium

Odhalená nevěra, rozběsněný dav i zbabělý starosta v žaláři figurují v dalším dílu seriálu Stoleté mordy. Kauza z Lukovan, stará dlouhých 172 let, si připomenutí zaslouží, i když smrtí neskončila....

21. července 2024

Provoz na dálnici D46 na dvě hodiny oboustranně zastavila nehoda šesti aut

Jeden jízdní pruh dálnice D46 ve směru na Prostějov je po odpolední nehodě šesti aut u Pustiměře na Vyškovsku průjezdný. Na otevření druhého pruhu policisté stále pracují, řidiči jezdí odklonem přes...

21. července 2024  14:31,  aktualizováno  16:49

Dělníci se denně sápou do kopce, líčí záchranu Děviček jejich milovník

Děvičky jsou jeho celoživotní srdcová záležitost. Jako rodák z blízkých Starovic, kterého fascinuje historie, archeologie a genealogie, navštěvuje jihomoravskou ikonu od dětství. Přestože více než tu...

20. července 2024  12:15

Za celosvětový kolaps IT systémů může nečekaně absurdní chyba

Nepovedená aktualizace bezpečnostního softwaru společnosti Crowdstrike způsobila pád počítačů a serverů s operačním...

IT problémy způsobily kolaps bank i letišť. V Evropě i jinde ve světě

Řadu zemí v pátek zasáhly problémy s počítačovými systémy. Letiště kvůli výpadku čelila potížím s odbavováním letů,...

Restauratéři chtějí zakázat vstup Biance Censori, vadí jim její odhalování

Přítelkyně rappera Kanyeho Westa (47) Bianca Censori (29) je známá svým stylem „oblečená neoblečená“ a snaží se šokovat...

Piju každý den. Dřív nebo později se upiju k smrti, líčí bývalý fotbalista Fenin

Fotbalista Martin Fenin (37) neprožívá nejlepší období. Nejen, že mu nevyšlo manželství s policistkou Beatou, se kterou...

John Deere už nechce být woke. Podlehl tlaku konzervativců a řadí zpátečku

Přední americký výrobce zemědělských strojů John Deere se rozhodl ustoupit od svých iniciativ v oblasti podpory...