iDNES.cz

Premium

Získejte všechny články
jen za 89 Kč/měsíc

Zprávy
Sport
Okresy
- Blansko
- Břeclav
- Brno-město
- Brno-venkov
- Hodonín
- Vyškov
- Znojmo
Tipy na výlet
Jízdní řády MHD
Veletrhy
Firmy
Kyjov
Náš kraj

Vědci učí počítače rozumět řeči. Z mumraje slov odhalí třeba i zločin

7. července 2016 17:50

Systémy, které vyvíjejí na Fakultě informačních technologií brněnského VUT, dokážou vyhledávat slova v mluvené řeči. Konkrétní výrazy rychle najdou i v tisících nahrávek. Díky tomu je ocení bezpečnostní složky, pomáhají ale i v call centrech.

Zvětšit fotografii

S VUT spolupracuje třeba firma Phonexia, která se zabývá hlavně dolováním bezpečnostních informací z řeči. Na snímku uprostřed jsou její zakladatelé Petr Schwarz a Radim Kudla. | foto: Anna Vavríková, MAFRA

Systém umí rozpoznávat slova v mluvené řeči a převádět promluvy do psané podoby. Díky tomu je pak například možné pomocí klíčových slov vyhledávat ve zvukových nebo audiovizuálních záznamech - třeba z přednášek.

„Indexuje se to automaticky systémem pro rozpoznávání řeči, rozhodně to není tak, že by seděl nějaký otrok a přepisoval to,“ žertuje o své práci vedoucí skupiny BUT Speech@FIT při Vysokém učení technickém Jan Černocký.

Výzkumníci z Fakulty informačních technologií se rozpoznáváním řeči zabývají už skoro dvě dekády a celosvětově patří ke špičce v oboru. V závislosti na tématu a kvalitě promluvy jejich systémy dosahují při identifikaci slov vysoké přesnosti - přes 90 procent.

Uživatelské rozhraní, přes které si studenti brněnské fakulty informatiky mohou jednoduše vyhledávat v audiovizuálních záznamech přednášek.

Spolupracují s firmami, které dolování v řeči již používají ve svých produktech dostupných na trhu. Třeba společnost Phonexia cílí právě na zmíněné získávání bezpečnostních informací z řeči, prodává však i aplikace pro call centra a banky (rozhovor čtěte zde). Firma Lingea se zase soustředí na vyhledávání hlasem ve slovnících.

Schopnosti systému je možné využít například k diktování protokolů či lékařských zpráv, které jsou převedeny do psaného textu.

„Nyní jsme schopni rozpoznávat dobře v prostředí, kde je klid, člověk mluví srozumitelně přímo do mikrofonu. S těžkým prostředím, jakým je třeba zakouřená hlučná hospoda, je ještě potíž. Chceme ale, aby počítače v budoucnu dokázaly přepisovat řeč, detekovat mluvčího a informace z mluvené řeči i ve složitých případech a lépe než člověk,“ nastínil Černocký s tím, že je rád, že výsledky projektu přispěly ke vzniku reálných produktů pro zákazníky.

Člověk má výhodu, zná kontext

Podle něj je rozdíl, jestli má systém rozpoznávat pojmy z debaty o počasí nebo promluvy na mnohem složitější témata. Snadné to není také proto, že při běžné mezilidské komunikaci člověk většinou zná kontext setkání i samotného hovoru.

„Zná preference či politické a náboženské přesvědčení svého protějšku, které do promluvy mohou vstupovat. Má o něm a priori informace. Při porozumění řeči nezáleží jen na řeči samotné, plete se tam reprezentace znalostí celého lidstva. Není to jednoduchý úkol. Když se někdo bude bavit o tuningu rádiem ovládaných aut, tak standardní rozpoznávač vyhoří,“ dodal s tím, že systém učí i adaptaci na méně známé jazyky či dialekty.

Naučit systém nový jazyk jim nyní trvá zhruba půl roku, závisí na jeho obtížnosti a počtu slov. Třeba čeština s půl milionem slov ve spisovné podobě není nic lehkého. Spolupracují při tom s jazykovými odborníky - fonetikem a lingvistou.

V budoucnu by se však dosud neznámé jazyky mohly systémy učit samostatněji.

Projekt podpořila i Technologická agentura

„Pracujeme na algoritmech ‚učení bez učitele‘, aby rozpoznávače byly schopné se samy doučovat a samy trénovat na nové jazyky. Nejraději bychom jen napíchli počítač na internet a řekli systému: Stáhni si vše potřebné a nauč se to sám. Tohle je ale otázka spíš několika dalších desítek let,“ připustil Černocký.

Jednu z etap projektu podpořila skoro 24 miliony korun i Technologická agentura ČR. „Technologie tohoto typu tvoří vysokou přidanou hodnotu díky minimálním nákladům a možnosti vysokých příjmů z prodaných licencí za software,“ objasnil ředitel agentury Petr Očko, proč grant poskytli.

Podle něj jde o velmi důležitý výzkum s potenciálem přinést České republice významné zvýšení podílu hi-tech technologií v ekonomice a uplatnění na mezinárodních trzích.

Autor: Martina Smutná

Témata: Fakulta, Vysoké učení technické, Informační technologie, Lingea, Jihomoravský kraj, Phonexia, Slovník, software, SPOZ - Strana práv občanů Zemanovci, počítač

Komerční sdělení

Plánovaný podzemní tunel na D43 v Brně má být zkrácený, starostové protestují

19. dubna 2024 6:05

Chystaná podzemní trasa dlouho slibované silnice je v dokumentech zkrácená i přes původní sliby....

Nehodu autobusů se 76 zraněnými způsobil zesnulý řidič. Jel příliš rychle

15. dubna 2024 14:16

Policisté uzavřeli tragický případ srážky autobusů, při níž se loni v létě na dálnici D2 u Brna...

{NADPIS reklamního článku dlouhý přes dva řádky}

{POPISEK reklamního článku, také dlouhý přes dva a možná dokonce až tři řádky, končící na tři tečky...}

Hasiči odstřelili trhavinou vysoký strom, výjimečný postup uzavřel silnici

12. dubna 2024 16:32

Místo běžného řezání pilou odstřel pomocí trhaviny. Výjimečný postup při likvidaci velkého...

Zábranský: Uděláme maximum, aby se Vsetín cítil jako doma a oslavil postup

13. dubna 2024 10:45

Ačkoliv hokejisté brněnské Komety z extraligového play off vypadli již před časem, přísun zápasů s...

{NADPIS reklamního článku dlouhý přes dva řádky}

{POPISEK reklamního článku, také dlouhý přes dva a možná dokonce až tři řádky, končící na tři tečky...}

Po dalším výprasku mění Zbrojovka trenéra, na lavičku půjde i Psotka

15. dubna 2024 15:56, aktualizováno 16:41

Čtvrtá porážka v řadě, celkově sedm zápasů bez výhry a pád do bojů o udržení ve druhé fotbalové...

VIDEO: Záchranáři lákají nováčky, ukázali resuscitaci muže po mafiánské popravě

19. dubna 2024 15:24

Drsnou scénou začíná nové náborové video jihomoravských záchranářů, kteří se tímto způsobem snaží...

Exšéfovi brněnské kriminálky soud zpřísnil trest, k pokutě přibyla podmínka

19. dubna 2024 13:59

Soud v Brně dnes uložil bývalému vedoucímu brněnské kriminální služby Vladimíru Machalovi roční...

Policie stíhá šest lidí kvůli korupci s byty v Brně, jde o další případ

19. dubna 2024 10:57

Kriminalisté z Národní centrály proti organizovanému zločinu (NCOZ) obvinili šest lidí kvůli...

Nejen hit od Guns N’ Roses. Slash vyšperkoval koncert v Brně velkolepým sólem

19. dubna 2024 9:59

Za mohutného burácení, potlesku publika a přesně na čas vtrhnul americký kytarista Slash se svými...

VEDOUCÍ SMĚN - VÝROBA (48-55.000 Kč)

Advantage Consulting, s.r.o.
Jihomoravský kraj
nabízený plat: 48 000 - 55 000 Kč

Dalších 48 168 volných pozic

Náhle zemřel zpěvák Maxim Turbulenc Daniel Vali, bylo mu 53 let

Ve věku 53 let zemřel zpěvák skupiny Maxim Turbulenc Daniel Vali. Letos by se svou kapelou oslavil 30 let na scéně....

Sexy Sandra Nováková pózovala pro Playboy. Focení schválil manžel

Herečka Sandra Nováková už několikrát při natáčení dokázala, že s odhalováním nemá problém. V minulosti přitom tvrdila,...

Charlotte spí na Hlaváku mezi feťáky, dluží spoustě lidí, říká matka Štikové

Charlotte Štiková (27) před rokem oznámila, že zhubla šedesát kilo. Na aktuálních fotkách, které sdílela na Instagramu...

Vykrojené trikoty budí emoce. Olympijská kolekce Nike je prý sexistická

Velkou kritiku vyvolala kolekce, kterou pro olympijský tým amerických atletek navrhla značka Nike. Pozornost vzbudily...

Rohlík pro dítě, nákup do kočárku. Co v obchodě projde a kdy už hrozí právník?

V obchodech platí pravidla, která občas zákazník nedodržuje. Někdy se navoní parfémem, aniž by použil tester, nebo...

MS v hokeji 2024

Zaměstnání

Střední školy

Biatlon 23/24

Vláda

Témata

Nepřehlédněte

iDNES.cz

© 1998–2024 MAFRA, a. s. a dodavatelé Profimedia, Reuters, ČTK, AP. Rozmnožování obsahu pro účely automatizované analýzy textů nebo dat dle ustanovení § 39c autorského zákona je bez souhlasu MAFRA, a. s. zakázáno. Jakékoliv užití obsahu včetně převzetí, šíření či dalšího zpřístupňování článků a fotografií je bez souhlasu MAFRA, a. s. zakázáno. Provozovatelem serveru iDNES.cz je MAFRA, a. s. IČ: 45313351.

mobilní verze

Přihlášení