Vědcům se podařilo „odposlechnout“ z mozku čísla, na která člověk myslel | foto: montáž: Pavel Kasík, Technet.cz

Počítač pozná, co se vám honí hlavou. Vědci umí přeložit myšlenky do slov

  • 49
Lidský mozek nevnímá slova jen jako zvuky. I proto je obtížné odhalit, co se v něm děje. Vědci z Columbia University dokázali pomocí implantátu a strojového učení zrekonstruovat řeč přímo ze signálů naměřených v mozku. Cesta ke „čtení myšlenek“ však bude ještě dlouhá.

V posledních letech se vyrojila řada ukázek toho, jak uplatnit umělou inteligenci, což je nepřesná přezdívka pro počítačové neuronové sítě. Nástroje strojového učení se využívají k překladu cizích jazyků, generování obličejů i videomontáží nebo k hraní složitých deskových her.

Dnes se však podíváme na zajímavý příklad, kdy byla umělá inteligence využita k analýze jiné neuronové sítě. Té tradičnější, která strojové učení inspirovala. Vědci využili počítačovou neuronovou síť k analýze činnosti neuronů v lidském mozku.

Mozek nezaznamenává signály z uší tak, jako je zaznamenává třeba diktafon na magnetofonovou pásku. Ve sluchové kůře mozkové, kam signály ze sluchového ústrojí proudí, dochází zřejmě k jakési interpretaci, například k odlišení důležitých zvuků od šumu. Funkční magnetická analýza mozku ukazuje, že jinak například vnímáme slova v jazyce, kterému rozumíme, a jinak ostatní zvuky. Naše smyslové vnímání je navíc „rozsekané“ do intervalů, mozek tedy namísto nepřetržité aktivity rytmicky „osciluje“.

Bylo by však z naměřené aktivity mozku možné zpětně dekódovat, co mozek právě analyzuje? Právě o to se pokusili vědci z Zuckermanova institutu na Columbia University v New Yorku. Jejich práce s názvem „Směrem k rekonstrukci srozumitelné řeči z lidské sluchové kůry mozkové“ vyšla v recenzovaném odborném časopise Nature - Scientific Reports (PDF).

Než se dostaneme k aktuální studii, připomeňme si, že snaha vědců „podívat se lidem do mozku“ není nijak nová. Moderní metody zahrnují již zmíněnou funkční magnetickou rezonanci nebo povrchové měření elektrické aktivity EEG.

Operace mozku (ilustrační foto)

Přímým předchůdcem právě vydané studie je práce publikovaná v PLOS roku 2012 (PDF). K měření využila invazivní metody: elektrod vložených operativně přímo na povrch lidského mozku.

Vědcům se tehdy podařilo analýzou elektrických signálů rozpoznat některá konkrétní slova pomocí vizuální rekonstrukce na spektrogramu.

Studie publikovaná v roce 2012 ukazovala, jak pomocí elektrod v mozku (znázorněná červenou mřížkou) analyzovat a rekonstruovat zaslechnutá slova na úrovni sluchové kůry mozkové.

Na studii z roku 2012 se podílel i doktor Nima Mesgarani, který vedl tým newyorských vědců v aktuální studii. Také tentokrát využili vědci u pěti pacientů implantáty monitorující jemné elektrické signály na povrchu kůry mozkové. Kromě toho přidali další vrstvu – počítačově simulovanou neuronovou síť, tedy strojové učení.

Trénování simulovaného sluchu

„Abychom posunuli hranice dosud nejlepších neuroprotéz, zkombinovali jsme současné pokroky ve strojovém učení s pokroky v syntéze řeči,“ uvádějí vědci ve shrnutí práce. „To nám umožňuje rekonstruovat srozumitelnou řeč přímo z lidské sluchové kůry mozkové.“

Pěti pacientům (kteří měli před sebou tak jako tak operaci mozku kvůli epilepsii) vědci do mozku voperovali jemnou mřížku elektrod. Poté pacienti poslouchali 30 minut příběhů čtených čtyřmi různými čtenáři. Během čtení museli pacienti poslouchat, což vědci namátkou kontrolovali náhodnými pauzami a otázkami.

Těchto třicet minut sloužilo k naměření toho, jak mozek posluchačů reaguje na známá data, tedy na známá slova. Na těchto datech se natrénovala umělá neuronová síť kombinující různé zapojení neuronů do vrstev.

Vědci ukázali, jak z dat získaných elektrodami na povrchu mozku pacienta rekonstruovat, co pacienti slyší. Využili k tomu počítačovou neuronovou síť a syntetizátor řeči.

Poté pacienti poslouchali, jak jim někdo čte čísla od nuly do devítky (tato slova přitom nebyla součástí trénovacích dat). Data naměřená v mozku pacientů pak vědci prohnali natrénovanou neuronovou sítí. K prezentaci výsledků nakonec využili různé druhy syntezátorů řeči. Výsledkem je roboticky znějící hlas, který je sice místy značně zkreslený, ale celkově srozumitelný.

Poslechněte si, jak vědci zrekonstruovali zvuková data z měření v mozku:

„Ukázali jsme, že lidé těmto (syntetizovaným, pozn. red.) slovům rozumí v 75 % případů, což je více, než v jakémkoli předchozím pokusu,“ uvádí vedoucí pokusu Mina Mesgarani. „Citlivý dekodér hlasu a mocné neuronové sítě dokázaly reprodukovat slova, která pacienti slyšeli, s překvapivou přesností.“

Mesgaraniho tým plánuje do budoucna složitější pokusy, včetně rozpoznávání komplikovaných slovních spojení a celých vět. Cílem je přiblížit se porozumění toho, jak lidský mozek reprezentuje a vnímá řeč. To by časem mohlo vést k vývoji implantátu, který by umožňoval převést myšlenky na řeč a usnadnit tak život pacientům, kteří kvůli nemoci nebo úrazu přišli o hlas. 

Nyní komunikují prostřednictvím složitých zařízení a výběru slov z obrazovky. V budoucnu by podle Mesgaraniho bylo možné, aby byla řeč syntetizovaná přímo signály z mozku: „Byla by to revoluce. Dalo by to těmto lidem novou spojení se světem.“

Kromě toho by bylo takový implantát zřejmě možné použít i k dalším diagnostickým účelům. A samozřejmě také ke svatému grálu všech dystopických sci-fi thrillerů: čtení myšlenek.