Premium

Získejte všechny články
jen za 89 Kč/měsíc

Budoucnost má hlas roztržité sekretářky. Google umí napodobit telefonát

  0:45aktualizováno  1:30
„Ehm, ráda bych rezervovala něco na třetího května,“ zní v telefonu nejistý hlas. Kadeřnice netuší, že na druhé straně není člověk, ale robotický hlas využívající prvky strojového učení. Sundar Pichai, šéf společnosti Google, ukázal, jak podle něj vypadá budoucnost digitálních asistentů.
Fotogalerie4

Google předvedl digitální asistentku, která za vás vyřídí telefonáty. A druhá strana nejspíš ani nepozná, že mluvila s robotem. | foto: montáž: Pavel Kasík, Technet.czProfimedia.cz

Umělá inteligence a strojové učení na prvním místě - tak by se dala shrnout úvodní řeč Sundara Pichaie, šéfa společnosti Google, na vývojářské konferenci Google I/O v kalifornském Mountain View. Google samozřejmě různé prvky používá v řadě služeb: zapojil ji do překladu textů nebo do rozpoznávání fotografií.

Google asistent „bydlí“ například v chytrém reproduktoru Google Home

Když se ale mluví o umělé inteligenci, pozornost budí především digitální asistent. Částečně je to nepochopení toho, co umělá inteligence je. Když se lidé baví s digitální asistentkou typu Google Home nebo Alexa, velkou část oné „osobnosti“ vytvořili programátoři, scénáristé a odborníci na komunikaci To ovšem neznamená, že by nebylo strojové učení při dialogu klíčové. Žádný scénárista nemůže předvídat všechny možné otázky a příkazy, a proto se musí - alespoň v rámci nějakých mantinelů - stroj učit základnímu porozumění přirozené řeči.

Překvapivě důvěryhodná nápodoba telefonistky

A tím se dostáváme k našemu oblíbenému momentu celé letošní Keynote (tříhodinový záznam je na YouTube). K momentu, kdy Pichai vysvětluje, jak asistent ušetří lidem čas tím, že za ně vyřídí některé nudné nebo monotónní záležitosti. Třeba rezervaci u kadeřníka.

„Dokonce i v USA nemá 60 procent  malých firem žádný on-line rezervační systém,“ uvedl Pichai. „Myslíme si, že s tímto problémem může pomoci umělá inteligence.“

Překvapenému publiku vzápětí pouští „reálný telefonát“, který nahráli v rámci experimentů s asistentem. Požadavek na Google Asistenta zněl: rezervuj mi sestřih u kadeřníka v úterý mezi desátou a dvanáctou.

Ukázka z hovoru mezi Google Asistentem a kadeřnicí:

Přiznáme se, že máme pochopení pro překvapený potlesk přítomného publika. Hlas počítače nezní ani v nejmenším strojově. Obsahuje pauzy, nejisté odmlky, nádechy, hovorové fráze nebo neurčitá „é“ a vyčkávací „m-hm“. Jsme přesvědčeni, že po telefonu by měl člověk na druhé straně velký problém poznat, že nemluví s jiným člověkem, ale s počítačem, zvláště vzhledem k pohotovým a smysluplným odpovědím.

Překlad reálného telefonního rozhovoru AI a člověka

Kadeřnice: Dobrý den, jak vám mohu pomoci?
Google Assistant: Dobrý den, volám ohledně rezervace dámského střihu pro svou klientku. Ehm, ráda bych rezervovala něco na třetího května.
Kadeřnice: Jistě, momentík, prosím...
Google Assistant: M-hm.
Kadeřnice: Takže, jaký čas by se vám hodil?
Google Assistant: Ve dvanáct hodin.
Kadeřnice: Ve dvanáct hodin volno nemáme. Nejdříve pak až ve čtvrt na dvě.
Google Assistant: Máte něco mezi desátou a, é, dvanáctou?
Kadeřnice: Podle toho, o jakou službu jde. O jakou službu má zájem?
Google Assistant: Jen dámské stříhání, prozatím.
Kadeřnice: Dobře, máme volno v deset.
Google Assistant: Deset je v pohodě.
Kadeřnice: Dobře, jaké je její křestní jméno?
Google Assistant: Křestní jméno je Lisa.
Kadeřnice: Super. Tak Lisu budeme čekat třetího května v deset hodin.
Google Assistant: OK, výborně. Díky.
Kadeřnice: Výborně. Hezký den, na shledanou.

Ne každý telefonát jde samozřejmě takto snadno. V reálném světě telefonických konverzací (i těch obyčejných, mezilidských) existují omyly, přeslechnutí, nedorozumění a další bariéry. Jak si s tím nová služba, pojmenovaná Google Duplex (součást Asistenta Google), poradí?

Zatím jen rezervace. Asistent předstírá zájem i omyl

Vytvořit konverzační program, který je k nerozeznání od člověka, je nesmírně složitý a komplexní úkol (viz též Turingův test). Služba Google Duplex si pro začátek stanovila velmi konkrétní cíl: jejich konverzace se točí výhradně kolem předem definovaných úkolů, které lidé přes telefon vyřizují.

Konkrétně jde o rezervaci termínu, protože tam lze do značné míry předvídat všechny představitelné scénáře: mají volno, nemají volno, mají volno, ale pro méně osob, nemají ten den otevřeno, na daný čas není potřeba rezervace apod.

Příklad rezervace v restauraci (objednává Google Duplex):

Tato ukázka dobře demonstruje schopnost Duplexu vypořádat se s nepochopením - reaguje tak, že opakuje požadavek jinými slovy a potvrzuje to, čemu osoba na druhé straně porozuměla. Duplex dokázal reagovat i na změnu tématu a nakonec správně pochopil, že kvůli rezervaci volá zbytečně, protože restaurace v tu dobu není plná a pro čtyři lidi rezervaci nepotřebuje.

Přirozená a příjemná konverzace je ostatně málokdy stoprocentně efektivní. Proto vývojáři do služby Duplex zabudovali různé zdvořilosti, zažité fráze a hovorové „zlozvyky“, které celou komunikaci polidšťují. Digitální asistent (či asistentka, vývojáři testují více různých hlasů) tak třeba na otázku „Pro kolik lidí“ místo jednoduchého „4“ odpoví „É, pro čtyři lidi, prosím.“

Stejně tak je Duplex naprogramovaný na to, aby pro jistotu zopakoval to, jak druhou stranu pochopil. Například v angličtině „OK for four“ může znamenat jak „můžete přijít ve čtyři hodiny“, tak „máme místo pro čtyři lidi“, záleží na kontextu konverzace.

Určitý problém má služba Duplex s upovídanými lidmi, kteří používají dlouhé a složité věty namísto vět krátkých. Například na otázku „Kdy máte otevřeno?“ dostal Duplex v rámci testu odpověď: „No, takže, od úterka do čtvrtka jsme otevření od jedenácti do dvou, a pak znovu otevíráme od čtyř do devíti, a pak v pátek, sobotu a neděli... nebo v pátek a v sobotu máme otevřeno od jedenácti do devíti a v neděli od jedné do devíti.“ V takovém případě umělé inteligenci nezbývá, než se ptát upřesňující otázky a zvažovat destíky různých scénářů aplikovatelných na danou situaci.

Schéma generování odpovědi Google Duplex: rozpoznávání řeči (ASR) převede hlas na text. Ten spolu s kontextem konverzace, kalendářem, vyjádřenými preferencemi apod. služba Duplex analyzuje a výslednou odpověď převede z textu na řeč (TTS).

Z těchto scénářů vybírá Google Duplex pomocí neuronové sítě (RRN) postavené na platformě TensorFlow Extended.

Éh, ummm, jasňačka!

Pro generování přirozeně znějícího hlasu pak Google využívá syntézu řeči Tacotron a WaveNet. Programátoři vyvinuli způsob, jak do výsledné řeči vkládat „vycpávková slova“ typu eh, hm, aha. Tím zároveň - podobně jako lidé - hrají o čas v případě, že ještě systém vyhodnocuje vstup z druhé strany. Hovor tak působí jako přirozenější a plynulejší - největší prodleva je desetina sekundy, což je ve srovnání s konverzací s Alexou, Siri nebo Google Asistentem ohromný pokrok.

Ukázka rezervace stolu v restauraci (všiměte si vycpávkových nejistých slov):

Kromě rezervace termínů na přání zákazníka chce Google využít tuto konverzační službu i k doplňování aktuálních informací. Například otevírací hodiny řady podniků na Mapách Google mají problém - obvykle nereflektují svátky. Lidé tak nemohou vědět, zda se ve státní svátek mohou na tyto údaje spolehnout, a nezbývá jim, než do obchodu zavolat. Google plánuje využít Duplex k automatickému obvolávání podniků před svátky: „Máte příští pondělí, jak je svátek, otevřeno?“ Podle odpovědi pak Google vyplní údaje v mapách, což podle šéfa Google ušetří čas uživatelům i podnikům.

Budoucnost, nebo přechodná fáze?

Nakolik je služba použitelná, to ukáží příští měsíce. Už to, že jsme neviděli živou demonstraci, ale jen záznamy vybraných ukázek, svědčí o tom, že zatím si vývojáři nemohou být produktem stoprocentně jisti. Google bude službu přes léto dál testovat. Už nyní jsou ale výsledky - ač jistě pečlivě vybrané - nečekaně realistické.

Bude zajímavé sledovat, jak tato služba zasáhne do komunikace. Protože stejně tak si mohou podobného digitálního asistenta pořídit i kadeřníci a restaurace. Budou si pak stroje předávat informace o objednávkách a rezervacích lidskou řečí?  Nebo jde jen o dočasné řešení neefektivních rezervací, a v budoucnu bude jeden robotický asistent komunikovat s druhým pomocí jednoznačných a přesně definovaných požadavků?

Každopádně v budoucnu bude otázka „mluvím prosím s člověkem, nebo s počítačem?“ možná běžnou součástí naší telefonní konverzace.

Aktualizace: Do článku jsme doplnili ukázky a vysvětlení.

Poznali jste v ukázkách telefonátů Google Duplex, že jde o počítačem generovaný hlas?

celkem hlasů: 1237
Hlasování skončiloČtenáři hlasovali do 0:00 středa 16. května 2018. Anketa je uzavřena.

Nejčtenější

Kolik stojí Oneplay, na čem se dá sledovat a jaký je přechod z Voyo a O2 TV

Televize O2 TV se sloučila s internetovou streamovací platformou televize Nova Voyo a vznikla nová služba Oneplay. Kolik stojí nové tarifní balíčky? Na kolika zařízeních je možné kanály sledovat? A...

Pozor, letadlovka! Se stotisícitunovým ocelovým kolosem se srazit nechcete

Nedávná srážka americké letadlové lodě s obchodním plavidlem dopadla celkem dobře. Nedošlo ke zraněním. Materiální škody byly zřejmě jen malé. Ne každý, kdo se pohyboval v blízkosti letadlové lodě...

Možná se blíží konec rakety, která měla vozit lidi k Měsíci i Marsu

Je to raketa, která měla vrátit americké astronauty na Měsíc a jednoho dne je poslat k Marsu. Teď se nad ní ovšem vznáší reálná hrozba až jistota zrušení. Jmenuje se SLS (Space Launch System,...

Proč ten poprask? Oneplay má fajn aplikaci, hodně obsahu, technicky nenadchne

Premium

Na šesti různých zařízeních jsme vyzkoušeli novou službu Oneplay, která nahradila Voyo a O2 TV. Prozkoumali jsme jak aplikace a nabídku, tak technická omezení podporovaných zařízení i příslušné...

Zbraně, smrt a sklady pokladů. Zima 1945 byla v Sudetech tou nejkrutější

V minulém díle našeho miniseriálu k příležitosti osmdesátého výročí konce druhé světové války jsme si připomněli, jakou roli hrál Liberec jako centrum nacistické moci. Nyní se opět vracíme do oblasti...

Pitvy mimozemšťanů studenty učí myslet jinak a neskočit na špek, říká astrobiolog

Premium

Tomáš Petrásek jako oceňovaný vědec má dar nekonvenčního myšlení, poutavými přednáškami umí zaujmout studenty i veřejnost. Nezdráhá se vyprávět třeba o mimozemšťanech. Jak říká, pokud je vesmír...

16. března 2025

Vynalezli ruchadlo v roce 1825, či o dva roky později? Národní listy měly jasno

V březnu 1925 slavily české Národní listy sto let od velkého vynálezu: ruchadla bratranců Veverkových. Obecně se spíš uznává pozdější datum: rok 1827.

16. března 2025

Možná se blíží konec rakety, která měla vozit lidi k Měsíci i Marsu

Je to raketa, která měla vrátit americké astronauty na Měsíc a jednoho dne je poslat k Marsu. Teď se nad ní ovšem vznáší reálná hrozba až jistota zrušení. Jmenuje se SLS (Space Launch System,...

16. března 2025

Ojedinělá prohlídka. Podívejte se do šachty pod vodní turbínou staré továrny

Pří opravách opěrného zdiva Jizerskohorského technického muzea – původně přádelny – nastala jedinečná příležitost prozkoumat náhon a vývařiště vodní turbíny, která celý provoz kdysi poháněla....

15. března 2025  17:09

Herečka Adamová excelovala vedle Wericha. Proslavily ji pohádky, rozhlas i dabing

Před 100 lety, 15. března 1925, se narodila česká divadelní, filmová, rozhlasová a dabingová herečka Jaroslava Adamová.

15. března 2025  13:20

Z USA odstartovala raketa Falcon 9, vyzvedne dva astronauty uvázlé na ISS

Z mysu Canaveral na Floridě ve Spojených státech úspěšně odstartovala raketa Falcon 9 společnosti SpaceX se čtyřmi astronauty na palubě. Mise umožní návrat dvou astronautů, kteří po nevydařeném...

15. března 2025  7:12

Akční letáky
Akční letáky

Prohlédněte si akční letáky všech obchodů hezky na jednom místě!

Model messerschmittu v maďarských barvách připomíná příběh leteckého esa

„Maďarské stroje nejsou příliš často zobrazované, na druhou stranu k nim je dost historických fotek,“ vysvětluje modelář Petr Záras důvod, proč oblékl „svůj“ Messerschmitt Bf-109F do kamufláže...

15. března 2025

Umělá inteligence bude řídit výrobu vodíku. Revoluční prototyp zvýší účinnost

Brněnský startup Nano Advanced představil průlom v oblasti zelené energetiky. Jeden ze zakladatelů firmy Jakub Drnec spolu s ministrem průmyslu a obchodu Lukášem Vlčkem (STAN) dnes spustili...

14. března 2025  17:46

Astronomové přehlédli supermasivní černou díru. Váží jako 600 000 Sluncí

Ve středu Velkého Magellanova mračna nejspíš sedí černá díra podobná té uprostřed naší vlastní Galaxie. Je však přibližně sedmkrát lehčí. Její přítomnost naznačuje analýza drah hvězd, které...

14. března 2025  14:02,  aktualizováno  14:02

Páteční zatmění Měsíce uchvátilo fotografy po celém světě. Podívejte se

Pokud vám oblačnost neumožnila vidět ani kousek ze začátku zatmění Měsíce, které bylo z Česka možné pozorovat v pátek ráno, můžete si to vynahradit na snímcích fotografů. Ti jej zachytili po celém...

14. března 2025  13:40

Zatmění Měsíce je za námi. Ve videu jej tentokrát uvidíte nejlépe

V noci na pátek byl měsíc úplňku a zároveň se postupně schovával za Zemi tak, až ho zakryl celý její stín. Plné zatmění Měsíce však začalo až krátce před osmou hodinou ranní, kdy už nebylo z našeho...

13. března 2025  17:33,  aktualizováno  14.3 8:59

Američané obnovují letiště, ze kterého startovaly bombardéry na Hirošimu

Soustava ranvejí a stojánek na tichomořském ostrově Tinian byla na konci druhé světové války největší na světě. Sloužila bombardérům B-29 Superfortress, včetně dvou strojů, které shodily atomové...

14. března 2025