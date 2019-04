„Dneska nemůžu, protože jsem se probudila, a říkám si, že je to bezbolestné a pak se ze stehen udělala ještě slepice na paprice.“

To je jedna z tisícovky výmluv, které se sešly v našem malém experimentu. Vyzvali jsme na Facebooku Technet.cz čtenáře, aby napsali slova „Dneska nemůžu, protože“ a pak nechali svou prediktivní klávesnici větu dokončit.



Dorazily stovky vět. Každá začíná stejnými třemi slovy, ale dále se výrazně liší. Každému totiž klávesnice radila něco jiného. V následujícím klikátku si můžete vyzkoušet, co nabídla náhodně vybranému čtenáři. Stejně jako u prediktivní klávesnice můžete psát větu výběrem prostředního tlačítka, slovo po slovu. Každá klávesnice je natrénovaná jinak, každá doporučuje něco jiného a klikátko simuluje, jak se v dané situaci chovají klávesnice různých reálných lidí.



Dneska nemůžu, del protože jiné

Pokud chcete vyzkoušet jinak natrénovanou klávesnici, obnovte stránku tlačítkem „jiné“. Všechny původní věty od čtenářů najdete na našem Facebooku.



Co všechno o vás vaše klávesnice prozradily?

Předně je třeba říci, že dosavadní data o prediktivních klávesnicích jsme sbírali na Facebooku. Neměli jsme žádnou možnost ověřit, zda čtenáři skutečně využívají prediktivní funkci klávesnice, nebo si věty nevymysleli či nepřikrášlili, aby to bylo vtipnější.



Každopádně jsme při pročítání a následné analýze asi tisícovky vět vyplozených různě natrénovanými prediktivními klávesnicemi našli několik zajímavých postřehů.

Zábavné bylo sledovat, jak klávesnice lidí, kteří kromě češtiny využívají i další jazyk, volně přechází mezi zapnutými jazyky:

Dneska nemůžu, protože jsem se zeptat jestli je to jedno ja len že priprav sa na to aby som sa aj dlhšie bavil len cez net so ganz in der Nähe von der Stadt und so wie ich das seh

Dneska nemůžu, protože jsem se zeptat jestli je to jen na vás čeká v pohodě a už nestresuješ the street from the other hand I have a great time

Dneska nemůžu, protože jsem se zeptat jestli je to v pohodě a pak se to the game soon with a été un peu de temps à la fin de la semaine dernière



To je důsledek toho, jak se klávesnice snaží aktivně vyhledávat ve více slovnících naráz. Některá slova jsou obvyklejší v některých jazycích (třeba české zájmeno to je také anglická předložka to) a tato slova vedou k „přepnutí“ jazyka.



Nejčastější slova z vět, které naši čtenáři vygenerovali pomocí prediktivních klávesnic

Celkově se výmluvy vygenerované klávesnicemi hodně lišily. A určitě něco vypovídaly o uživatelích, jejichž klávesnice je vytvořila. Zmínky o kalbách, nahlášené bombě nebo zaspání téměř určitě měly nějaký reálný základ v tom, co daný uživatel v minulosti psal.



Ukázka některých podobných vět a frází (komentáře seřazeny podle abecedy, stejné části jsme barevně zvýraznili)



Také sprostá slova se klávesnice nejspíš někde naučila, od ostatních dětí ve škole to nebude. Stejně jako nářečí a slangové výrazy jako „ty jsi ze z Plzně“ nebo slova bez diakritiky, která se klávesnice určitě naučila od daného uživatele.

Nejpřekvapivějším bylo, kolik lidí si přeje, aby „Edward Snowden dostal Nobelovu cenu“. Tento řetězec se objevil opakovaně, a to v různých kontextech a variantách.



Dneska nemůžu, prožité se o tom co jsem kdy viděl tak jak je možné se domluvit na to aby Edward Snowden dostal Nobelovu cenu.

Dneska nemůžu, protože se jedná o to aby Edward Snowden dostal Nobelovu cenu za mír a klid a pohodu a klid a pohodu a klid a pohodu a klid a pohodu

Dneska nemůžu, protože se jedná pouze o to aby Edward Snowden dostal Nobelovu cenu míru a bezpečnosti práce a Olinka se sešli na to že by se mi nechce být v souladu s platnými právními normami



Dneska nemůžu, protože to bylo v roce na Malé Straně a hledá se Nemo na to aby Edward Snowden dostal Nobelovu cenu za nejlepší film roku.



Předpokládáme, že jde o důsledek vzorku, na kterém se cvičil výchozí slovník klávesnice Gboard (prediktivní klávesnice od Google). Tam se totiž řetězec v určitých kontextech objeví. Je to docela zvláštní kombinace, protože obvykle jsou výchozí slovníky velmi obecně naladěné a teprve postupným trénováním začnou nabízet vlastní jména a další konkrétní výrazy.

Celkově nás potěšilo, kolik lidí se experimentu zúčastnilo, a proto jsme se rozhodli na fenomén prediktivních klávesnic podívat v tomto článku i trochu teoreticky.



Vyzkoušejte si to i na svojí klávesnici

Jestli si chcete vyzkoušet, co o vás klávesnice ví, tady k tomu máte prostor. Doporučujeme zkusit, jak klávesnice doplní například tyto fráze:

Dneska nemůžu, protože...

Mám rád(a)...

Jsem na...

Nebo nijak nezačínejte a jen vybírejte doporučené slovo

Pokud vám klávesnice napoví něco opravdu vtipného, můžete nám text poslat stisknutím tlačítka. Když se jich sejde víc, vydáme nějaký výběr.



Zde můžete vyzkoušet, co vám nabídne vaše klávesnice:





Na server se uloží jen poslaný text a informace o rychlosti psaní, neukládají se žádné osobní údaje ani údaje o vašem prohlížeči.

Jak prediktivní klávesnice funguje?

Dotekové klávesnice na mobilu byly od začátku přijímány s nedůvěrou. V pohodlném psaní vedly ještě před deseti lety tlačítkové klávesnice, ať už kompaktních Blackberry nebo vysouvacích HTC.



Vlevo telefon BlackBerry Key2, vpravo telefon HTC Pro 7, oba s hardwarovou klávesnicí

Na hardwarové klávesnici šlo psát rychle a prakticky poslepu. Patlání po displeji vedle toho působilo naprosto neprakticky. Dotykové klávesnice byly malé, tlačítka neohraničená a špičky prstů příliš velké, což vedlo ke spoustě překlepů.

Chytré klávesnice problém nemotorných prstů vyřešily softwarově. Začalo to detekcí překlepů. Když na mobilu v rychlosti naklepete slovo ORIKKAF, klávesnice nemusí váš text brát jako bernou minci, ale spíše jako vodítko. Vezme proto potaz vzdálenost písmen na klávesnici a přesné místo, kde jste se klávesnice dotkli. Některé klávesnice si navíc vedou statistiky o tom, jak vám jednotlivá písmena „ujíždějí“.

Klávesnice si pamatuje každý váš dotyk a podle toho odhaduje, co jste asi chtěli napsat

Pak se klávesnice podívá do slovníku, tedy do databáze existujících slov daného jazyka, a najde ta slova, která nejlépe odpovídají vašemu nemotorně vyťukanému zadání.

Klávesnice porovná možné varianty se slovníkem a na základě toho opraví vaše překlepy

Kontrola překlepů sama o sobě ušetří spoustu času. Ale už od počátku měla špatnou pověst, protože lidem často dávala do úst (respektive do textových zpráv) něco, co neřekli. Vycházela totiž z obecného frekvenčního slovníku. Takže vám nahradila slovo „běž“ slovem „bez“ nebo „posté“ slovem „poště“, protože zkrátka vybírá nejčastější slovo, přestože v daném kontextu nedává žádný smysl.

Personalizované predikce

Dnešní prediktivní klávesnice už tento problém obvykle nemají. Nevycházejí totiž jen z obecného frekvenčního slovníku, tedy z toho, který vznikl analýzou nějakého korpusu daného jazyka. Namísto toho se učí z toho, co jste napsali přímo vy. Mohou tak lépe vybrat, které slovo nejspíše chcete v dané chvíli a v kontextu zvolit.



Různé klávesnice využívají k personalizaci různých dat. Nejčastěji se můžeme setkat s těmito zdroji:

historie psaní – klávesnice se učí z toho, co už jste pomocí ní napsali.

– klávesnice se učí z toho, co už jste pomocí ní napsali. kontakty – díky seznamu kontaktů nebude klávesnice dělat chyby ve jménech vašich přátel a známých.



– díky seznamu kontaktů nebude klávesnice dělat chyby ve jménech vašich přátel a známých. textové zprávy – pokud dáte klávesnici povolení, prostuduje si vaše odeslané textové zprávy a bude se učit i z jejich obsahu.

– pokud dáte klávesnici povolení, prostuduje si vaše odeslané textové zprávy a bude se učit i z jejich obsahu. e-maily – některé klávesnice (např. SwiftKey) se učí i z obsahu vámi odeslaných e-mailů.

– některé klávesnice (např. SwiftKey) se učí i z obsahu vámi odeslaných e-mailů. sociální sítě – klávesnice se může učit i z textů, které píšete na sociální sítě.

– klávesnice se může učit i z textů, které píšete na sociální sítě. další texty – kromě toho se může klávesnice učit i z dalších textů, které jí předhodíte, třeba z článků na vašem blogu.

– kromě toho se může klávesnice učit i z dalších textů, které jí předhodíte, třeba z článků na vašem blogu. kontext – klávesnice může používat i další kontext, například kalendář nebo jméno aplikace.



Jak je vidět, taková nenápadná aplikace, jakou je chytrá dotyková klávesnice, toho o vás ví opravdu hodně. I když jí nedáte přístup ke svým minulým e-mailům, pořád bude pochopitelně znát obsah těch e-mailů, které jejím prostřednictvím napíšete. Některé klávesnice sice můžete přepnout do „privátního režimu“, ve kterém si neukládá vámi zadaný text, ale neděláme si iluze o tom, jak často je taková funkce využívána.



Co klávesnice s těmito daty dělá? Především je využívá k tomu, aby vám lépe napovídala další slova, sousloví, nebo dokonce celé věty. Nepochybně to zrychluje psaní a zvláště u často opakovaných frází nebo údajů to může ušetřit spoustu času.

Kromě toho klávesnice vaše data používá i k tomu, aby objevila nové vzorce. A tady už zpozorní každý, kdo se zajímá o soukromí. Oblíbené prediktivní klávesnice jako Gboard (Google) nebo Swiftkey (Microsoft) totiž posílají uživatelská data na server a učí se z nich, jak napovídat text ostatním. A to se může vymstít: například klávesnice ai.type odhalila data milionů uživatelů, včetně řady hesel. Uživatel dává klávesnici povolení sledovat prakticky vše, co se na mobilu děje. Musí tedy výrobci důvěřovat, že si neukládá nic, co by si ukládat neměl. Zkrátka: z pohledu soukromí je to noční můra.



Budoucnost prediktivního textu

Chytré klávesnice ze začátku pracovaly s celkem průhlednými statistickými a lingvistickými modely. S tím, jak roste výpočetní výkon, rychlost internetu i vědecké poznání v oblasti neuronových sítí, se však objevují úplně nové způsoby usnadnění tvorby textu.

Google například v roce 2016 ukázal (nyní již nefunkční) chatovací aplikaci Allo, která umožňovala při chatování využít automatických odpovědí. Aplikace si zkrátka přečetla, co vám někdo poslal, a navrhla několik možností, jak odpovědět. A nebyly to zdaleka jen zdvořilostní nebo nicneříkající fráze. Když vám někdo poslal fotku pizzy, počítač zvolil možnost:

Google Allo nabídl automatické odpovědi

Jaký typ?

Mňam!

Miluji italské jídlo



To jde daleko za hranice obyčejné statistické predikce. Taková funkce vyžaduje strojové učení, strojovou analýzu obrazu, statistickou analýzu velkého množství konverzací.



V roce 2017 představil Google funkci chytrých odpovědí (Smart Reply) pro svůj e-mailový nástroj Gmail. Zatím pouze v angličtině, později přibyly i další jazyky, jako španělština nebo francouzština. I tady je z nabízených odpovědí znát, že jde o sofistikovaný proces výběru; ostatně Google na této funkci pracuje už dlouho.



Smart Replies - chytré automatické odpovědi

Výsledky jsou často velmi užitečné. Tři odpovědi, ze kterých má uživatel na výběr, obvykle velmi dobře pokrývají různé scénáře. Málokdy se tedy objeví úplná synonyma (Ano, Jasně, Jistě), spíše se do výběru dostanou různé možnosti odpovídající různým sdělením (“Už jsem to udělal“, „Zrovna na tom dělám“, „Nevím, kdy to bude hotovo“).



Ukázka Gmail Smart Compose. Navržený text uživatel vybere tabulátorem.

V současnosti se vybraná automatická odpověď v Gmailu jen otevře v nově rozepsané zprávě. Uživatel tedy může opravit a doplnit text e-mailu před odesláním. Je zjevné, že časem by se tyto automaticky generované odpovědi mohly rozrůst. Google už nyní za uživatele píše na základě kontextu celé fráze: pomocí funkce Smart Compose doplňuje konce vět, oslovení, nebo vymyslí předmět e-mailu na základě jeho obsahu.

A Google není jediný, kdo pracuje na automatickém generování textu. Vývojáři OpenAI nedávno oznámili, že jejich neuronová síť na generování textů je tak dobrá, že ji raději nezveřejnili. Jejich nástroj GPT-2, vytrénovaný na 40 GB textu, umí doplňovat nejenom další slova, ale celé věty, a dokonce odstavce.

Ukázka rozhraní nástroje GPT-2

Používali byste takový nástroj pro psaní e-mailů nebo pro povídání si s přáteli po internetu? I když pomineme otázku soukromí nebo případného zneužití, je zřejmé, že je zde řada nežádoucích – nebo přinejmenším vedlejších – důsledků. Dnes se ještě prediktivním klávesnicím můžeme smát. Za pár let jim možná budeme říkat „asistenti“. Už na nich nebudeme psát texty. Asistent navrhne odpověď na e-mail a my ji pouze prolétneme a schválíme. Brzy nám budou naši digitální asistenti domlouvat schůzky s digitálními asistenty ostatních lidí. Už teď se nám občas stává, že napíšeme to, co nám radí klávesnice, protože je to přece skoro to samé a navíc je mnohem jednodušší to odsouhlasit, než se vyťukávat s tím, co jsme chtěli říci původně.



A když nás nenapadne způsob, jak ukončit článek, necháme klávesnici SwiftKey, aby se to dostalo k více lidem a s tím že se to teď dělá aby Edward Snowden dostal Nobelovu cenu za mír a klid na práci.