Jsou věci, které ani nejlepší počítačové programy zatím nedokážou, třeba rozpoznávat objekty na fotografii a jejich význam v kontextu. Lidem to naopak nedělá problém. O počítačích jsme vždy přemýšleli jako o strojích, které pomáhají lidem tam, kde kde lidé nejsou až tak silní v kramflecích, třeba v aritmetice nebo statistice. Ale existuje i opačný pohled: lidé pomáhají strojům tam, kde algoritmus zatím nestačí.
Programátoři už přišli na to, jak zapřáhnout lidské mozky a využít náš čas, naše zkušenosti a náš úsudek - velmi podobně, jako se využívá podprogram nebo matematická funkce. Tímto způsobem například Google popisuje obrázky na internetu nebo zpřesňuje výsledky vyhledávání. Ale důsledky mohou být mnohem komplexnější a dalekosáhlejší. Nebo je to všechno jenom hra?
Nový vyhledávač = lidé + algoritmus
Společnost Google má velký cíl: "Organizovat všechny informace na světě a učinit tyto informace obecně dostupné a užitečné." Když začali dva studenti Stanfordu, dnes slavní manažeři Larry Page a Sergey Brin, v roce 1996 systematicky stahovat celý tehdejší obsah webu na svůj počítač, učinili první krok k vytvoření dnes nejmocnějšího vyhledávače. Díky algoritmu PageRank mohli automatizovaně na základě matematických vzorečků a hypertextových odkazů vypočítat relativní důležitost každé stránky - nemuseli zaměstnávat tisíce lidí, kteří by za ně třídili odkazy do kategorií, jak bylo v tehdejším světě "webových katalogů" zvykem.
Jejich strategie se ukázala jako úspěšná; počítače dokázaly velmi dobře rozpoznat, která stránka nabízí relevantní informace o kterém tématu. Počítače stránkám samozřejmě nerozuměly (a dodnes rozumí jen velmi, velmi omezeně), informace o důležitosti už tam ale ukrytá byla - v odkazech, kterými jim důvěru projevily ostatní stránky.
Google tak svým PageRankem využil tuto dosud nevyužitou práci, akumuloval veškerá data a výsledkem je vyhledávač, který se stal synonymem pro vyhledávání a dominuje trhu s téměř dvoutřetinovým celosvětovým podílem. Velkou zásluhu na tom měl právě fakt, že Google využil práci lidí (vytváření odkazů), která byla dostupná zdarma. A dělá to pořád a stále vynalézavěji.
Google koupil systém reCAPTCHAChytrý vynález umožní Googlu snáze rozšifrovat nečitelný obsah starých i nových knih dostupných skrze Google Books Systém reCAPTCHA je implementován na tisícovkách stránek po celém světě. Jde o nástroj zdarma a efektivně filtrující spam v internetových diskuzích nebo přihlašovacích formulářích. Google akvizicí reCAPTCHY získal velmi účinný nástroj "crowd computing" - lidé pomáhají počítačům s úkoly, které počítače zatím nezvládají, jako je třeba čtení starých knih nebo převod obrázku na text. |
Lidé si hrají a počítače se učí
"Přečti tyhle čtyři písmena!" Úkol, který je pro člověka až směšně snadný, je pro počítače velmi obtížný. CAPTCHA umožňuje odlišit člověka od naprogramovaného robota. Každý den se po světě vyplní miliony těchto bezpečnostních kódů. Luis von Ahn z Carnegie Mellon univerzity, vynálezce CAPTCHY, jde ovšem mnohem dál - podle něj je možné tuto lidskou práci využít, zapřáhnout.
Lidi můžeme pojmout jako procesory, které umí vyřešit úlohy jinak neřešitelné. Jde jen o to, jak tyto procesory implementovat. |
"V roce 2003 bylo na celém světě odehráno přibližně 9 miliard hodin Solitéru," říká ve své fascinující přednášce v rámci Google Tech Talks. To je více než tisíckrát víc "člověkohodin", než kolik jich bylo zapotřebí k vybudování Empire State Building. Luis věří, že tyto hodiny, které lidé tráví hraním, mohou být využity k úkolům, které jsou zatím konvenčními počítačovými algoritmy neřešitelné. "Na lidský mozek můžeme nahlížet jako na velmi komplexní procesor, který můžeme zapřáhnout do našeho algoritmu a pracovat s ním jako se strojem. (...) Zatím lidé na počítačích parazitují. Já navrhuji mnohem vyrovnanější vztah, kdy některé problémy vyřeší počítače a některé řeší lidé..." Jeho cílem je využití nevyužitých "lidských procesů" k řešení složitých, tzv. otevřených problémů dnešní informatiky.
Jedním takovým problémem je třeba popsání obrázku - počítač má problém poznat s dostatečnou jistotou, zda je na obrázku automobil, kočárek, medvěd, zda obrázek působí depresivně nebo optimisticky... Člověk s ničím takovým problém nemá. Jak ale přimět velké množství lidí, aby dobrovolně, ve velkém a zadarmo spolupracovali?
Vzpomeňme na Solitér. Necháme je hrát!
Luis je autorem hry "ESP Game", která slouží k popisu milionů obrázků z celého internetu. Funguje jednoduše: přihlásíte se do hry a systém vás spáruje s lidským partnerem. Oběma vám zobrazí stejný obrázek a vy máte za úkol shodnout se se svým partnerem na popisku tohoto obrázku. Když se shodnete, počítač ví, že jste mu pravděpodobně poskytli pravdivou informaci o tom, co je na obrázku. Uloží si ji do databáze a vám dá body.
Google Image Labeler vychází z ESP Game - Google využívá data k vylepšení výsledků vyhledávání, například v Google Images.
Mohlo by se zdát, že tento koncept je nereálný, ovšem realita má tendenci překonat i ty nejnadsazenější odhady. Během pár měsíců se hráči shodli na 15 milionech popisků. Někteří hráli hru i dvacet hodin v kuse a Luis musel omezit maximální počet her na jednu osobu za den, protože měl výčitky, že někomu ničí zdraví.
Hráči nicméně věděli, že jde o hru "s přesahem" a že takto poskytují data k další analýze. Ale vůbec jim to nevadilo a dodnes nevadí. Hra je zajímavá, pokaždé jiná a díky faktoru náhody a podivně intimního kontaktu s druhou osobou neztrácí na zajímavosti ani tři roky po svém spuštění. Google Image Labeler pomohl od roku 2006 popsat velké množství obrázků; je docela možné, že většinu obrázků z Google Image Search. Nejenže se tak zpřesnilo vyhledávání v obrázcích, ale Google může tato data používat i pro lepší indexaci stránek, na kterých se tyto obrázky nacházejí.
Další hry využívající lidského výpočetního výkonu"Human Computing", tedy zapřažení lidského vstupu při počítačovém řešení problémů, využívají i další hry: Ve hře Squigl se se spoluhráčem snažíte shodnout na obrysu daného objektu na obrázku. Slova jsou výsledkem již zmíněné ESP Game, takže nyní už počítač bude vědět nejen co na obrázku je, ale i kde se to nalézá. Další hry si dokonce kladou ještě vyšší cíle - počítač by díky hře Verbosity měl "pochopit" všechno to nepřeberné množství faktů, které my lidé známe jaksi automaticky: že slunce svítí a hřeje, na housle se hraje, z okna se kouká, mléko se smíchá s vločkami, noviny se čtou... Hra Verbosity - jeden z parterů dostane slovo a má jej druhému napovědět. K dispozici má několik přísně strukturovaných vět, které může doplnit. Počítač by teoreticky měl takto získat miliony konkrétních, gramaticky zařaditelných vědomostí, později využitelných třeba v sémantickém webu.
|
Dokud je hra zábavná, vstup jasně daný a také statisticky ověřitelný, jsou výstupy z těchto her obvykle velmi dobře využitelné. Luis zdůrazňuje, že počítač je často jako "někteří profesoři, kteří vám dají test, který by sami nedokázali vyplnit, ale umějí jej oznámkovat." Armáda hráčů je schopna těmto počítačům poskytnout enormní množství dat ve velmi krátkém čase.
Celý web jako hra
Můžeme se usmívat nad tím, jak mají někteří lidé moc volného času, jak nevědí, do čeho píchnout a baví se popisováním obrázků na webu. Jenže, podíváme-li se na naši vlastní on-line existenci, najdeme zajímavé paralely právě s podobnými "human computing" hrami.
Tak především celý úspěch Googlu coby relevantního full-textového vyhledávače spočíval v tom, že dokázal využít doposud podceňovaný lidský vstup - odkazy. Podobně jako při popisu obrázků se musí dva lidé shodnout na stejném znění, pokud se dva a více lidí shodnou v odkazu na nějakou stránku na určitém slově, může mít Google relativní jistotu, že je toto slovo pro odkazovanou stránku podstatné (bez ohledu na to, zda se na dané stránce nachází - však takto vznikaly Google Bomby).
Těch vstupů, které počítačům po celém světě (nejen těm od Googlu) poskytujeme, je mnohem více. Kdykoli klikneme na nějaký odkaz, dáváme tím něco najevo. Kdykoli okomentujeme článek, zakoupíme produkt, hodnotíme knížku, vyhledáváme informace, posíláme e-mail nebo uploadujeme obrázek, učíme "Web" novým a novým skutečnostem. Pěkně to demonstruje video Dr. Michaela Wesche o Web 2.0: The Machine Is Using Us (Stroj používá nás).
Velká část těchto vstupů je zcela nenápadných - ani nás nenapadne, že by je někdo mohl analyzovat. A skutečně, není v lidských silách takové množství maličkostí brát v potaz v reálném čase. Nicméně v silách obrovských výpočetních center to zcela jistě je. Stačí správě nastavit parametry, filtry, statistické metody a další technické podružnosti. Každý z nás produkuje denně dostatek dat, ať už anonymních nebo s námi přímo identifikovatelných. Každý z nás je součástí této armády, každý přikládá ruku k dílu, kurzor k odkazu.
Předpovíme budoucnost
Psychomanipulátor Derren Brown nedávno předvedl, jak "davová inteligence" dokáže předpovědět budoucnost - konkrétně čísla tažená v loterii. Toto je zřejmý nesmysl, šlo o druh iluze a efektní vystoupení, ne o nějaký projev davové inteligence. Dvacet lidí neví, jaký míček vypadne z náhodného osudí o nic lépe než dva.
Ovšem davová inteligence umí předpovídat jiný druh budoucnosti - budoucí trendy. A ty jsou pro velké společnosti mnohem cennější než informace o loterii. Vědět, co bude za týden lidi zajímat nebo co budou za dva měsíce kupovat, to je pro podnikání neuvěřitelně důležité. Existuje mnoho více či méně nejistých metod, jak se lidem dostat pod kůži a něco o nich vyzvědět. Ale málokdy se můžeme lidí ptát na jejich budoucnost a očekávat jasné, reálné odpovědi.
Vše, co na internetu děláme, může někomu sloužit k předpovědi budoucích trendů - obecných i individuálních. Je to jen otázka vhodného statistického zpracování dat. |
Google má už dnes přístup k tomu, co lidé hledají. Také má dobrou představu o tom, kde to nalézají. Od března sleduje, o co se zajímáte a jaké reklamy by nejvíce zaujaly vaši pozornost. Nově také v reálném čase prohledává nové statuty na Twitteru. Ačkoli se tyto 140znakové hlášky mohou zdát nesmyslné, vyjadřují možná nejinstantnější, nejrychleji dostupné, zkoncentrované a prohledávatelné názory lidí z celého světa. Když už neumožní předpovídat budoucnost, pak jistě alespoň současnost.
Jedeme v tom všichni
Možná se cítíte podvedeni, jako někdo, kdo pomohl Tomu Sawyerovi natírat plot a ještě mu za to zaplatil. Ale možná k tomu není důvod. Plíživý nástup technologií přinesl mnoho změn do našich životů a proměnil výrazně celou společnost. V lidské posedlosti pokrokem a technologiemi můžeme hledat příčiny (i když ne ty primární) dnešní situace, kdy soukromí získává poněkud jiný význam, než mělo před dvaceti lety.
Ale možná podvedeni vůbec nejsme. Členy armády Google, Facebooku nebo Twitteru jsme se nestali pod nátlakem. Naopak, nadšeně těchto novinek využívají lidé po celém světě, často nad rámec toho, nakolik by se mělo důvěřovat jakékoli technologii. To, že jsou naše akce sledovatelné a zpětně využitelné (ať už v náš nebo všech nebo jen něčí prospěch), to je nezbytný důsledek současné architektury globálního a komunikačního prostředí.
V nejbližších letech budeme, doufejme, svědky mnoha debat o tom, jak tyto změny proměňují a znovudefinují podnikání, politiku, zábavu nebo mezilidskou komunikaci. (Tento článek je ostatně pokusem poskytnout k takovýmto debatám možnost pochopení některých souvislostí.) Ovšem těžko se v těchto debatách můžeme vymlouvat na nátlak nebo nepřiměřené donucovací prostředky.
Do internetové armády jsme se zapsali sami. Každý den znovu a dobrovolně.
Odkazy a zdroje:
- Google začal prohledávat tweety (anglicky)
- Human Computing - Luis von Ahn, Google Talk (anglicky)
- Peekaboom: hra pro lokalizaci objektů na fotografii (anglicky, PDF)
- Den na cele myšlenkových zločinů (anglicky, povídka)
- We Are the Web (WIRED, anglicky)
- Google a vaše soukromí - videa (anglicky)
- Nákupem reCAPTCHY získal Google "davový počítač" (anglicky)
- Reklamy cílené podle zájmů uživatele (anglicky)
- Google nabízí možnost odhlásit se ze sledování (anglicky)
- Parodie: Google opt-out village (The Onion, anglicky)