iDNES.cz

Premium

Získejte všechny články
jen za 49 Kč / 1. měsíc

Google si buduje lidskou armádu. Počítače nás zapřáhnou a předpoví budoucnost

5. listopadu 2009

Facebook, Google a další velké společnosti dokážou využít každé naše kliknutí. A díky vynalézavým hrám jsou dnes počítače schopny využít k jinak neřešitelným úkolům schopnosti lidského mozku a pochopit význam obrazu, textu nebo videa. A nejedná se jen o teorii.

Zvětšit fotografii

Počítačové systémy umožňují využít vstup z lidského mozku a přetavit jej v užitečná, obecná data. | foto: Profimedia.cz

Jsou věci, které ani nejlepší počítačové programy zatím nedokážou, třeba rozpoznávat objekty na fotografii a jejich význam v kontextu. Lidem to naopak nedělá problém. O počítačích jsme vždy přemýšleli jako o strojích, které pomáhají lidem tam, kde kde lidé nejsou až tak silní v kramflecích, třeba v aritmetice nebo statistice. Ale existuje i opačný pohled: lidé pomáhají strojům tam, kde algoritmus zatím nestačí.

Programátoři už přišli na to, jak zapřáhnout lidské mozky a využít náš čas, naše zkušenosti a náš úsudek - velmi podobně, jako se využívá podprogram nebo matematická funkce. Tímto způsobem například Google popisuje obrázky na internetu nebo zpřesňuje výsledky vyhledávání. Ale důsledky mohou být mnohem komplexnější a dalekosáhlejší. Nebo je to všechno jenom hra?

Nový vyhledávač = lidé + algoritmus

Společnost Google má velký cíl: "Organizovat všechny informace na světě a učinit tyto informace obecně dostupné a užitečné." Když začali dva studenti Stanfordu, dnes slavní manažeři Larry Page a Sergey Brin, v roce 1996 systematicky stahovat celý tehdejší obsah webu na svůj počítač, učinili první krok k vytvoření dnes nejmocnějšího vyhledávače. Díky algoritmu PageRank mohli automatizovaně na základě matematických vzorečků a hypertextových odkazů vypočítat relativní důležitost každé stránky - nemuseli zaměstnávat tisíce lidí, kteří by za ně třídili odkazy do kategorií, jak bylo v tehdejším světě "webových katalogů" zvykem.

Jejich strategie se ukázala jako úspěšná; počítače dokázaly velmi dobře rozpoznat, která stránka nabízí relevantní informace o kterém tématu. Počítače stránkám samozřejmě nerozuměly (a dodnes rozumí jen velmi, velmi omezeně), informace o důležitosti už tam ale ukrytá byla - v odkazech, kterými jim důvěru projevily ostatní stránky.

Google tak svým PageRankem využil tuto dosud nevyužitou práci, akumuloval veškerá data a výsledkem je vyhledávač, který se stal synonymem pro vyhledávání a dominuje trhu s téměř dvoutřetinovým celosvětovým podílem. Velkou zásluhu na tom měl právě fakt, že Google využil práci lidí (vytváření odkazů), která byla dostupná zdarma. A dělá to pořád a stále vynalézavěji.

Google koupil systém reCAPTCHA

Chytrý vynález umožní Googlu snáze rozšifrovat nečitelný obsah starých i nových knih dostupných skrze Google Books

Systém reCAPTCHA je implementován na tisícovkách stránek po celém světě. Jde o nástroj zdarma a efektivně filtrující spam v internetových diskuzích nebo přihlašovacích formulářích.

Google akvizicí reCAPTCHY získal velmi účinný nástroj "crowd computing" - lidé pomáhají počítačům s úkoly, které počítače zatím nezvládají, jako je třeba čtení starých knih nebo převod obrázku na text.

reCAPTCHA - počítač zná význam pouze jednoho obrázku ze dvou. Vy opíšete texty oba a počítač tak může jak ověřit, že jste text skutečně přečetli, tak se naučit něco nového.

Více o systému reCAPTCHA

Lidé si hrají a počítače se učí

"Přečti tyhle čtyři písmena!" Úkol, který je pro člověka až směšně snadný, je pro počítače velmi obtížný. CAPTCHA umožňuje odlišit člověka od naprogramovaného robota. Každý den se po světě vyplní miliony těchto bezpečnostních kódů. Luis von Ahn z Carnegie Mellon univerzity, vynálezce CAPTCHY, jde ovšem mnohem dál - podle něj je možné tuto lidskou práci využít, zapřáhnout.

Lidi můžeme pojmout jako procesory, které umí vyřešit úlohy jinak neřešitelné. Jde jen o to, jak tyto procesory implementovat.

"V roce 2003 bylo na celém světě odehráno přibližně 9 miliard hodin Solitéru," říká ve své fascinující přednášce v rámci Google Tech Talks. To je více než tisíckrát víc "člověkohodin", než kolik jich bylo zapotřebí k vybudování Empire State Building. Luis věří, že tyto hodiny, které lidé tráví hraním, mohou být využity k úkolům, které jsou zatím konvenčními počítačovými algoritmy neřešitelné. "Na lidský mozek můžeme nahlížet jako na velmi komplexní procesor, který můžeme zapřáhnout do našeho algoritmu a pracovat s ním jako se strojem. (...) Zatím lidé na počítačích parazitují. Já navrhuji mnohem vyrovnanější vztah, kdy některé problémy vyřeší počítače a některé řeší lidé..." Jeho cílem je využití nevyužitých "lidských procesů" k řešení složitých, tzv. otevřených problémů dnešní informatiky.

Jedním takovým problémem je třeba popsání obrázku - počítač má problém poznat s dostatečnou jistotou, zda je na obrázku automobil, kočárek, medvěd, zda obrázek působí depresivně nebo optimisticky... Člověk s ničím takovým problém nemá. Jak ale přimět velké množství lidí, aby dobrovolně, ve velkém a zadarmo spolupracovali?

Vzpomeňme na Solitér. Necháme je hrát!

Luis je autorem hry "ESP Game", která slouží k popisu milionů obrázků z celého internetu. Funguje jednoduše: přihlásíte se do hry a systém vás spáruje s lidským partnerem. Oběma vám zobrazí stejný obrázek a vy máte za úkol shodnout se se svým partnerem na popisku tohoto obrázku. Když se shodnete, počítač ví, že jste mu pravděpodobně poskytli pravdivou informaci o tom, co je na obrázku. Uloží si ji do databáze a vám dá body.

Google Image Labeler vychází z ESP Game - Google využívá data k vylepšení výsledků vyhledávání, například v Google Images.

Hru Google Image Labeler si můžete vyzkoušet zde (anglicky)

Mohlo by se zdát, že tento koncept je nereálný, ovšem realita má tendenci překonat i ty nejnadsazenější odhady. Během pár měsíců se hráči shodli na 15 milionech popisků. Někteří hráli hru i dvacet hodin v kuse a Luis musel omezit maximální počet her na jednu osobu za den, protože měl výčitky, že někomu ničí zdraví.

Hráči nicméně věděli, že jde o hru "s přesahem" a že takto poskytují data k další analýze. Ale vůbec jim to nevadilo a dodnes nevadí. Hra je zajímavá, pokaždé jiná a díky faktoru náhody a podivně intimního kontaktu s druhou osobou neztrácí na zajímavosti ani tři roky po svém spuštění. Google Image Labeler pomohl od roku 2006 popsat velké množství obrázků; je docela možné, že většinu obrázků z Google Image Search. Nejenže se tak zpřesnilo vyhledávání v obrázcích, ale Google může tato data používat i pro lepší indexaci stránek, na kterých se tyto obrázky nacházejí.

Další hry využívající lidského výpočetního výkonu

"Human Computing", tedy zapřažení lidského vstupu při počítačovém řešení problémů, využívají i další hry:

Ve hře Squigl se se spoluhráčem snažíte shodnout na obrysu daného objektu na obrázku. Slova jsou výsledkem již zmíněné ESP Game, takže nyní už počítač bude vědět nejen co na obrázku je, ale i kde se to nalézá.

Další hry si dokonce kladou ještě vyšší cíle - počítač by díky hře Verbosity měl "pochopit" všechno to nepřeberné množství faktů, které my lidé známe jaksi automaticky: že slunce svítí a hřeje, na housle se hraje, z okna se kouká, mléko se smíchá s vločkami, noviny se čtou...

Hra Verbosity - jeden z parterů dostane slovo a má jej druhému napovědět. K dispozici má několik přísně strukturovaných vět, které může doplnit. Počítač by teoreticky měl takto získat miliony konkrétních, gramaticky zařaditelných vědomostí, později využitelných třeba v sémantickém webu.

Tyto a další hry naleznete na gwap.com

Dokud je hra zábavná, vstup jasně daný a také statisticky ověřitelný, jsou výstupy z těchto her obvykle velmi dobře využitelné. Luis zdůrazňuje, že počítač je často jako "někteří profesoři, kteří vám dají test, který by sami nedokázali vyplnit, ale umějí jej oznámkovat." Armáda hráčů je schopna těmto počítačům poskytnout enormní množství dat ve velmi krátkém čase.

Celý web jako hra

Můžeme se usmívat nad tím, jak mají někteří lidé moc volného času, jak nevědí, do čeho píchnout a baví se popisováním obrázků na webu. Jenže, podíváme-li se na naši vlastní on-line existenci, najdeme zajímavé paralely právě s podobnými "human computing" hrami.

Tak především celý úspěch Googlu coby relevantního full-textového vyhledávače spočíval v tom, že dokázal využít doposud podceňovaný lidský vstup - odkazy. Podobně jako při popisu obrázků se musí dva lidé shodnout na stejném znění, pokud se dva a více lidí shodnou v odkazu na nějakou stránku na určitém slově, může mít Google relativní jistotu, že je toto slovo pro odkazovanou stránku podstatné (bez ohledu na to, zda se na dané stránce nachází - však takto vznikaly Google Bomby).

Těch vstupů, které počítačům po celém světě (nejen těm od Googlu) poskytujeme, je mnohem více. Kdykoli klikneme na nějaký odkaz, dáváme tím něco najevo. Kdykoli okomentujeme článek, zakoupíme produkt, hodnotíme knížku, vyhledáváme informace, posíláme e-mail nebo uploadujeme obrázek, učíme "Web" novým a novým skutečnostem. Pěkně to demonstruje video Dr. Michaela Wesche o Web 2.0: The Machine Is Using Us (Stroj používá nás).

Velká část těchto vstupů je zcela nenápadných - ani nás nenapadne, že by je někdo mohl analyzovat. A skutečně, není v lidských silách takové množství maličkostí brát v potaz v reálném čase. Nicméně v silách obrovských výpočetních center to zcela jistě je. Stačí správě nastavit parametry, filtry, statistické metody a další technické podružnosti. Každý z nás produkuje denně dostatek dat, ať už anonymních nebo s námi přímo identifikovatelných. Každý z nás je součástí této armády, každý přikládá ruku k dílu, kurzor k odkazu.

Předpovíme budoucnost

Psychomanipulátor Derren Brown nedávno předvedl, jak "davová inteligence" dokáže předpovědět budoucnost - konkrétně čísla tažená v loterii. Toto je zřejmý nesmysl, šlo o druh iluze a efektní vystoupení, ne o nějaký projev davové inteligence. Dvacet lidí neví, jaký míček vypadne z náhodného osudí o nic lépe než dva.

Ovšem davová inteligence umí předpovídat jiný druh budoucnosti - budoucí trendy. A ty jsou pro velké společnosti mnohem cennější než informace o loterii. Vědět, co bude za týden lidi zajímat nebo co budou za dva měsíce kupovat, to je pro podnikání neuvěřitelně důležité. Existuje mnoho více či méně nejistých metod, jak se lidem dostat pod kůži a něco o nich vyzvědět. Ale málokdy se můžeme lidí ptát na jejich budoucnost a očekávat jasné, reálné odpovědi.

Vše, co na internetu děláme, může někomu sloužit k předpovědi budoucích trendů - obecných i individuálních. Je to jen otázka vhodného statistického zpracování dat.

Ovšem sítě jako Facebook nebo Twitter mají k takovým odpovědím jen krůček. Všechna data, ze kterých mohou tyto odpovědi uvařit, již mají, nebo jich mají alespoň dostatečné množství na jisté druhy předpovědí. Nyní je jenom třeba všechna tato data zpracovat: vzájemné vztahy lidí, příslušnost k různým skupinám, frekvence a obsah vzájemných kontaktů, výsledky a témata těch zpropadených kvízů, odkazy, komentáře... Není jednoduché z této směsice ukuchtit něco užitečného. Ale až se to povede (a je dost možné, že se to už dlouho daří), bude mít výsledný pokrm velmi vysokou prodejní cenu.

Google má už dnes přístup k tomu, co lidé hledají. Také má dobrou představu o tom, kde to nalézají. Od března sleduje, o co se zajímáte a jaké reklamy by nejvíce zaujaly vaši pozornost. Nově také v reálném čase prohledává nové statuty na Twitteru. Ačkoli se tyto 140znakové hlášky mohou zdát nesmyslné, vyjadřují možná nejinstantnější, nejrychleji dostupné, zkoncentrované a prohledávatelné názory lidí z celého světa. Když už neumožní předpovídat budoucnost, pak jistě alespoň současnost.

Jedeme v tom všichni

Možná se cítíte podvedeni, jako někdo, kdo pomohl Tomu Sawyerovi natírat plot a ještě mu za to zaplatil. Ale možná k tomu není důvod. Plíživý nástup technologií přinesl mnoho změn do našich životů a proměnil výrazně celou společnost. V lidské posedlosti pokrokem a technologiemi můžeme hledat příčiny (i když ne ty primární) dnešní situace, kdy soukromí získává poněkud jiný význam, než mělo před dvaceti lety.

Ale možná podvedeni vůbec nejsme. Členy armády Google, Facebooku nebo Twitteru jsme se nestali pod nátlakem. Naopak, nadšeně těchto novinek využívají lidé po celém světě, často nad rámec toho, nakolik by se mělo důvěřovat jakékoli technologii. To, že jsou naše akce sledovatelné a zpětně využitelné (ať už v náš nebo všech nebo jen něčí prospěch), to je nezbytný důsledek současné architektury globálního a komunikačního prostředí.

V nejbližších letech budeme, doufejme, svědky mnoha debat o tom, jak tyto změny proměňují a znovudefinují podnikání, politiku, zábavu nebo mezilidskou komunikaci. (Tento článek je ostatně pokusem poskytnout k takovýmto debatám možnost pochopení některých souvislostí.) Ovšem těžko se v těchto debatách můžeme vymlouvat na nátlak nebo nepřiměřené donucovací prostředky.

Do internetové armády jsme se zapsali sami. Každý den znovu a dobrovolně.

Odkazy a zdroje:

Google začal prohledávat tweety (anglicky)
Human Computing - Luis von Ahn, Google Talk (anglicky)
Peekaboom: hra pro lokalizaci objektů na fotografii (anglicky, PDF)
Den na cele myšlenkových zločinů (anglicky, povídka)
We Are the Web (WIRED, anglicky)
Google a vaše soukromí - videa (anglicky)
Nákupem reCAPTCHY získal Google "davový počítač" (anglicky)
Reklamy cílené podle zájmů uživatele (anglicky)
Google nabízí možnost odhlásit se ze sledování (anglicky)
Parodie: Google opt-out village (The Onion, anglicky)

Autor: Pavel Kasík

Témata: Akvizice, Facebook, Google, Google+, Kvíz, Larry Page, Loterie, Medvědi, Motorola, počítač, Robot, Sergey Brin, X (dříve Twitter)

Komerční sdělení

Za celosvětový kolaps IT systémů může nečekaně absurdní chyba

Nepovedená aktualizace bezpečnostního softwaru společnosti Crowdstrike způsobila pád počítačů a serverů s operačním systémem Windows do „modré obrazovky smrti“. Ani po restartu se nespustí. Některé...

19. července 2024 11:01, aktualizováno 18:52

Uvězněni na vesmírné stanici. Boeing neví, kdy vrátí posádku zpět na Zemi

První testovací let nové vesmírné lodi Boeing Starliner CST-100 s posádkou neprobíhá tak, jak měl její výrobce spolu s NASA naplánováno. Cesta dvou astronautů na ISS a zpět měla původně trvat...

26. července 2024 12:59

{NADPIS reklamního článku dlouhý přes dva řádky}

{POPISEK reklamního článku, také dlouhý přes dva a možná dokonce až tři řádky, končící na tři tečky...}

OBRAZEM: Jugoslávské karavany byly zcela jiný level než ty z NDR, PLR a ČSSR

V roce 1965 se ve slovinském městě Novo Mesto začala psát historie továrně vyráběných jugoslávských a následně slovinských karavanů. Tak vznikla značka Adria, jejíž život se potom přenesl přes rozpad...

23. července 2024

Mistr vedlejších rolí Krška hrál geniálně alkoholiky a muže zlomených osudů

Herec Vladimír Krška, který se narodil před 100 lety, byl téměř čtyři desítky let členem souboru pražského Divadla na Vinohradech. Na jeho scéně vytvořil na osmdesát rolí.

22. července 2024

{NADPIS reklamního článku dlouhý přes dva řádky}

{POPISEK reklamního článku, také dlouhý přes dva a možná dokonce až tři řádky, končící na tři tečky...}

KVÍZ: Výlet do století páry. Poznáte, v jaké dnešní zemi jste?

V následujícím kvízu se podíváme na zajímavá místa zachycená na fotografiích v devatenáctém století. Úkolem je poznat, v jaké dnešní zemi se dané místo či objekt nachází.

26. července 2024

Konečná československá bilance z Paříže před 100 lety: 10 medailí a první zlato

Hry VIII. letní olympiády v Paříži, které skončily před 100 lety, 27. července 1924, potvrdily velký rozmach olympijského hnutí.

27. července 2024

První tryskový dopravní letoun de Havilland DH106 Comet vzlétl před 75 lety

První proudový dopravní letoun de Havilland DH106 Comet se poprvé dostal do vzduchu 27. července 1949. O necelé tři roky později už začal pracovat v běžném provozu, avšak konstrukční chyba znamenala...

27. července 2024

Uvězněni na vesmírné stanici. Boeing neví, kdy vrátí posádku zpět na Zemi

26. července 2024 12:59

KVÍZ: Výlet do století páry. Poznáte, v jaké dnešní zemi jste?

V následujícím kvízu se podíváme na zajímavá místa zachycená na fotografiích v devatenáctém století. Úkolem je poznat, v jaké dnešní zemi se dané místo či objekt nachází.

26. července 2024

Akční letáky

Všechny akční letáky na jednom místě!

Zjistit více

Můj syn Xavier zemřel, říká Musk o transgender dceři. A chce zničit „virus woke“

Miliardář Elon Musk tvrdí, že byl podveden, když dovolil svému synovi stát se transgender ženou. V rozhovoru s...

Ruská kráska Sofja Lebeděva šla donaha v seriálu Vikingové: Valhalla

Bývalá gymnastka Sofja Lebeděva (30) potěšila fanoušky seriálu Vikingové: Valhalla, když se v jedné ze scén nového dílu...

Sto tun obilí za hodinu. Na Hané mají výjimečný kombajn, jeden z patnácti na světě

Až sto tun obilí dokáže za hodinu sklidit nový kombajn CR11 firmy New Holland, který vyjel do obilných lánů v okolí...

Rozvádím se, oznámila dubajská princezna na Instagramu manželovi a jeho milenkám

Dubajská princezna Mahra (30) a její manžel šejk Mana Bin Mohammed Al Maktúm (25) se po loňské svatbě rozvádí. Dcera...

Olympiáda je festival sexu pro sportovce, potvrzují bývalí účastníci

Olympijská vesnice mi dala za dva týdny víc sexu než zbytek mého života, tvrdí bývalý olympionik Matthew Syed....

Herní technika

Finance

Osobnosti

Elektromobilita

Termíny

Válka na Ukrajině

Nepřehlédněte

iDNES.cz

© 1998–2024 MAFRA, a. s. a dodavatelé Profimedia, Reuters, ČTK, AP. Rozmnožování obsahu pro účely automatizované analýzy textů nebo dat dle ustanovení § 39c autorského zákona je bez souhlasu MAFRA, a. s. zakázáno. Jakékoliv užití obsahu včetně převzetí, šíření či dalšího zpřístupňování článků a fotografií je bez souhlasu MAFRA, a. s. zakázáno. Provozovatelem serveru iDNES.cz je MAFRA, a. s. IČ: 45313351.

mobilní verze

Přihlášení