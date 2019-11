„S příchodem AI (umělé inteligence – pozn. red.) do go jsem si uvědomil, že nejsem nejlepší, že i když se s ohromným úsilím stanu hráčem číslo jedna, existuje něco, co neporazím,“ řekl jihokorejské agentuře Yonhap v pondělí 25. listopadu Lee Se-dol, asi nejznámější hráč go současnosti.



V Asii doslova legendární hráč tak veřejně vysvětlil své rozhodnutí ukončit svou zajímavou kariéru. Dnes 36letý hráč se špičkových soutěží v tomto sportu účastnil od 12 let a za tu dobu nasbíral 18 vítězství ve velkých mezinárodních turnajích.



I proto, když v březnu 2016 nastoupil jako první špičkový hráč go proti systému AlphaGo, mnozí odborníci odhadovali, že stroj s ním bude mít veliké potíže. Hra go byla považována za hru pro počítače těžko přístupnou a AlphaGo do té doby porazil „pouze“ evropského šampiona – ale Evropa hraje v go „druhou ligu“.



Pravidla go Go je hra s relativně jednoduchými pravidly, ve které náhoda nehraje žádnou roli. Hrací deska má rozměr 19×19 políček (ve skutečnosti průsečíků linií na ploše, ale to je vlastně jedno). Hráči mají kameny různé barvy, které mohou klást střídavě na libovolné volné hrací pole. Vždy začíná černý a hráči se snaží zcela obklíčit soupeřovy kameny a zabránit mu v obklíčení svých vlastních. Hra končí ve chvíli, když se oba hráči vzdají tahu, a vyhrává zjednodušeně řečeno ten, kdo ovládne větší území (ve skutečnost je to složitější a skóre se může počítat různými způsoby podle různých pravidel). Hráči go se tedy snaží vytvořit souvislé bloky ze svých kamenů a zabránit v tomtéž soupeři. Zdá se to jednoduché, pro počítačovou analýzu je ale hra go nesmírně obtížná svým rozsahem.

Jak se však ukázalo, AlphaGo se během pěti měsíců mezi oběma zápasy dokázal výrazně zlepšit a v partii s Lee Se-dolem předvedl skvělé pasáže. Vyhrál první tři zápasy série hrané na tři vítězství a o jeho triumfu bylo tedy jasno v nejkratší možné době. Korejský hráč požádala o dohrání dvou zbývajících zápasů v naději, že když už nepůjde o výsledek, bude hrát uvolněněji a možná dokáže počítač porazit.



To se mu v jednom případě povedlo a zápas tedy celkově skončil 4:1 ve prospěch stroje. Ovšem Lee své vítězství nevidí zrovna v růžových barvách. Podle něj počítač zahrál tah 78 špatně v důsledku odstranitelné chyby v programu. Na nerovnováze sil mezi člověkem a počítačem tedy tento jeden výsledek nic nemění.



Lee Se-dol je tak od roku 2016 dodnes jediný potvrzený lidský vítěz nad plnou verzí systému AlphaGo. Druhý největší lidský „úspěch“ je remíza během série 50 pokusných zápasů v roce 2017, kdy systém anonymně hrál na internetových go serverech. Remízy ovšem dosáhl jen jediný hráč a jen proto, že mu v rané fázi hry vypadlo připojení. Jinak AlphaGo lidské soupeře bez výjimky porazil.



Od té doby se navíc objevili další „umělí“ hráči go, kteří své lidské protějšky trvale přehrávají. Například čínský Fine Art nebo korejský software zvaný HanDol. Jejich herní kvalita je tak veliká, že i nejlepší hráči proti nim nastupují s výhodou (mohou položit před začátkem hry dva kameny), aby měli alespoň nějakou naději na vítězství.



Se-dol se s kariérou rozloučí v prosinci zápasem právě proti HanDol. Ovšem ve svůj úspěch příliš nevěří – pokud tedy máme věřit jeho prohlášení při oznámení konce kariéry: „Mám pocit, že i s výhodou dvou kamenů první hru proti HanDol ztratím.“



Kdo že ho porazil?

Systémy, které poráží člověka v go, se v základních rysech stále podobají průkopnickému softwaru AlphaGo, který Lee Se-dola porazil v roce 2016. Ten pochází z dílny společnosti DeepMind, která spadá do holdingu Alphabet, stejně jako například společnost Google. Systém autoři z DeepMind popsali v publikaci pro časopis Nature. Podle ní AlphaGo využívá propracovanou kombinaci učenlivých algoritmů a běžného „silového“ vyhledávání nejlepší varianty. Jinými slovy, jeho „intuitivní“ obvody nejprve výběr zúží na ty možnosti, které se jim podle předchozích zkušeností (odehraných a rozebraných partií) zdají jako nadějné, a ty pak propočítá.



Jak AlphaGo vybírá, jaký tah udělá: nejprvě posoudí, jaké možnosti má a který tah má nejvyšší šanci, že přispěje k vítězství, posuzuje také krátkodobý a dlouhodobý dopad. V tomto případě AlphaGo zvolilo tah indikovaný červeně na posledním schématu. Fan Hui odpověděl položením kamene nad kámen AlphaGo. Po zápase ale řekl, že měl táhnout spíše na pole označené číslem 1 (což byla předpověď AlphaGo).

Postup se volí proto, že hrubou silou se s dnešní technologií hra go vyřešit nedá. Na začátku hry je k dispozici 361 možností, jak zahrát, a po pěti kolech může být hrací plocha uspořádána do celkem zhruba pěti bilionů (5×1012) možných konfigurací. Pro srovnání, šachovnice může po deseti tazích (po pěti každého hráče) být uspořádána „jen“ necelými pěti miliony způsobů. Rozdíl tří řádů se pak rychle zvětšuje a v go je celkem k dispozici více než 10170 různých konfigurací kamenů na desce. To je více, než kolik je podle dnešních odhadů atomů ve vesmíru.

Nástup softwaru v go neznamená, že by umělá inteligence a počítače najednou dokázaly překonávat člověka hned v celé řadě dalších činností, kde hrubá výpočetní síla nestačí. Už proto, že použitá technologie není v principu nic nového. Jde o tzv. neuronové sítě, které jsou v principu i v praxi známé dlouhá desetiletí – jen díky pokroku v hardwaru (a částečně i softwaru) se jejich možnosti v posledních letech velmi rychle vylepšily.



Musíme ovšem zopakovat, že jde o „jednoúčelové“ nástroje, ne obecnou umělou inteligenci, která by zvládla širokou škálu úkolů. O tom ostatně nejlépe svědčí fakt, že DeepMind zatím pro svého umělého „šampióna“ nenašla žádné smysluplné komerční využití a opakovaně zatím končí ve ztrátě.