náhledy
hra go technet
Autor: Nature.com
Jak AlphaGo vybírá, jaký tah udělá: nejprvě posoudí, jaké možnosti má a který tah má nejvyšší šanci, že přispěje k vítězství, posuzuje také krátkodobý a dlouhodobý dopad. V tomto případě AlphaGo zvolilo tah indikovaný červeně na posledním schématu. Fan Hui odpověděl položením kamene nad kámen AlphaGo. Po zápase ale řekl, že měl táhnout spíše na pole označené číslem 1 (což byla předpověď AlphaGo).
Autor: Silver et al, Nature 2016
Trénování neuronových sítí probíhá v několika vrstvách a vychází jak ze skutečných zápasů, tak ze simulovaných výsledků. Počítač tak získá pravděpodobnostní mapu herního pole, ze které vybírá možné tahy.
Autor: Silver et al, Nature 2016
AlphaGo využívá mimo jiné i přístup „Monte Carlo“, zjednodušeně „náhodné prohledávání možností“, ovšem není to jediný využívaný způsob simulace.
Autor: Silver et al, Nature 2016
Jak si stojí různé umělé inteligence a světoví hráči ve srovnání s AlphaGo. V distribuované verzi (využívající i stovky počítačových procesorů) by mělo hrát AlphaGo lépe, než velká část profesionálních hráčů.
Autor: Silver et al, Nature 2016
Výsledky pěti oficiálních partií, ve kterých AlphoGo porazilo evropského mistra Fan Hui. Čísla na kamenech značí pořadí, v nichž byl kámen položen. Pod deskou jsou znáznorněny kameny, které leží na místě odebraného kamene.
Autor: Silver et al, Nature 2016
Seznam všech her (oficiálních i neoficiálních) mezi Fan Hui a AlphaGo
Autor: Silver et al, Nature 2016