Diskuze
Programátoři pokořili poker. Mohli vydělat miliony, vybrali si Science
Děkujeme za pochopení.
H21y78n60e97k 21M16r41t69v41ý
casina použití hráči sice zakazují, ale je otázkou času, kdy tyto boty samy nasadí. pár umělých hráčů jim hezky zvedne zisky nad rámec vybírání rakes
M87i15c72h12a39e28l 20P59r98i89n84c
Jak definují autoři Nash equilibrium (NE) v pokeru obecně a jak definují NE specificky v HUNL Hold'em?
Mám chápat aproximaci NE tak, že používají neurální sítě k naučení výsledků zpětné indukce? Sice nejsou schopni vypočítat přesně NE ke každému stavu, ale spokojí se s nejlepší přesností, kterou omezí další vrstvou neurální sítě? Klidně mne opravte, rád s dozvím víc.
M37i24r76o90s62l24a36v 75O96l48š11á13k
Nevím, kolik toho víte o samotném NE, tak aspoň napíšu základy, které znám já. NE pracuje s diskrétními strategiemi -- "když se hrálo takto a teď je hra v tomto stavu, zahraju za všech okolností tento tah" -- a jejich pravděpodobnostními kombinacemi. Například ve hrách s úplnou informací jako jsou šachy je neprohrávající rovnou nějaká diskrétní strategie, jen ji neznáme. Zato v "kámen, nůžky, papír" máme tři možné diskrétní strategie -- dát kámen, dát nůžky a dát papír -- ale optimální (neprohrávající) strategie je vybrat si náhodně jednu z těchto tří.
Tvrzení o NE říká, že je možné v každé hře několika hráčů rozdat hráčům strategie (pravděpodobnostně navážené), aby žádnému jednotlivému hráči nepomohlo svoji strategii změnit, což se dá ekvivalentně formulovat tak, že se žádnému hráči nevyplatí změnit svou strategii na diskrétní. Obecně to pro hry dvou hráčů znamená, že pro oba hráče existuje optimální strategie, protože když hráčům dáme strategie podle NE, tak je strategie hráče 1 optimální, ať hráč 2 svou strategii jakkoli změní (tedy ať hraje jakkoli).
Pro větší počet hráčů je to problém, protože nepomůže, aby jeden hráč hrál podle NE, musí podle NE hrát všichni až na jednoho hráče. A lidsky řečeno je problém v tom, že se obecně může několik hráčů spiknout proti jednomu. Nevím, ale nakolik tohle může nastat v Pokeru.
Počítat s diskrétními strategiemi přes celou hru by bylo neúnosné, ale neúplná informace je v Pokeru vždy chvliková -- po dobu jednoho "kola" (neznám odborný název), takže stačí hrát v každém kole optimální strategii zvlášť. Takové zjednodušení vyžaduje, aby byly předpočítané optimální šance na výhru na základě množství žetonů, ale odhadnout to nějakou statistikou by nemusel být problém.
V každém kole pak je třeba vyzkoušet všechny diskrétní strategie, kterých je stále příliš. Tady se nějak nasadí předem naučená neuronka odhadující, podobně jako třeba u Go, které možnosti se vyplatí zkoumat, a jak asi vyjdou ty ostatní. Podrobněji do toho nevidím.
M66i17r61o62s53l32a27v 28O73l18š27á30k
Je pravda, že co jsem se loni bavil s nějakým IBM náborářem, tak říkal, že Poker brzo padne.
Já stále čekám na matematiku -- až počítač porazí lidi v IMO, tak to na mne obzvlášť zapůsobí. Dokonce jsem se do toho výzkumu taky trochu zapojil a zkusil postavit nějakou neuronku. Ale to až tak hned nebude, zatím jsou počítače fakt marní.
M45a37r33t30i38n 56S20c86h92m38i54d
Jestli jste se bavil s IBM naborarem zde v Praze, tak je velmi mozne ze mel informace z prvni ruky. Oba prvni autori studie pracuji v Prazskem IBM Watson labu a na rok odjeli do Kanady pracovat na DeepStacku :)
J95a11r69o44s95l79a65v 71V91a86c11e16k
Není pravda, že šachy jsou vyřešené. Dokonce se tam také velmi výrazně pracuje s pravděpodobností.
Naopak považuji za ukázku nedokonalosti technologií, jaký obrovský výpočetní výkon musel být použit, aby porazil člověka. A to tomu programu pomohli ještě tím, že do něho nabouchali tuny partií. Tedy zdroj rozhodování pro člověka.
K93a76r65e65l 36P80o70d20h28o95r56s54k34y
Člověk má neuronů řádově více, také se to musí naučit a stejně mu to nejde tak dobře jako té technologii. Myslím, že to spíš svědčí pro tu technologii ;-)
J90a16r47o50s38l23a20v 38V62a64c60e83k
Když slyším neuronová síť, tak ztrácím pozornost. Každý algoritmus lze napsat efektivněji bez neuronové sítě. Jen to pak tak nezní.
V87l30a48s18t45i35m43i44l 31K38a52š71p90a83r
Pokud je k dispozici ten algoritmus. Je stále mnoho problémů, kde algoritmus znám není...
J15a31k27u35b 98K53r24e19j15č73í
Az pocitacove programy prekonaji v hrani pokeru lidi a je to jen otazka casu, bude to konec online hrani pokeru.
J27a31n 63P72r90o77c41h22a14z81k48a
Pro sedmdesátiletého dědka jako jsem já, který svůj první laptop s programem T 602 začal používat někdy v polovině 90.let, jsou všechny podobné články něco jako science fiction.
T59o32m12a82s 70K23o20t13a61l
Na druhou stranu jste i jako "sedmdesátiletý dědek" udržel krok a čtete zprávy na technetu. To může znít jako sci-fi mnoha Vašim vrstevníkům!
M62i75c58h53a17e87l 20P36r64i16n68c
Chtělo by to trochu doplnit a opravit. Programátoři nepokořili poker, ale jen jednu jeho variantu, která se jmenuje heads-up.
Sami píší, že více hráčů neobehrají. Zajímavé to přesto je.
P77a25v73e89l 24K70a69s52í52k96, 39T66e19c44h54n98e24t52.38C40z
Texas Hold'em No Limit je jedna z nejtěžších variant (z pohledu AI), do titulku je to podle mého snesitelná zkratka.
I14v15e52t20a 51S71o19c64h13o66r15o56v97a
Pokud nepokoří administrativu všeho druhu , tak posunuli poznání nepatrně .
O69d43s58t22r67a10n53ě66n60ý 64U33ž18i49v19a61t88e95l
D82u36s75a64n 71K72r62i48v52s60k14y
Jen se prizpusobi agresivni hre. Kdyz bude nekdo posilat All iny do malych potu, tak neni potreba ani zadny program, aby clovek byl dost plusovy. Tomu neni tezke se prizpusobit. Stovka her neni zadny vzorek, tam muze byt v plusu i nekdo kdo prakticky ani nezna pravidla i proti top hracum.
KVÍZ generála Pattona. Vypořádejte se s ocelovou lavinou
Jak jste dobří v tancích, poznáte je nejen na plese, ale i v následujícím kvízu. Kvíz je zaměřen na...
Čekání na české lidové auto nemělo konce. Před 100 lety jezdili jen boháči
Před 100 lety Čechoslováci marně čekali na tuzemské lidové auto. Drtivá většina obyvatel si totiž...
{NADPIS reklamního článku dlouhý přes dva řádky}
{POPISEK reklamního článku, také dlouhý přes dva a možná dokonce až tři řádky, končící na tři tečky...}
Necháte se nachytat na triky internetových podvodníků?
Typickou obětí internetového podvodu už nejsou jen senioři. Kyberzločinci se zaměřili i na mladší...
Na první pohled to vypadá jako pavouci v ruinách města. Foto je ovšem z Marsu
Evropská vesmírná agentura zveřejnila minulý týden nový snímek ze sondy Mars Express, který vyvolal...
{NADPIS reklamního článku dlouhý přes dva řádky}
{POPISEK reklamního článku, také dlouhý přes dva a možná dokonce až tři řádky, končící na tři tečky...}
Na Ukrajině zuří válka dronů. Co jsou sebevražedné drony a vyčkávací munice?
Sebevražedné drony a vyčkávací munice zažily obrovský rozvoj, protože se dají vyrobit za pár...
Facebooku se AI vyplatí až za roky a Microsoft do ní šel kvůli Googlu
Kdo nemá generativní umělou inteligenci, jako by nebyl. Alespoň to tak vypadá u největších...
Jak mohou být tak levná? Výborně hrající sluchátka lze koupit „za hubičku“
Premium Milovníci kvalitně reprodukované hudby mohou za sluchátka utratit spoustu peněz a nelitovat toho,...
Na první pohled to vypadá jako pavouci v ruinách města. Foto je ovšem z Marsu
Evropská vesmírná agentura zveřejnila minulý týden nový snímek ze sondy Mars Express, který vyvolal...
Švýcarská železniční chlouba se nemá zač stydět, i když nakonec zčervenala
Na světě najdeme mezi železničními lokomotivami řadu velkých legend, jednou z nich je i švýcarská...