Premium

Získejte všechny články
jen za 89 Kč/měsíc

Zdánlivě fatální selhání: Proč průzkumy předpovídaly Trumpův pád?

  19:07aktualizováno  23:18
Ještě včera se zdál být výsledek amerických prezidentských voleb jasný. Průzkumy předpovídaly vítězství Clintonové se 70 až 85% jistotou. Realita však dopadla úplně jinak. Proč i ty osvědčené průzkumy tak fatálně selhaly?
Proč byl výsledek amerických prezidentských voleb v listopadu 2016 tak...

Proč byl výsledek amerických prezidentských voleb v listopadu 2016 tak překvapivý? | foto: montáž: Pavel Kasík - Technet.czProfimedia.cz

„Při pohledu zpět vidí ostře každý,“ říká americké přísloví podobné tomu českému o generálech po bitvě. Stejně tak je snadné kritizovat chyby v předvolebních průzkumech po volbách. Překvapivé vítězství republikánského prezidentského kandidáta ovšem tyto otázky opět otevřelo. Proč se výzkumy tak výrazně mýlily?

Nepochopení procent Co vlastně říkaly průzkumy v den voleb?

Nejsledovanější průzkumy od FiveThirtyEight.com, HuffingtonPost a New York Times přisuzovaly v den voleb větší šance Clintonové, a to mezi 85 % a 71 %.

Model New York Times předpovídal 85% šanci vítězství Clintonové

FiveThirtyEight.com dávalo Trumpovi ani ne třetinovou šanci vyhrát

Připomeňme, že to nebyly předpovědi zisku hlasů, ale předpovědi šance na vítězství. V americkém volebním systému totiž prakticky nezáleží na celkovém výsledku voleb. Hlavní jsou výsledky v jednotlivých státech. Ten, kdo získá většinu v daném státě, „bere vše“, tedy získává všechny volitele za daný stát. Předpovědi celkového počtu hlasů k sobě měly mnohem blíže:

Shrnutí všech předvolebních průzkumů, ze kterých FiveThirtyEight.com vytvářelo výslednou předpověď

Řada lidí ovšem při pohledu na prohlášení typu „Clintonová má 80% šanci stát se prezidentkou“ získá představu, že má Clintonová drtivou převahu. „Přitom její vedení bylo v řadě států v rámci statistické odchylky,“ připomíná Michal Škop, programátor, matematik a spoluzakladatel projektu KohoVolit.eu. Podle něj nejde o výrazné selhání průzkumů jako takových: „Když se výzkumníci netrefili o tři procenta, tak to není až tak moc, ale v těchto volbách to díky specifickému americkému volebnímu systému znamenalo rozdíl mezi prohrou a výhrou kandidáta.“

Předpovědi FiveThirtyEight.com a (po volbách) zakroužkované skutečné výsledky

S tím souhlasí i Daniel Prokop, sociolog a šéf politického výzkumu z agentury MEDIAN: „Republikánům to vyhrál, podobně jako v roce 2000, americký volební systém.“ Odkazuje tak na fakt, že Clintonová i Trump dostali prakticky stejný počet hlasů (oba mírně přes 59 milionů), ale díky rozložení mezi různé státy je výsledný počet volitelů pro Trumpa výrazně vyšší.

„Nemyslím si, že je to úplné selhání výzkumů jako takových,“ dodává Prokop. „Otázkou spíše je, jestli ty výzkumy mohly být lépe vyhodnoceny. Já si myslím, že ano.“

Metodika průzkumů Chyběla práce s nerozhodnutými voliči

Odhlédněme na chvíli od volebních výsledků a pojďme se podívat, jak fungují předvolební průzkumy a jejich agregace:

  1. Agentura vypíše průzkum, buď ve specifickém státě, nebo celonárodní.
  2. Dotazovatelé buď telefonicky, osobně, nebo přes internet osloví vzorek obyvatelstva v dané populaci.
  3. Analytik agentury data zpracuje tak, aby zohlednil podíl různých demografických skupin v populaci.
  4. Agentura publikuje výsledky průzkumu (a obvykle i jeho metodiku).
  5. Agregátor (například FiveThirtyEight.com) „oznámkuje“ průzkum podle jeho kvality a přiřadí mu „váhu“ a „zkreslení“ na základě předchozích zkušeností s daným typem průzkumu.
  6. Agregátor spočítá celkový výsledek na základě desítek takových průzkumů v daném období.

V každém z těchto kroků se pracuje nejen s jasnými statistickými fakty, ale i s určitým metodologickým „know-how“. Agentury například musejí správně vyhodnotit, jak vyvážit odpovědi od různých skupin lidí či jak tyto skupiny vůbec definovat (muži/ženy, mladí/staří, zaměstnaní/nezaměstnaní atp.). „Zkušenosti z minula evidentně v tomto případě neodpovídaly realitě,“ myslí si Škop. „Firmy nedokázaly započítat něco, co naměřit šlo.“

Galerie předpovědí

Podle Prokopa je jedním z problémů velké části těchto průzkumů nedostatečná práce s jistotou voliče: „Řada těch agentur se dotazovaného zeptá, zda půjde k volbám, nebo ne. Ti, kteří půjdou, se dostanou do kategorie likely voters (pravděpodobní voliči) a agentura zkoumá, koho by volili. Ti, kteří odpoví, že k volbám spíše nepůjdou, ale nevylučují to, jsou z výsledků prakticky odříznuti. Přitom část z nich se třeba na Floridě zřejmě zúčastnila.“

Lepší, i když komplikovanější je podrobnější dotazování, které lze dále vyhodnocovat: „Kdyby se voličů zeptali, jak jisti jsou si účastí a s touto šancí počítali v modelu, bylo by to lepší.“

To podle Prokopa netýká jen účasti, ale i nerozhodnutých voličů. „Americké výzkumy je často odříznou a tím předpokládají, že se rozhodnou podobně jako ti, co už vědí, koho volit. Ale to tentokrát neplatilo – rozhodli se častěji pro Trumpa. My se například v našich průzkumech nerozhodnutých ptáme na míru příklonu ke stranám a k tomu přihlížíme.“ Takovýto „pravděpodobnostní model“ by prý umožnil lépe zachytit rozdílnou míru nejistoty mezi voliči Clintonové a Trumpa a také podchytit nerozhodnuté voliče.

Přeměřování nepomůže Průzkumy nejsou náhodná pozorování

Průzkumy předpovídaly, že Clintonová dostane přibližně o tři procentní body více hlasů než Trump, což by jí (vzhledem k rozložení mezi státy a následné přepočítání na volitele) zajistilo relativně jisté vítězství. Z těchto předpovědí a z průzkumů přímo u volebních místností (tzv. exit polls) pak vycházely také předpovědi těsně po volbách, kdy se začaly počítat hlasy po celých Spojených státech. Následující graf mapující aktuální predikce New York Times dobře ukazuje šok, který řada prognostiků utrpěla pod návalem reálných dat z volebních místností:

Jak se během noci měnily předpovědi New York Times (volitelé)

Z grafu je zřejmé, že reálný výsledek ležel na samé hranici nejistoty (práh 5 %) a bylo to tedy výrazné překvapení. Ještě lépe je to vidět u grafu, na kterém New York Times (citovaný mj. i Českou televizí) předpovídá v danou chvíli šance kandidátů na vítězství. Prakticky během tří hodin došlo nad naším ránem k úplnému přehodnocení výsledné předpovědi.

Jak se během noci měnily předpovědi New York Times

To podle Dana Prokopa může ukazovat i na to, že v prováděných průzkumech byla nějaká systémová chyba, specifická pro tyto volby. „Agregátory průzkumů pracují s podobnými daty, ale jinak je ladí. Pokud je tam systematický posun v těch zdrojových datech, pak je těžké ji odfiltrovat,“ vysvětlil nám sociolog. „Je asi potřeba detailnější analýza metodiky jednotlivých průzkumů, která by redukovala jejich případné vychýlení. Nikoli jen vážení agentur podle hrubých parametrů jako je velikost vzorku apod.“

Nate Silver, jeden z nejpopulárnějších prognostiků amerických voleb (viz rámeček), například upozornil na to, že americké státy nejsou na sobě nezávislé. „Existuje velká korelace mezi jednotlivými státy, takže chyby v jednom státě budou nejspíš napodobeny v dalších, podobných státech.“

Jednotlivé průzkumy nejsou nezávislá měření. Často mají stejnou metodiku, a tedy i stejnou systémovou chybu

„Je to problém i uvnitř státu, když považujete průzkumy za zcela nezávislá měření,“ říká Prokop. Je podle něj dobré se dívat, zda se neshodují díky tomu, že k tomu přistupují stejně metodicky. „Když se shoduje metodika, je velká pravděpodobnost, že dvě kvalitní agentury dojdou ve stejném čase ke stejnému výsledku. Dnes existují v ČR tři modely, které dávají dvouciferný náskok ANO. Ale je to mimo jiné proto, že všechny vychází ze spontánní otázky. Podobné to je v USA, kde všichni opakují podobnou definici „likely voters“ a odřezávají nerozhodnuté,“ říká Prokop.

Je to, jako kdyby více agentur používalo k měření pravítko od stejné firmy. Špatné pravítko bude dávat stejné výsledky a tím zdánlivě potvrzovat měření ostatních agentur. Ve skutečnosti ale měření (a následné předpovědi) zkresluje. A to navíc u všech agentur. Americké predikční weby podle Prokopa tuto provázanost podcenily a považovaly svoje odhady za jistější, než ve skutečnosti byly.

Co konkrétně mohlo zkreslit měření? Zatím pro to nemáme přesné podklady, toto jsou tedy spíše spekulace, které bude nutno později ověřit na tvrdých číslech:

  • Stydlivost voličů - též Bradleyho efekt. Označuje situaci, kdy dotázaný nechce z nějakého důvodu přiznat své skutečné preference. V případě Donalda Trumpa lze spekulovat například o tom, že vzdělaní muži se nechtěli v telefonickém či osobním dotazování přiznávat k volbě Trumpa. „Proto si také Trump vedl lépe v počítačových on-line výzkumech, kde mají lidé větší pocit soukromí,“ říká Prokop. Stejně tak se mohly například ženy před ostatními ženami stydět za to, že by podporovaly Trumpa. Nebo, jak říká manažerka Trumpovy kampaně: „Nestyděli se, ale už je nebavilo hádat se o politice.“
  • Volání na pevné linky - Řada dotazování probíhá pomocí volání na pevné linky, ale většina lidí už pevné linky nepoužívá. Přestože to agentury vědí a snaží se tento rozpor odfiltrovat, může mít vliv v případě, že se tyto skupiny (pracující vs. v domácnosti) výrazně liší v názoru na kandidáty.
  • Neschopnost vyvážit město a venkov - Při vzorkování může být problém správně vyvážit voliče z měst a z venkova.
  • Malá návratnost - Tazatelům odpovídá v USA na dotazy velmi malá část lidí (cca 2 až 10 %), a výzkumná agentura proto musí složitě dopočítávat, zda je ta skupina, která odpověděla, nějak odlišná od té, která neodpověděla. Je možné spekulovat, že voliči Donalda Trumpa (který opakovaně mluvil o tom, jak průzkumům není radno věřit) měli mírně menší zájem na tom v průzkumech odpovídat.
  • Stranické preference - Průzkumy se často zaměřily na osobnost kandidáta, zatímco v USA velká část voličů volí podle stranické příslušnosti takřka bez ohledu na aktuálního kandidáta. V americkém systému totiž prezident stojí v čele vlády, a voliči tedy volí nejen prezidenta.

Je dokonce možné, že samotné předvolební průzkumy se nějakým způsobem podepsaly na výsledku: „Od demokratů zaznívalo, že už mají výhru díky hlasování v předtermínu a predikované převaze v klíčových takřka jistou,“ připomíná Prokop. „Díky tomu mohla vypadnout účast lidí, kteří by volili proti Trumpovi, ale Hillary nemilují.“ Volební průzkumy zkrátka mohly snížit motivaci voličů, kteří chtěli zastavit Trumpa, ale díky pozitivním predikcím měli pocit, že už jejich hlas není potřeba, zatímco Trumpovi voliči byli o to motivovanější.

Ačkoli samotný Trump opakovaně vyzýval voliče, aby nevěřili výzkumům (ukázalo se, že měl pravdu), Trumpova kampaň se rozhodně výzkumy řídila. Na poslední chvíli - tedy v posledních dvou dnech před volbami, objel Trump neuvěřitelných deset států ve třech časových pásmech, aby zde těsně před volebním dnem vyburcoval voliče. Zaznamenali jsme tyto zastávky (vyznačen je stát, nikoli město) na mapu prognóz a mapu volebních výsledků:

Mapa volebních prognóz s vyznačenými místy posledních Trumpových zastávek
Mapa volebních výsledků s vyznačenými místy posledních Trumpových zastávek

Vlevo mapa s prognózami, vpravo mapa s volebními výsledky, žlutě označené státy, kde Trump promluvil k voličům těsně před volbami

„Sám Trump dělal kampaň právě a jen v těch státech, které rozhodly. Jak to věděl? Díky průzkumům,“ domnívá se Michal Škop. Zdaleka ne ve všech státech, které na poslední chvíli navštívil, uspěl, ale na vítězství to stačílo. Nejdůležitější byly v tomto ohledu Florida, Pennsylvánie a Severní Karolína. Ve všech těchto státech měla podle prognóz mírný náskok Clintonová. „Republikáni dotáhli Demokraty v práci s daty,“ myslí si Škop. „S tím, co známe z Česka, je to nesrovnatelné.“

Poučení? Počítat s nejistotou a statistickými odchylkami

Odborníci se shodují na tom, že průzkumy sice selhaly, ale nebylo to selhání výrazné. V praxi se výzkumy strefily v rozmezí několika procent. „Je to systematická chyba, ale nikterak významná. V takto těsných volbách ale i dvě tři procenta v klíčových státech znamenala odlišný výsledek voleb,“ uzavírá Daniel Prokop a dodává: „Nevím, jestli je to selhání těch agentur, nebo spíše lidí, kteří na základě výzkumů vytvářejí prognózy.“ Podle Prokopa je důležité, aby se lidé naučili s těmito průzkumy lépe zacházet v kontextu jejich vzniku a nepřeceňovat jejich predikční sílu.

Úspěšná předpověď

Profesor historie Allan Lichtman předpověděl podeváté výsledek voleb. Nepotřeboval k tomu ale výsledky výzkumů...

Do budoucna se pak bude zřejmě řešit především to, jak výzkumy (nejen ty předvolební) do budoucna zlepšit. Zatímco v ostatních oblastech (například v marketingovém průzkumu) je rozdíl několika procent naprosto zanedbatelný, v případě amerických voleb rozhodují o vítězi právě tato procenta.

„Nějaká chyba tam bude vždycky,“ připomíná Michal Škop. „I kdyby se všechno udělalo nejlépe, jak jde, tak tam nějaká chyba bude.“ Proto je potřeba u průzkumů pracovat se statistickými odchylkami. Jediným spolehlivým průzkumem veřejného mínění, jak praví klasický bonmot, jsou ostatně právě volby samotné.

Jak si vedl nejslavnější „věštec“

Jedním z vítězů minulých amerických prezidentských voleb roku 2012 byl (nejen podle našeho článku) Nate Silver. Statistik, který v té době vedl blog nazvaný FiveThirtyEight na New York Times, předpověděl výsledky voleb s přesností, která laickou veřejnost překvapila. Týkalo se to nejen samotné prezidentské volby, která nakonec v roce 2012 byla méně těsná, než se předpovídala, ale i voleb v jednotlivých státech, kde jeho předpověď vyšla stoprocentně: vyhrálo 50 z 50 kandidátů, které jeho předpovědní model favorizoval.

Nebyl to samozřejmě Silverův první úspěch, do NY Times se dostal poté, co jeho předpovědi uspěly v roce 2008. Nedělal vlastní průzkumy, vytváří jen statistické modely založené na údajích z průzkumů. Jeho práce spočívá především ve výběru dat, které do něj zařadit podle jejich důvěryhodnosti, spolehlivosti a dalších měřítek. Silver vážil jednotlivé průzkumy na základě historických výkonů těch, kdo je pořizovali – v podstatě je posuzoval jako hráče baseballu, pro který vytvářel statistické modely předtím.

V roce 2012 nebyl Silver rozhodně jediný, kdo výsledek odhadl, ale díky své relativní známosti a možná i jiným faktorům (býval sázkařem a profesionálním hráčem pokeru, takže měl zajímavou minulost) se stal symbolem předpokládané „statistické revoluce“. Odešel z NY Times, a jeho blog koupila společnost ESPN, specializující se na sportovní přenosy. Od té doby se tým kolem FiveThirtyEight.com (čili 538, což je počet volitelů prezidenta USA) rozrostl na zhruba 45 lidí a kromě politiky pokrývá ve velkém i sportovní statistiky. Před prezidentskými volbami se ale znovu stal častým místem návštěv pro všechny zájemce o volební předpovědi.

Silver a spol. nabízel několik možných modelů, které braly či naopak nebraly v potaz historická data, ekonomické údaje, demografické údaje atp. Jejich hlavním výsledkem bylo „jediné číslo“, procentuální hodnota, která udávala pravděpodobnost vítězství toho či onoho kandidáta v procentech. Jak je jasné z připojeného grafu, výsledky výrazně kolísaly, ale obecně řečeno dávaly v kontextu jiných průzkumů nezvykle velkou šanci Donaldu Trumpovi.

Vývoj předpovědního modelu FiveThirtyEight.com od června do listopadu 2016

Vítězství jeho protivnice bylo stále podle výsledků modelu výrazně pravděpodobnější, ale chyba není tak veliká, jak by se mohlo z pohledu na procentuální hodnotu (71,4:28,6) zdát.

Zhruba týden před volbami, kdy už model dával tento výsledek, Silver napsal, že výsledky jsou v rámci běžné nepřesnosti průzkumů (náskok Clintonové byl v té době zhruba kolem tří procent): „Pokud Clintonová vyhraje o tři procenta, s velkou pravděpodobností vyhraje Bílý dům. Ale je to středně velké „pokud“.“ Poznámka byla ovšem na konci dlouhého textu, jehož přečtení trvalo podstatně déle než jeden pohled na procentuální hodnoty. Alespoň z části tak možná překvapení výsledku alespoň z části nepadá na statistiky, ale na samotné čtenáře.

Aktualizace: Do článku jsme doplnili údaje o průzkumech a jejich využití.

Autoři:
  • Nejčtenější

Zázrak! NASA po pěti měsících obdržela od sondy Voyager smysluplnou zprávu

v diskusi je 179 příspěvků

23. dubna 2024  13:37

Když se v únoru letošního roku stále nedařilo navázat smysluplnou komunikaci s jedním z...

Herečce Slávce Budínové by bylo 100 let. Zemřela opuštěná, bez zájmu veřejnosti

v diskusi je 30 příspěvků

21. dubna 2024

Před 100 lety, 21. dubna 1924, se v Ostravě narodila známá česká herečka Slávka Budínová.

{NADPIS reklamního článku dlouhý přes dva řádky}

{POPISEK reklamního článku, také dlouhý přes dva a možná dokonce až tři řádky, končící na tři tečky...}

Proč umělá inteligence lže a proč kvůli ní zhloupneme. Počítačový expert vypráví

v diskusi je 17 příspěvků

22. dubna 2024

Premium Zatímco průmyslová revoluce zaváděla masivní využití strojů, které nahradily lidské svaly, nyní...

Byla to druhá nejjasnější hvězda. V budoucnu může svítit jako druhý Měsíc

v diskusi je 17 příspěvků

21. dubna 2024

Velmi neobvyklá hvězda éta Carinae v devatenáctém století náhle zjasnila a stala se druhou...

{NADPIS reklamního článku dlouhý přes dva řádky}

{POPISEK reklamního článku, také dlouhý přes dva a možná dokonce až tři řádky, končící na tři tečky...}

Dnes už se bez nich válčit nedá. Raketový vzestup bojových dronů

v diskusi je 47 příspěvků

24. dubna 2024

Bezpilotní letadla (drony) jsou v posledních dvou dekádách na raketovém vzestupu. Přispěla k tomu...

Čekání na české lidové auto nemělo konce. Před 100 lety jezdili jen boháči

v diskusi je 20 příspěvků

28. dubna 2024

Před 100 lety Čechoslováci marně čekali na tuzemské lidové auto. Drtivá většina obyvatel si totiž...

KVÍZ generála Pattona. Vypořádejte se s ocelovou lavinou

v diskusi je 1 příspěvek

28. dubna 2024

Jak jste dobří v tancích, poznáte je nejen na plese, ale i v následujícím kvízu. Kvíz je zaměřen na...

Pomník Jana Žižky na Vítkově vznikal skoro 30 let

v diskusi je 11 příspěvků

27. dubna 2024

27. dubna 1924 zahájil Spolek pro zbudování pomníku Jana Žižky na Žižkově veřejnou sbírku na jeho...

Přistávat s vrtulníkem je jako balancovat na míči a zůstat při tom něžný

v diskusi jsou 4 příspěvky

27. dubna 2024

Mysli na to, že při záchraně druhých nesmíš sebe ani nikoho jiného ohrozit. Tak zněla jedna z...

Bývalý fitness trenér Kavalír zrušil asistovanou sebevraždu, manželka je těhotná

Bývalý fitness trenér Jan Kavalír (33) trpí osmým rokem amyotrofickou laterální sklerózou. 19. dubna tohoto roku měl ve...

Tenistka Markéta Vondroušová se po necelých dvou letech manželství rozvádí

Sedmá hráčka světa a aktuální vítězka nejprestižnějšího turnaje světa Wimbledonu, tenistka Markéta Vondroušová (24), se...

Horňáci versus dolňáci. Víme, čemu muži dávají přednost, a je to překvapení

Ženské tělo je pro muže celkově velmi atraktivní a nabízí jejich očím mnoho zajímavých partií. Největší pozornosti se...

Hello Kitty slaví padesátiny. Celý svět si myslí, že je to kočička, jenže není

Kulatý obličej se dvěma trojúhelníkovýma ušima, drobný čumáček, vousky a červená mašle na uchu. Taková je Hello Kitty,...

Za vytlačení z linky do Brna musí Student Agency zaplatit náhradu 21 milionů

Společnost Student Agency provozující autobusy a vlaky pod označením RegioJet musí zaplatit bývalému konkurentovi 21...