Představte si, že se chystáte uspořádat během probíhající epidemie oslavu narozenin. Žijete ve městě, kde je zhruba 1,2 milionu obyvatel. Říkejme mu třeba Praha. Ve městě zrovna nabírá na síle další vlna pandemie, například onemocnění covid-19.
Řekněme, že je v hypotetickém městě přibližně 60 tisíc nakažených, kteří o sobě ještě neví, že jsou nakažení (jde o hypotetický odhad pro potřeby našeho příkladu, skutečné číslo může být nižší i mnohem vyšší).
Chcete být opatrní, a tak nehodláte dělat žádnou velkou akci. Pozvete jen kamarády, které jste dlouho neviděli, ne víc než 20 lidí. Jaká je šance, že zrovna mezi těmi 20 lidmi z toho obrovského města bude někdo nakažený?
Pokud si říkáte, že je ta šance celkem malá, pak… se mýlíte. Pravděpodobnost bude kolem 64 procent. Pravděpodobnost totiž roste s počtem účastníků překvapivě rychle.
A pokud byste si mysleli, že při deseti účastnících bude pravděpodobnost přítomnosti někoho nakaženého 32 procent, pletli byste se znovu. Vyzkoušejte si v našem interaktivním nástroji. Posuvníkem můžete nastavit počet hostů a procento nakažených ve městě.
Jak je možné, že ta pravděpodobnost roste tak nepravidelně? Může za to vcelku neintuitivní sčítání pravděpodobností. Když sčítáme pravděpodobnosti, postupujeme v tomto případě opačně: počítáme, s jakou pravděpodobností se to nestane, a pak výsledek odečteme od 100 %.
Ukázka sčítání pravděpodobnostiEpidemie je komplikovaný příklad. Uvažujme na chvíli šestistranné hrací kostky. Na nich bude sčítání pravděpodobností o trochu zjevnější. Jaká je šance, že na jedné kostce hodíte šestku? Jaká je šance, že na dvou kostkách padne alespoň jedna šestka? Podívejme se místo toho, jaké všechny varianty nám mohou na dvou kostkách padnout: 11, 12, 13, 14, 15, 16, 21, 22, 23, 24, 25, 26, 31, 32, 33, 34, 35, 36, 41, 42, 43, 44, 45, 46, 51, 52, 53, 54, 55, 56, 61, 62, 63, 64, 65, 66. To je celkem 36 variant (6 × 6). Z nich přesně 11 vyhovuje hledané podmínce „alespoň jedna šestka“: 16, 26, 36, 46, 56, 61, 62, 63, 64, 65, 66. Tedy odpověď na naši otázku je 11/36 = 30,6 %. Mohli bychom k výsledku dospět nějak jednodušeji? Ano – tady se dostaneme k našemu sčítání pravděpodobností. Mohli bychom vynásobit pravděpodobnosti, že nenastala hledaná situace. Jaká je šance, že na jedné kostce nepadla šestka? Pochopitelně 5/6 (pět šestin). Šance, že na dvou kostkách nepadla šestka, je 5/6 × 5/6, což je 25/36. Teď víme, jaká je šance, že na dvou kostkách padla alespoň jedna šestka: je to přesný opak 25/36, tedy zbytek do jedničky (do 100 %). A to je oněch 11/36, ke kterým jsme došli předtím. Výhoda je, že při násobení negativní pravděpodobnosti (pravděpodobnosti, že k danému jevu nedošlo) se dostaneme k jednoduchému obecnému řešení. Jaká je šance, že když hodím X kostek, bude alespoň na jedné šestka? Řešením naší obecné hádanky je tedy 1 - (5/6)×(5/6)×(5/6)×(5/6)...×(5/6) pro každou x-tou kostku, tedy obecně 1 - (5/6)^x. Pro tři kostky je šance alespoň jedné šestky 42 %. Pro šest kostek je to 77 %. Pro deset kostek 84 %. Pro dvacet kostek 97 % atd. Každá další kostka „ukrajuje“ šestinový kousek z pravděpodobnosti. Nikdy ale s konečným počtem kostek nedojde ke zmenšení pravděpodobnosti na nulu (vždy je šance, že nepadne ani jedna šestka, jen je to stále méně pravděpodobné). Zobrazit více Sbalit |
Pravděpodobnost, že konkrétní host je nakažený, je rovna počtu nakažených ve městě vydělenému počtem všech obyvatel města. Označme toto číslo p. Šance, že tento člověk nakažen není, je 1-p.
Proč je to tak neintuitivní?
Šance, že ani jeden z dvojice vybraných hostů není nakažený, je (1-p)×(1-p). Násobíme proto, že pracujeme s pravděpodobnostmi, nikoli s absolutními čísly. (Puntíčkář zde může namítnout, že pravděpodobnost, že druhý host je infekční, není roven přesně p, ale počtu nakažených vydělenému počtem obyvatel města mínus jedna, nicméně tento rozdíl je při rozumné velikosti města a rozumně malé party zanedbatelný.)
Když takto pokračujeme dále, dostaneme, že šance, že není nakažen nikdo, je (1-p)počet_hostů. Pravděpodobnost, že alespoň jeden je nakažený, je 1-(1-p)počet_hostů.
Pro naše původní předpoklady o situaci ve městě tak můžeme poměrně snadno vytvořit následující graf. Na něm je vidět, jak rychle s počtem hostů stoupá pravděpodobnost, že přijde alespoň jeden nakažený.
Počet hostů kromě mne | Pravěpodobnost, že alespoň jeden host je nakažený (%) |
---|---|
1 | 5.00% |
2 | 9.75% |
5 | 22.62% |
10 | 40.13% |
20 | 64.15% |
30 | 78.54% |
40 | 87.15% |
50 | 92.31% |
60 | 95.39% |
70 | 97.24% |
80 | 98.35% |
90 | 99.01% |
100 | 99.41% |
Vidíme, že riziko roste velmi rychle – právě z tohoto pohledu dává epidemiologické opatření vázané na nízké počty lidí na jednom místě smysl. Může se vám zdát, že je celý příklad poněkud přitažený za vlasy a že v Praze přece nemáme 60 tisíc nakažených, ale méně. Řekněme optimisticky, že je to polovina, tedy 30 tisíc.
Jenže poloviční počet nakažených neznamená, že se nám zmenší riziko v dvacetičlenné skupině o polovinu. Ve skutečnosti klesne „jen“ na přibližně 40 %. Vyzkoušet si to můžete v našem interaktivním prvku výše.
Co z toho všeho plyne prakticky?
- Pokud jde o teorii pravděpodobnosti, tak nikdy nevěřte své intuici. Raději si sedněte a počítejte. Často se tam skrývá chyták, který je zjevný až poté, co si čísla zanesete do grafu.
- Pokud jde o epidemii, tak teď možná lépe vidíte, proč i při relativně malém počtu nakažených je třeba sáhnout po tak drakonických opatřeních, jaká vidíme i u nás.
Zůstaňte tedy doma a neplánujte žádnou party. Momentálně je to to nejlepší, co můžete udělat.
Skutečný „narozeninový paradox“Podobně, ale trochu jinak, se počítá slavná hádanka pracující nikoli s nákazou, ale s datem narození. Řekněme, že chceme určit pravděpodobnosti, že v nějaké skupině mají alespoň dva lidé narozeniny ve stejný den a měsíc. V této variantě vstupuje do hry „chyták“, který u nákazy řešit nemusíme. Jaká je pravděpodobnost „narozeninové shody“, když skupina čítá dva lidi? Nebudete asi překvapení, tohle číslo je malé a činí pouze 0,27 %. Protože první z nich může mít narozeniny kdykoli z 365 dní v roce a ten druhý kdykoli kromě jednoho dne, kdy se narodil ten první. Pro výpočet nám tak stačí spočítat 365/365 × 364/365 a získáme pravděpodobnost, že mají v narozeniny v různé dny. Pokud tuto hodnotu odečteme od jedničky, dostaneme výsledek pro pravděpodobnost, že je mají ve stejný den. Pokud chceme vědět, jaká je pravděpodobnost pro tři účastníky, opakujeme celý postup pro tři účastníky a tak dále. Jaká je šance, že ve skupině X lidí mají alespoň dva stejné narozeniny? Protože ve skupině je čím dál více lidí, nepočítáme jen shodu „má narozeniny ve stejný den, jako určitá osoba“, ale namísto toho hledáme odpověď na otázku „má každá osoba ve skupině unikátní datum narození“? Ta pravděpodobnost je zpočátku stále malá. Jenže pak to celé vezme rychlý spád a při skupině 23 lidí jsme již na pravděpodobnosti 50,73 %. A logicky dosáhneme 100% hranice v moment, kdy je účastníků 366 (nebo 367, počítáme-li s přestupnými roky), protože pak už není ani teoreticky možné, aby alespoň dva lidé neměli stejné datum narozenin. Celou tabulku včetně vzorců naleznete třeba na Wikipedii v rámci hesla Birthday problem. Zobrazit více Sbalit |
Text vznikl pro web Centra pro modelování biologických a společenských procesů a byl převzat se svolením autorů. Před vydáním byl redakčně upraven. Doplnili jsme interaktivní počítadlo a vysvětlení některých principů. Originál najdete zde.