Ve veřejném prostoru – médiích i vyjádřeních veřejných činitelů – se opakovaně objevují závažné chyby, které ztěžují porozumění situaci kolem nákazy vyvolané koronavirem SARS-Cov-2. Nemyslím si, že jde o nějaký záměr, spíše o přímý důsledek zásadního nepochopení některých aspektů mého oboru.
Řekněme hned, že zavedení nejen pro ekonomiku devastujících vládních opatření v polovině března bylo pochopitelné. Nejistota ohledně stavu a vývoje nákazy byla v té době obrovská. Stejně tak je potřeba zdůraznit, že dokud jsou vládní opatření v platnosti, je třeba je dodržovat. Což ovšem neznamená, že všechno je správně.
Koronavirus v Česku |
Jedním velkým a přitom na pochopení poměrně jednoduchým problémem diskuse o nákaze v médiích i jinde je systematické zaměňování dvou zcela odlišných ukazatelů stavu vážnosti nákazy. A to konkrétně „počtu nakažených“ a „počtu osob s prokázaným onemocněním covid-19“ (podle terminologie ministerstva zdravotnictví).
Jde o velmi odlišné veličiny. Počet nakažených byl, je a vždy bude neznámý. Mohli bychom jej přesně zjistit pouze v případě, že by byli (v jeden okamžik) otestováni všichni občané. To je ale samozřejmě nemožné. Možné je pouze pokusit se počet nakažených odhadnout na základě rozsáhlého reprezentativního průzkumu, který v těchto dnech probíhá. I po provedení průzkumu se ale bude jednat pouze o odhad, skutečný počet nakažených a vývoj tohoto počtu v čase zůstane neznámý.
Známý je pouze počet lidí s prokázaným onemocněním, který je ovšem neustále – v médiích i jinde – zaměňován s počtem nakažených. Obojí spolu přitom nemusí nijak souviset. Je klidně možné, že v době, kdy se všude mluvilo o „nárůstu počtu nakažených“, počet nakažených mezi všemi občany České republiky klesal. Pouze se zvyšoval počet odhalených případů.
Chápu, že může jít o komunikační zkratku, ale rozdíl mezi tím, jak může být čtenáři, diváky či posluchači vnímáno sdělení „počet nakažených stoupá!“ a informace, že „stoupá počet osob s prokázaným onemocněním, vývoj počtu nakažených neznáme“ je enormní.
Výroky o „počtu nakažených“ budí zcela mylný dojem, že nějak souvisí se stavem (či vývojem) nákazy. Informační hodnota ve skutečnosti komentovaného ukazatele „počet osob s prokázaným onemocněním“, pokud jde o skutečný stav a časový vývoj nákazy, je přitom zcela nulová. Nedozvíme se z něj vůbec nic. Dominantní prostor se již měsíc a půl věnuje špatnému ukazateli.
Stejně běžně jsou zaměňovány veličiny „počet zemřelých na covid-19“ (ten je zatím zcela neznámý) a „počet zemřelých, u kterých byla v době jejich smrti prokázána nákaza covid-19“. V médiích i prohlášeních veřejných činitelů jsou velmi často za „oběti covidu“ označováni všichni, kteří před smrtí měli pozitivní test na přítomnost viru v těle.
To ovšem neznamená, že virus byl příčinou smrti nebo k ní nějak přispěl. Řečeno názornou analogií: zemře-li člověk poté, co mu někdo do hrudi zabodne nůž, jedná se oběť vraždy. My jsme ale obrazně řečeno svědky toho, že se za „oběti vraždy“ označuje i člověk s rakovinou, kterého chvíli před smrtí někdo řízl nožem do prstu.
Role výběru
Na druhou stranu se zapomíná na to, jak moc na počet zemřelých a počet osob s prokázaným onemocněním (a nejen je) působí jiné faktory. Zásadním způsobem je například ovlivňují rozhodnutí těch, kdo je sledují. Dobrým příkladem je výběr lidí pro testování (tzv. testovací strategie). Pokud bychom například testovali pouze lidi ve vážném stavu, bude relativně vysoký podíl zemřelých (podle některých informací je možné, že toto je případ dat z Itálie); pokud bychom testovali jen lidi, kteří jsou na první pohled zcela zdrávi, podíl zemřelých by byl zřejmě nulový.
V příštích dnech bychom něco takového mohli zažít. K výrazné změně testovací strategie dochází v současné době i v České republice, například se zaváděním tzv. „chytré karantény“. V důsledku této změny, pokud „chytrá karanténa“ splní deklarovaný cíl, může dojít ke změně podílu testů s pozitivním výsledkem.
Hodnoty z doby, kdy „chytrá karanténa“ bude opravdu fungovat, nebudou tedy přímo srovnatelné s hodnotami staršími (částečně srovnatelné budou pouze vývojové trendy). Díky novému systému se může stát, že počet lidí s prokázanou nákazou vzroste.
Pokud se bude opakovat situace z posledních týdnů, někdo z toho může usuzovat, že „křivka míří nahoru“, nebo že „nakažených přibylo“ - ale to je chyba, ve skutečnosti se jen zlepšil záchyt infikovaných. (Pokud by po spuštění „chytré karantény“ nedošlo ke zvýšení úspěšnosti identifikace infikovaných osob, bylo by její zavedení velmi diskutabilním krokem.) Chybné úsudky takového typu by byly přímým důsledkem nedostatečného porozumění vlivu testovací strategie.
Nešťastná záliba v absolutnu
Vezměme si například zhruba týden starý výrok prof. Romana Prymuly, že kritériem pro uvolňování opatření by mohlo být dosažení hranice 400 „nakažených“. Pan profesor Prymula měl nepochybně na mysli 400 pozitivně testovaných za den a jeho výrok je nejspíše jen výrazová zkratka, nedává ovšem žádný smysl.
Pokud by se podařilo dostatečně zvýšit denní počet provedených testů, „podařilo“ by se i „dosáhnout“ nárůstu počtu „nakažených“. Kdybychom dělali 20 tisíc testů za den (což je kýžená kapacita podle vyjádření Andreje Babiše), počtu 400 osob s prokázanou nákazou bychom „dosáhli“, i kdyby byl podíl pozitivních výsledků pouhá 2 procenta. Což by naznačovalo, že nákaza je nejspíše velmi málo rozšířená.
S absolutními údaji kolem výskytu viru je obecně řečeno problém, že většinu z nich ovlivňuje i počet provedených testů. To se týká zejména počtu zemřelých a počet lidí s potvrzeným onemocněním covid-19.
Z absolutních čísel je klíčové sledovat počty pacientů s vážným průběhem nemoci – a to kvůli kapacitám zdravotnického systému. Pokud je cílem sledovat stav a časový vývoj nákazy, je přínos většiny dalších ukazatelů vyjádřených v absolutních hodnotách buď nulový, nebo velmi pochybný.
Jako statistik si samozřejmě nemyslím, že i při dnešním nedostatku dat neexistují žádné veličiny, které by nemělo smysl sledovat. Řadě z nich se ovšem bohužel nevěnuje v médiích buď žádná, nebo příliš malá pozornost.
Nejlepší z palety omezených možností, které máme pro sledování vývoje nákazy, je denní podíl počtu osob s prokázaným onemocněním k počtu (v daný den) provedených testů – tedy jinak řečeno denní procento pozitivních testů. A to i s vědomím, že i tento podíl je samozřejmě stále ovlivněn testovací strategií - tím, koho testujeme. Tento ukazatel je však ve veřejném prostoru buď zcela přehlížen, nebo nedostatečně akcentován. A co říká o stavu a vývoji nákazy v České republice?
Vezměme to chronologicky. Zpočátku jsou hodnoty zatíženy relativně vyšší nejistotou, protože testů se dělalo málo. Přesto můžeme konstatovat, že přibližně od 11. března (458 testů) až do 20. března (2085 testů) podíl výrazně nerostl (ani neklesal) a kolísal zhruba okolo hodnoty 7 %. V tomto období se stejným způsobem vypočtený podíl v Lombardii pohyboval v rozmezí přibližně 30-60 %.
V sobotu 21. března (1880 testů) byl podíl 8,4 %. Od té doby lze pozorovat pozvolný pokles. V prvních dubnových dnech byl denní podíl lidí s (nově) prokázanou nákazou v ČR 3-5 % (Lombardie 10-25 %). Po celou dobu sledování onemocnění covid-19 byla tedy situace v ČR z hlediska míry rozšíření nákazy s Lombardií zcela nesrovnatelná, a to již i před zavedením vládních opatření.
Vše o koronaviru
|
V období od 13. do 22. dubna (tj. po spontánně „uvolněných“ Velikonocích, jejichž vlivu se epidemiologové a někteří vládní představitelé obávali) podíl nevybočil z intervalu od 1 do 2,5 % a byl velmi blízko svého teoretického minima, tedy nule. Pokud bude úspěšný projekt „chytré karantény“, mělo by dojít ke zvýšení podílu.
Hlavní ale je, že jsme již delší dobu v situaci, kdy z matematického hlediska již podíl nemá kam dále klesat. Z tohoto pohledu už není při uvolňování vládních opatření na co čekat.
Autor působí jako odborný asistent na Katedře statistiky a pravděpodobnosti Vysoké školy ekonomické v Praze.