Premium

Získejte všechny články mimořádně
jen za 49 Kč/3 měsíce

Statistik: Ve zprávách o covid-19 dělají novináři opakovaně vážné chyby

  18:27
Na statistiky o průběhu nákazy v České republice je potřeba se dívat úplně jinak, než se to v médiích většinou děje, píše statistik Karel Helman.
ilustrační snímek

ilustrační snímek | foto: Profimedia.cz

Ve veřejném prostoru – médiích i vyjádřeních veřejných činitelů – se opakovaně objevují závažné chyby, které ztěžují porozumění situaci kolem nákazy vyvolané koronavirem SARS-Cov-2. Nemyslím si, že jde o nějaký záměr, spíše o přímý důsledek zásadního nepochopení některých aspektů mého oboru.

Řekněme hned, že zavedení nejen pro ekonomiku devastujících vládních opatření v polovině března bylo pochopitelné. Nejistota ohledně stavu a vývoje nákazy byla v té době obrovská. Stejně tak je potřeba zdůraznit, že dokud jsou vládní opatření v platnosti, je třeba je dodržovat. Což ovšem neznamená, že všechno je správně.

Koronavirus v Česku

Od středečního rána mohou lidé nakupovat také na farmářském trhu na pražském...
Ve středu ráno začali vojáci se stavbou stanů, kde od následujícího dne budou...
Vlaky společnosti RegioJet odstavené na Smíchovském nádraží v Praze. (22. dubna...

Jedním velkým a přitom na pochopení poměrně jednoduchým problémem diskuse o nákaze v médiích i jinde je systematické zaměňování dvou zcela odlišných ukazatelů stavu vážnosti nákazy. A to konkrétně „počtu nakažených“ a „počtu osob s prokázaným onemocněním covid-19“ (podle terminologie ministerstva zdravotnictví).

Jde o velmi odlišné veličiny. Počet nakažených byl, je a vždy bude neznámý. Mohli bychom jej přesně zjistit pouze v případě, že by byli (v jeden okamžik) otestováni všichni občané. To je ale samozřejmě nemožné. Možné je pouze pokusit se počet nakažených odhadnout na základě rozsáhlého reprezentativního průzkumu, který v těchto dnech probíhá. I po provedení průzkumu se ale bude jednat pouze o odhad, skutečný počet nakažených a vývoj tohoto počtu v čase zůstane neznámý.

Známý je pouze počet lidí s prokázaným onemocněním, který je ovšem neustále – v médiích i jinde – zaměňován s počtem nakažených. Obojí spolu přitom nemusí nijak souviset. Je klidně možné, že v době, kdy se všude mluvilo o „nárůstu počtu nakažených“, počet nakažených mezi všemi občany České republiky klesal. Pouze se zvyšoval počet odhalených případů.

Chápu, že může jít o komunikační zkratku, ale rozdíl mezi tím, jak může být čtenáři, diváky či posluchači vnímáno sdělení „počet nakažených stoupá!“ a informace, že „stoupá počet osob s prokázaným onemocněním, vývoj počtu nakažených neznáme“ je enormní.

Výroky o „počtu nakažených“ budí zcela mylný dojem, že nějak souvisí se stavem (či vývojem) nákazy. Informační hodnota ve skutečnosti komentovaného ukazatele „počet osob s prokázaným onemocněním“, pokud jde o skutečný stav a časový vývoj nákazy, je přitom zcela nulová. Nedozvíme se z něj vůbec nic. Dominantní prostor se již měsíc a půl věnuje špatnému ukazateli.

Stejně běžně jsou zaměňovány veličiny „počet zemřelých na covid-19“ (ten je zatím zcela neznámý) a „počet zemřelých, u kterých byla v době jejich smrti prokázána nákaza covid-19“. V médiích i prohlášeních veřejných činitelů jsou velmi často za „oběti covidu“ označováni všichni, kteří před smrtí měli pozitivní test na přítomnost viru v těle.

To ovšem neznamená, že virus byl příčinou smrti nebo k ní nějak přispěl. Řečeno názornou analogií: zemře-li člověk poté, co mu někdo do hrudi zabodne nůž, jedná se oběť vraždy. My jsme ale obrazně řečeno svědky toho, že se za „oběti vraždy“ označuje i člověk s rakovinou, kterého chvíli před smrtí někdo řízl nožem do prstu.

Role výběru

Na druhou stranu se zapomíná na to, jak moc na počet zemřelých a počet osob s prokázaným onemocněním (a nejen je) působí jiné faktory. Zásadním způsobem je například ovlivňují rozhodnutí těch, kdo je sledují. Dobrým příkladem je výběr lidí pro testování (tzv. testovací strategie). Pokud bychom například testovali pouze lidi ve vážném stavu, bude relativně vysoký podíl zemřelých (podle některých informací je možné, že toto je případ dat z Itálie); pokud bychom testovali jen lidi, kteří jsou na první pohled zcela zdrávi, podíl zemřelých by byl zřejmě nulový.

V příštích dnech bychom něco takového mohli zažít. K výrazné změně testovací strategie dochází v současné době i v České republice, například se zaváděním tzv. „chytré karantény“. V důsledku této změny, pokud „chytrá karanténa“ splní deklarovaný cíl, může dojít ke změně podílu testů s pozitivním výsledkem.

Hodnoty z doby, kdy „chytrá karanténa“ bude opravdu fungovat, nebudou tedy přímo srovnatelné s hodnotami staršími (částečně srovnatelné budou pouze vývojové trendy). Díky novému systému se může stát, že počet lidí s prokázanou nákazou vzroste.

Pokud se bude opakovat situace z posledních týdnů, někdo z toho může usuzovat, že „křivka míří nahoru“, nebo že „nakažených přibylo“ - ale to je chyba, ve skutečnosti se jen zlepšil záchyt infikovaných. (Pokud by po spuštění „chytré karantény“ nedošlo ke zvýšení úspěšnosti identifikace infikovaných osob, bylo by její zavedení velmi diskutabilním krokem.) Chybné úsudky takového typu by byly přímým důsledkem nedostatečného porozumění vlivu testovací strategie.

Nešťastná záliba v absolutnu

Vezměme si například zhruba týden starý výrok prof. Romana Prymuly, že kritériem pro uvolňování opatření by mohlo být dosažení hranice 400 „nakažených“. Pan profesor Prymula měl nepochybně na mysli 400 pozitivně testovaných za den a jeho výrok je nejspíše jen výrazová zkratka, nedává ovšem žádný smysl.

Pokud by se podařilo dostatečně zvýšit denní počet provedených testů, „podařilo“ by se i „dosáhnout“ nárůstu počtu „nakažených“. Kdybychom dělali 20 tisíc testů za den (což je kýžená kapacita podle vyjádření Andreje Babiše), počtu 400 osob s prokázanou nákazou bychom „dosáhli“, i kdyby byl podíl pozitivních výsledků pouhá 2 procenta. Což by naznačovalo, že nákaza je nejspíše velmi málo rozšířená.

S absolutními údaji kolem výskytu viru je obecně řečeno problém, že většinu z nich ovlivňuje i počet provedených testů. To se týká zejména počtu zemřelých a počet lidí s potvrzeným onemocněním covid-19.

Z absolutních čísel je klíčové sledovat počty pacientů s vážným průběhem nemoci – a to kvůli kapacitám zdravotnického systému. Pokud je cílem sledovat stav a časový vývoj nákazy, je přínos většiny dalších ukazatelů vyjádřených v absolutních hodnotách buď nulový, nebo velmi pochybný.

Jako statistik si samozřejmě nemyslím, že i při dnešním nedostatku dat neexistují žádné veličiny, které by nemělo smysl sledovat. Řadě z nich se ovšem bohužel nevěnuje v médiích buď žádná, nebo příliš malá pozornost.

Nejlepší z palety omezených možností, které máme pro sledování vývoje nákazy, je denní podíl počtu osob s prokázaným onemocněním k počtu (v daný den) provedených testů – tedy jinak řečeno denní procento pozitivních testů. A to i s vědomím, že i tento podíl je samozřejmě stále ovlivněn testovací strategií - tím, koho testujeme. Tento ukazatel je však ve veřejném prostoru buď zcela přehlížen, nebo nedostatečně akcentován. A co říká o stavu a vývoji nákazy v České republice?

Denní podíl počtu osob s prokázaným onemocněním a počtu provedených testů. Červené body znázorňují omezení volného pohybu osob (16.3.) a povinné nošení roušek (19.3.).

Vezměme to chronologicky. Zpočátku jsou hodnoty zatíženy relativně vyšší nejistotou, protože testů se dělalo málo. Přesto můžeme konstatovat, že přibližně od 11. března (458 testů) až do 20. března (2085 testů) podíl výrazně nerostl (ani neklesal) a kolísal zhruba okolo hodnoty 7 %. V tomto období se stejným způsobem vypočtený podíl v Lombardii pohyboval v rozmezí přibližně 30-60 %.

V sobotu 21. března (1880 testů) byl podíl 8,4 %. Od té doby lze pozorovat pozvolný pokles. V prvních dubnových dnech byl denní podíl lidí s (nově) prokázanou nákazou v ČR 3-5 % (Lombardie 10-25 %). Po celou dobu sledování onemocnění covid-19 byla tedy situace v ČR z hlediska míry rozšíření nákazy s Lombardií zcela nesrovnatelná, a to již i před zavedením vládních opatření.

Vše o koronaviru

Speciální příloha iDNES.cz.

  • příznaky nemoci
  • zpravodajství a rozhovory
  • kontakty a pomoc

V období od 13. do 22. dubna (tj. po spontánně „uvolněných“ Velikonocích, jejichž vlivu se epidemiologové a někteří vládní představitelé obávali) podíl nevybočil z intervalu od 1 do 2,5 % a byl velmi blízko svého teoretického minima, tedy nule. Pokud bude úspěšný projekt „chytré karantény“, mělo by dojít ke zvýšení podílu.

Hlavní ale je, že jsme již delší dobu v situaci, kdy z matematického hlediska již podíl nemá kam dále klesat. Z tohoto pohledu už není při uvolňování vládních opatření na co čekat.

Autor působí jako odborný asistent na Katedře statistiky a pravděpodobnosti Vysoké školy ekonomické v Praze.

Autor:
  • Nejčtenější

Hackerský průlom. Z peněženky, k níž zapomněl heslo, získal miliony dolarů

v diskusi je 74 příspěvků

28. května 2024  18:02

V roce 2013 přišel Michael při poruše pevného disku o heslo k digitální peněžence, ve které měl...

Benzín dodá špagetám říz, pizzu vylepší lepidlo. Googlu se zbláznila AI

v diskusi je 92 příspěvků

29. května 2024

Snad žádná jiná technologie se nevyvíjela tak rychle jako v posledních měsících umělá inteligence....

{NADPIS}

{LABEL} {POPISEK}

Spotify končí s „věcí do auta“, posluchači mají zánovní zařízení vyhodit

v diskusi je 48 příspěvků

26. května 2024  13:28

Je to jak z příručky „jak naštvat zákazníky“. Spotify ukončuje podporu svého jediného fyzického...

Nejlepší přítel zabijákem. Čína testovala robotického psa s útočnou puškou

v diskusi je 45 příspěvků

29. května 2024  11:23

Čína během společného vojenského cvičení Číny a Kambodži „Zlatý drak 2024“ testovala robotického...

{NADPIS}

{LABEL} {POPISEK}

Druhá světová válka měla i své dinosauří oběti

v diskusi jsou 4 příspěvky

25. května 2024

Psal se 24. duben roku 1944 a nacistická válečná mašinérie už nebyla schopna zabránit konečné...

OBRAZEM: Naše první elektrická rychlíková lokomotiva jezdila jen v Praze

v diskusi nejsou příspěvky

31. května 2024

Realizované elektrifikační snahy prvorepublikových ČSD se omezily na tzv. pražský uzel. Při této...

Firma spoluzakladatele Googlu testuje doposud největší létající stroj

v diskusi nejsou příspěvky

31. května 2024

Jsou to majestátní létající stroje, které sice létají i dnes, ale svou největší slávu již mají...

Za kritiku vražda. Před 100 lety se stal Mussolini fašistickým diktátorem

v diskusi je 20 příspěvků

30. května 2024

30. květen 1924 je klíčovým okamžikem počátku totalitního režimu v Itálii. Právě tehdy získával...

VIDEO: „Závoďáky“ Bundeswehru se dvěma řidiči jezdily rychle vpřed i vzad

v diskusi jsou 3 příspěvky

30. května 2024

Obrněné průzkumné vozidlo Luchs bylo pro svou rychlost přirovnáváno k závodnímu vozu. Dále se...

Žádná tajná bokovka. S manželkou jsme rozvedeni, překvapil Petr Nedvěd

Generální manažer české hokejové reprezentace Petr Nedvěd (52) byl po divoké oslavě zlaté medaile z mistrovství světa...

Posedlost sexem, tíže lásky, nekrofilie. Gejšin příběh zmátl Japonsko

Vine se jím sex, mocná záliba v sexu. Rovněž láska. Neukojitelná, doslova vražedná. Onen příběh se odehrál v kulisách...

Hoši, nádhera, děkují celebrity za hokejové zlato. Pokáč baví vítěze písničkou

Česká hokejová reprezentace získala po čtrnácti letech zlato na mistrovství světa. Obrovský úspěch nadchl nejen...

Někteří mě mají za zlatokopku. Nenesu to lehce, říká manželka Ondřeje Kepky

Seznámili se na vysoké škole, kde on byl pedagog a ona studentka. Jsou spolu přes devět let a v budoucnu plánují i...

Brankář Dostál zklamal fanynky. Randí s finskou volejbalistkou, bývalkou Nečase

Neprůstřelný gólman Lukáš Dostál (23) byl hvězdou letošního mistrovství světa v hokeji. Nadšení z něj byli nejen mužští...