Aktuální statistiky o celosvětovém vývoji COVID-19 na jednom místě

9. 4. 2020
Doba čtení: 6 minut

Sdílet

Na internetu se v souvislosti s koronavirem vynořilo mimo jiné i mnoho webových stránek, které se snaží zpracovávat data do různých statistických výstupů. Jen v českém registru se jich objevilo hned několik.

Jestliže patříte mezi ty, kteří rádi sledují aktuální „koronavirová“ čísla nebo z nich čerpáte informace při své práci, můžete narazit na několik překážek. Některé statistiky totiž sice přináší údaje, které zrovna potřebujete, ale jsou staré a pravidelně se neobnovují. V případě dynamických vizualizací jste zase při práci svázáni pevně danými mantinely.

Pokud vám to nevyhovuje, můžete vyzkoušet nově vytvořený nástroj na generování dynamických vizualizací z dílny sdružení CZ.NIC, který má široké možnosti a lze jej různě nastavovat. Můžete si tak navolit například libovolné světové území, vzorec pro danou křivku, můžete kopírovat URL a samozřejmě pro update stačí zmáčknout F5.

Jak to funguje?

Prioritou pro nás bylo umožnit zobrazit všechna dostupná území. Chtěli jsme tak dosáhnout toho, aby si ladné křivky mohly zobrazit všechny země, které mají statistiky veřejně dostupné, ale nejsou třeba dostatečně atraktivní pro běžně prezentované vizualizace na Internetu.

A teď už k funkcionalitě. Z důvodu velké složitosti je většina ovládacích prvků zpočátku skryta. Vpravo naleznete menu, kde lze zapnout jednotlivé panely.

1. Axes

V panelu Axes si vyberete varianty použitých os. Osa Y je buď lineární, logaritmická nebo procentuální. Logaritmickou použijete, když chcete srovnat malé a velké území – například Českou republiku s Evropou. Takže i přesto, že je naše země mnohem menší, tvar obou křivek je patrný.

Procentuální zobrazení doporučujeme v případě, že chcete zobrazit informace, které porovnávají více faktorů najednou. Například kontinenty utvoří sloupce, rozdělené podle počtu potvrzených a skončených případů. Nebo naopak (počty potvrzených a skončeným utvoří sloupce rozdělené podle kontinentů).

Na ose X lze pak volit buď čas, nebo počet potvrzených případů. Můžete si zobrazit křivku nově potvrzených případů vůči jejich celkovému množství. Přehledně tak můžete vizualizovat, zda se země veze na vlně exponenciálního růstu (což z časové osy není vizuálně snadné odvodit), či zda se jí daří změnit průběh epidemie.

Přepínačem si můžete navolit, zda monitorujete vývoj trendu pro rozsah dní, či zda zobrazíte situaci v jeden konkrétní den. Posuvník pak graf překreslí pro daný časový rozsah.

2. Computation

Záložka Computation umožňuje ovlivnit výpočet dvěma způsoby. Přepínač „Average“ zapne průměrování dat za poslední týden, přesněji je použitý klouzavý průměr sedm dní zpětně. I v zemích, které reportují poctivě, se vyskytnou výpadky a chyby. Kupříkladu Itálie nahlásila 11. března přírůstek 3 000 potvrzených případů, o dva dny později 6 000, ale 12. března není ve statistikách uvedeno nic.

Druhý přepínač „Outbreak“, česky bychom řekli prudké šíření, posune všechny datasety tak, že začínají v den, kdy v daném teritoriu bylo hlášeno jisté množství případů. Jaké? To si určíte buď konstantou absolutní, nebo vztaženou k populaci. Například lze ukázat vývoj v evropských státech v momentě, kdy dosáhly sta nakažených nebo kdy na jejich území byl hlášen počet případů odpovídající promile populace, což bylo v případě Itálie 8. března. V březnu to ale z evropských států stihlo, jak je vidět z grafu, ještě dalších deset od Islandu po Monako.

3. Equation

Neméně zajímavé menu je Equation, jež umožňuje nastavit elegantní rovnici, kterou graf konkrétně vykreslí. Do rovnice zadáte libovolné aritmetické parametry a některé ze 17 připravených proměnných.

Základní rovnice zní prostě: C (confirmed cases) neboli počet potvrzených případů. Analogicky k ní je RD, to jest případy, které skončily uzdravením či smrtí. Z nich předpona N (new) udělá rovnice v daný den nově se vyskytující případy a předpona dN jejich derivaci.

Tedy kupříkladu pokud se včera nově uzdravilo pět lidí a dnes sedm, nabude proměnná dNR hodnoty +2, neboť počet nově uzdravených se o dva zvýšil. Proměnná P obsahuje populaci (pokud ji pro dané území máme) a T počet testovaných (dostupné jen pro ČR).

Nyní si uveďme několik příkladů s vysvětlením, abychom věděli, co jsme si vlastně zobrazili.

Rovnici je možno agregovat, to jest sečíst data ze všech použitých území do jediné datové sady. Lze tak snadno porovnávat severní a jižní Evropu nebo jak si vede ČR oproti jejím sousedům a vykreslit přitom jen dvě čáry. Případně sloupce, které je možné skládat na sebe, ať už podle rovnice (potvrzené případy na potvrzené) nebo podle území (Evropa na Evropu).

Můžeme se pustit do vytváření vícera rovnic naráz. Užitečným příkladem je porovnání tří různých kontinentů podle počtu případů daného typu. Každá rovnice pak může být na vlastním grafu. Místo, aby se tísnilo devět čar na jednom grafu, můžeme mít tři grafy o třech čarách. Nebo mohou být jednotlivá data na nezávislé ose Y, jak je možné vidět na grafu vývoje ČR a Evropy. Všimněte si, že každá spojnice má vlastní osu Y, takže můžeme vidět přehledně data z ČR i z Evropy, přestože zobrazení není lineární.

4. Display menu

Menu Display přináší další užitečné volby. Můžete popsat křivky hodnotami či názvy jejich rovnic. Změnit, pokud nejste spokojeni s implicitním nastavením, při kterém jsou v grafech bez spojnicových grafů popsány názvy sloupců. Dále si můžete určit barevná schémata a barvit křivky podle rovnice či podle teritoria. Nebo si můžete určit, jak mají být seřazeny položky, zobrazené při najetí myši. Vyberte si.

Jak zobrazím data pro jinou zemi?

To byla v návrhu aplikace poměrně složitá věc. Nakonec jsou území členěna do tří celků – kontinenty, země a státy nebo řekněme provincie. Každou rovnici lze spojit s množinou území nebo jejich agregací. Pokud má území závislá teritoria, najdeme vedle něj ikonku oka a fajfky. Oko zobrazí a skryje všechna závislá území, která nejsou spojena s aktivně editovanou rovnicí. Fajfka pak asociuje k rovnici všechna závislá území. Implicitně jsou zobrazeny kontinenty a všechna území spojená s aktivní rovnicí.

Tento mechanismus napomáhá orientaci ve stovkách možností, zvlášť, když dochází k následujícím případům:

  • Čínská lidová republika – skládá se z jednotlivých závislých území jako je například Chu-pej. Můžeme si zobrazit tedy celé území Čínské lidové republiky nebo jen Chu-pej.
  • Francouzská republika – je také složena z několika území. Lze tedy zobrazit Francii jako zemi a jako region (kam je zahrnuta země i její provincie) nebo třeba Reunion jako provincii, případně jednotlivé provincie.
  • Teritorium patří pod více nadřazených území.

A co možnosti sdílení?

Aplikace je navržena tak, aby se veškerá vaše činnost okamžitě promítla do URL. Jakmile jste spokojeni, stačí si nastavit záložku nebo zkopírovat URL a až přijdete příště, najdete editor, jak jste jej opustili. Pokud chcete s daty dále pracovat po svém, v každém okamžiku je lze vykopírovat z dynamické tabulky. Nebo stáhnout jako CSV, JSON či obrázek.

Teď už nezbývá než si novinku vyzkoušet a dostat se tak k datům, na která už netrpělivě čekáte. Stále však platí, že až budete mít na světě svoji vysněnou vizualizaci, to, co popisuje, není skutečný svět, ale jenom jeho digitální odraz. Jsou to data získaná z dostupných zdrojů. Mohou tak být zpožděná, neúplná a v některých případech i manipulovaná. Je důležité si uvědomit jednotlivé souvislosti. Například, jestliže je dnes nově uvedeno 1 000 otestovaných jedinců a 500 potvrzených, neznamená to, že se dnes nakazilo 500 lidí. Protože testy byly prováděny před několika dny a testovaní se nakazili ještě dříve.

bitcoin školení listopad 24

Naopak těm, co se nakazí dnes, se příznaky projeví až za pět dní, budou testováni za týden a v kolonce otestovaní se tak objeví v lepším případě za deset dní. V tom horším i za dvacet, nebo také nikdy. Také se může stát, že budou ve statistikách dvakrát, pokud se testuje dvakrát stejný pacient. Je nutné si uvědomit i fakt, že se metodika měření v různých zemích liší. Tudíž například někde nemusí být mezi nakažené započítaní ti jedinci, kteří jsou sice pozitivně testovaní, ale zrovna nevykazují příznaky. Takže buďte obezřetní a mějte na paměti, že to jsou jen data.

(Původně napsáno pro blog CZ.NIC.)

Autor článku

Edvard Rejthar má v týmu CSIRT.CZ a CZ.NIC-CSIRT na starosti především analýzu škodlivého kódu na webových stránkách v české doméně, rozvoj systémů na automatické zpracovaní dat a analýzy pro projekt Turris.