Obsah

Porušené předpoklady

Již po několikáté byla Česká republika vystavena náporu velké vody. Někde odminula stihli dobudovat ochranné hráze, někde ne a voda smetla jejich torza, a ještě jinde ani nic budovat nezačali. Ty hráze, zábrany... prostě různá protipovodňová opatření se stavějí s tím, že mají odolat, např., tzv. stoleté vodě. To je zkrátka povodeň takového rozsahu, že se přižene jen jednou za sto let – jinými slovy, pravděpodobnost, že se přižene zrovna letos, je právě 1%.

Jakpak má být vysoká taková hráz, aby přes ni ani taková velká voda nepřetekla? Tedy, jak vysoko bude hladina té které řeky v tom kterém místě s uvedenou pravděpodobností? Matematicky byla tato otázka – a jiné podobné (např. zemětřesení...) – poprvé uchopena pány L. Tippetem, R. A. Fisherem a E. J. Gumbelem, kteří jsou právem zváni pionýry teorie extrémů. Statistické rozložení, kterým se modeluje výška hladiny, pak nese jméno posledně uvedeného, tedy se nazývá Gumbelovo.

Samozřejmě, bez dat to nejde. Takže se měří výška hladiny. Hezky den za dnem, pořád. Následně se vybere taková výška, která byla za celý rok největší a dá se bokem. Když se měří už dlouho, třeba 100 let, budeme tak mít 100 údajů – 100 maxim. S jejich pomocí odhadneme parametry Gumbelova rozložení (a provedeme nějaké testy, kterým se říká testy dobré shody, abychom ověřili, zda s naším modelem nejsme úplně vedle... ale nezacházejme do detailů). No a tak následně, pomocí kvantilů rozložení, můžeme odhadnout výšku hladiny nejen stoleté vody, ale třeba i pětisetleté či tisícileté, aniž bychom museli mít údaje za celých 500 či 1000 let. Hezké, že?

No a nyní, v čem je háček. Jasně že tam je. Data, která jsme použili pro odhad parametrů našeho modelu, musejí totiž splňovat jisté předpoklady, bez kterých je celý náš výpočet jen jakousi hrou s čísly bez vazby na realitu. Těmi základními předpoklady jsou zejména: data musejí být vzájemně nezávislá a musejí být „vybrána ze stejného rozložení“ (independent and identically distributed – často se používá pro oba zároveň zkratka iid). S tím prvním nyní problém nebude – asi se snadno shodneme, že maximální výška hladiny Svratky v Brně v roce 2010 nijak neovlivnila maximální výšku hladiny téže řeky tamtéž v roce 2011 – a pokud přece jen, tak to určitě můžeme zanedbat. Horší je, zda se měření v tak dlouhém čase, který je pro dostatečný rozsah podkladů potřebný, odehrává za stále stejných – nebo alespoň velmi podobných – podmínek... tedy že teoretické chování je v jistém slova smyslu stabilní... že opravdu měříme „jen“ množství vody, které se nějak do řeky dostane z nějaké části krajiny, za více méně konstantních podmínek. Určitě si každý umí představit, že pokud se krajina nějak zásadně promění, někde ubagrují celý kopec lesa, postaví na horním toku přehradu, nebo něco podobného, tak najednou výška hladiny z loňska nemá s tou letošní pranic společného – a nemůžeme je tedy dávat do jednoho pytle a modelovat je jedním způsobem. A o to tady jde! Nezasáhli jsme za poslední desetiletí do krajiny – v lesích, v polích – tolik, že data z roku např. 1970 nemají s těmi současnými již téměř nic společného? Když pak někdo dnes hovoří o tom, že přišla třeba ta okřídlená „stoletá voda“ – jak to ví, když podklady pro takový odhad použít prakticky nelze? Není se pak možné divit, že voda, o které se domníváme, že má přijít s pravděpodobností 1%, nepřijde jednou za sto let, ale třeba třikrát za 15 roků.

Pokud by předpoklady nebyly porušené a vše se dělo tak jak má, pak stoletá voda přijde 3x za 15 let s pravděpodobností přibližně čtyři setiny procenta (přesněji 0,040331%, prostě je docela malá). Jak to víme? To ponecháváme jako cvičení pro zájemce...

Sledujte:Copyright © 2014. All Rights Reserved.