Hrůza z pravděpodobnosti

Matematika |

Také jste už měli znepokojivý sen, v němž máte složit závěrečnou zkoušku z předmětu, na který jste nikdy nechodili? Pro profesory to funguje obráceně – zdá se vám, že máte přednášet něco, o čem nic nevíte. Něco takového prožívám, kdykoliv přijdu do styku s teorií pravděpodobnosti.

Hrůza z pravděpodobnosti



Nikdy jsem sám žádnou přednášku z pravděpodobnosti neabsolvoval, takže když dneska musím pravděpodobnost učit, je to trochu děsivé a trochu zábavné, asi jako když navštívíte dům hrůzy v zábavním parku.
Možná že nejvíc se mi zrychlí tep, když přednáším o podmíněné pravděpodobnosti – o pravděpodobnosti, že nastane událost A, pokud (za podmínky, že) došlo k nějaké jiné události B. Je to delikátní pojem, který se snadno splete s pravděpodobností B, pokud došlo k A. Není to totéž, ale člověk se musí soustředit, aby pochopil proč. Uvažme například následující slovní úlohu.
Než odjedete na týdenní dovolenou, požádáte svého zapomnětlivého přítele, aby zalil vaši churavějící květinu. Nebude-li zalita, má rostlina 90% pravděpodobnost, že zahyne. I když bude zalita, má stejně 20% pravděpodobnost, že zahyne. A pravděpodobnost, že váš přítel na zalití zapomene, je 30 %. (a) Jaká je pravděpodobnost, že rostlina ten týden přežije? (b) Pokud bude uschlá, až se vrátíte, jaká je pravděpodobnost, že ji přítel zapomněl zalít? (c) Jestliže ji přítel zapomněl zalít, jaká je pravděpodobnost, že bude při návratu z dovolené uschlá? I když vypadají podobně, (b) a (c) nejsou doopravdy totožné. Odpověď na (c) je 90 %. Ale jak zkombinujete všechny pravděpodobnosti, abyste dostali odpověď na (b)? Nebo na (a)?
Prvních pár semestrů, kdy jsem pravděpodobnost učil, jsem se pochopitelně pečlivě držel knížek, abych se neblamoval. Ale postupně jsem si něčeho všiml. Někteří moji studenti se vyhnuli použití Bayesova teorému, spletitému vzorci, který jsem je učil. Místo toho řešili problémy ekvivalentním způsobem, který ale vypadal jednodušší.
Rok za rokem stále více studentů přicházelo na to, že existuje lepší cesta, jak pojednat podmíněné pravděpodobnosti. Jejich metoda se o intuici opírá, místo aby ji zamlžovala. Trik spočívá v tom, že se problém vyřeší zavedením přirozených četností – jednoduchým započítáváním možných událostí – spíše než jazykem abstraktnějších pojmů procent a pravděpodobností. Jakmile uděláte tento krok, mlha se zvedne.
To je hlavní poučení, které předkládá fascinující kniha Calculated Risks od Gerda Gigerenzera, kognitivního psychologa z berlínského Institutu Maxe Plancka pro rozvoj vzdělávání. V řadě studií na lékařská a právní témata, jejichž problematika se mění od poradenství nemocným AIDS až po interpretaci otisků DNA, autor zjišťuje, jaké chyby lidé dělají při hodnocení rizika a nejistoty. Ale místo toho, aby kritizoval nebo si stěžoval, jak snadno se lidé nechají zmýlit, vykládá, jak to dělat lépe – jak se vyhnout chybným krokům tím, že počítáme podmíněné pravděpodobnosti pomocí přirozených četností, tak jako to dělali moji studenti.
V jedné studii se Gigerenzer s kolegy ptali lékařů v Německu a Spojených státech, jak by odhadli pravděpodobnost, že žena, která má pozitivní vyšetření na mamografu, má skutečně rakovinu prsu, přestože nepatří do rizikové skupiny mezi čtyřicítkou a padesátkou, nemá žádné symptomy a v rodině nikdo rakovinu prsu neměl. Aby se měli lékaři čeho chytit, sdělili jim následující statistiku – plnou procent a pravděpodobností – o četnosti výskytu rakoviny mezi ženami v této skupině, o citlivosti mamografu a četnosti falešných pozitivních výsledků:

Pravděpodobnost, že žena z této skupiny má rakovinu prsu, je 0,8 procenta. Když žena má rakovinu prsu, je 90procentní pravděpodobnost, že mamograf bude pozitivní. I když rakovinu nemá, existuje pravděpodobnost 7 procent, že mamograf bude přesto pozitivní. Představme si, že nějaká žena má pozitivní nález na mamografu. Jaká je pravděpodobnost, že skutečně rakovinu prsu má?

Gigerenzer popisuje reakci prvního z lékařů, které testoval, vedoucího kliniky univerzitní nemocnice s více než třiceti roky zkušeností:

Při přemýšlení, co by té ženě řekl, byl viditelně nervózní. Chvíli si ta čísla pro sebe mumlal a nakonec odhadl pravděpodobnost, že by tato žena s pozitivním nálezem na mamografu měla skutečně rakovinu prsu, na 90 procent. Nervózně dodal: „To celé je hloupost. Nebudu si s tím lámat hlavu. Běžte se zeptat mé dcery, ta studuje medicínu.“ Věděl, že jeho odhad je špatný, ale nevěděl, jak uvažovat lépe. Přestože strávil 10 minut uvažováním, jaká je správná odpověď, nedovedl z těch pravděpodobností vyvodit správný závěr.

Gigerenzer pak položil týž dotaz dalším čtyřiadvaceti německým lékařům a jejich odpovědi se různily od 1 % po 90 %. Osm z nich soudilo, že hledaná pravděpodobnost je 10 % nebo i méně. Dalších osm soudilo, že to je 90 %; a zbývajících osm hádalo, že je to mezi 50 % a 80 %. Představme si, jak by byly pacientky rozčilené, kdyby slyšely takhle rozdílné odhady.
Pokud šlo o americké lékaře, devadesát pět ze sta odhadlo pravděpodobnost, že žena skutečně rakovinu prsu má, zhruba na 75 %.
Správná odpověď zní 9 %.
Jak je možné, že je tak malá? Gigerenzer ukázal, že analýza je dětsky snadná, když přeložíme původní informace z jazyka pravděpodobností a procent do řeči četnosti výskytu.

Osm z každých 1 000 žen oné nerizikové skupiny má rakovinu prsu. Z těchto 8 žen s rakovinou bude mít 7 pozitivní mamograf. Ze zbývajících 992 žen, které rakovinu nemají, jich přesto 70 bude mít mamograf pozitivní. Teď si představme vzorek žen, které při vyšetření měly pozitivní nález. Kolik z nich skutečně rakovinu prsu má?

Jelikož celkem 70 + 7 = 77 žen má pozitivní nález na mamografu a jenom 7 z nich skutečně rakovinu má, je pravděpodobnost, že žena s rakovinou má pozitivní test 7 ze 77, což je 1 z 11 čili asi 9 %.
Všimněme si dvou zjednodušení předchozího výpočtu. Za prvé místo s desetinnými čísly pracujeme – byť jen přibližně – s celými čísly. To se projevilo na několika místech, jako když jsme řekli: „Z těchto 8 žen s rakovinou prsu jich bude mít 7 pozitivní mamograf.“ Správně jsme měli říct 90 % z 8 žen, což je 7,2 žen – trochu přesnosti jsme obětovali ve prospěch jednoduchosti.
Druhé zjednodušení je v tom, že předpokládáme, že všechno dopadne přesně tak, jak to pravděpodobnosti naznačují. Třeba, že když je pravděpodobnost rakoviny prsu 0,8 %, přesně 8 z 1 000 žen našeho vzorku ji má. To ve skutečnosti nemusí být pravda. Skutečné události nemusí přesně odpovídat pravděpodobnosti. Když hodíme 1 000krát mincí, nepadne vždy přesně 500krát panna. Ale počítáme-li, že ano, dostáváme v úlohách jako tato správnou odpověď.
Přiznávám, že logika je při tomto přístupu maličko na vodě, což je taky důvod, proč na něj učebnice hledí skrz prsty ve srovnání s rigoróznějším, ale obtížněji použitelným Bayesovým teorémem – nicméně výhoda větší srozumitelnosti tento postup bohatě ospravedlní. Když Gigerenzer testoval dalších 24 lékařů a předložil jim data v podobě četností, téměř všichni odpověděli správně nebo skoro správně.
(dokončení úryvku)

Tento text je úryvkem z knihy:
Steven Strogatz: Radost z x – Průvodce matematikou od jedné do nekonečna
Argo a Dokořán 2014
O knize na stránkách vydavatele

 

obalka_knihy



Úvodní foto: Stephen Walter Ranson, Wkikipedia, licence public domain




Související články




Komentáře

18.01.2015, 06:44

.... tnx for info....

17.11.2014, 10:44

.... hello....

29.07.2014, 18:22

.... ñïàñèáî çà èíôó!!...

13.05.2014, 20:42

[...] včerejšího úryvku) V procesu s O. J. Simpsonem v letech 1994–95 se v tomto směru prohřešily jak obžaloba, tak i [...]

Napsat vlastní komentář

Pro přidání příspěvku do diskuze se prosím přihlašte v pravém horním rohu, nebo se prosím nejprve registrujte.