Glosa: Statistici v zemích EU neznají Benfordův zákon?

Člověk |

I falšování dat by se mělo umět. U sofistikovaných podvodů může člověk ocenit jistou eleganci (asi jako čtenář detektivky chová sympatie k pachateli dokonalého zločinu), ale když je to navíc zfušováno...




Benfordův zákon říká, že v určitých typech souborů dat čísla mnohem častěji začínají číslicí 1 než jinými (a pravděpodobnost se stále snižuje, nejméně je na začátku čísla zastoupena 9).

Základní vysvětlení: Benfordův zákon: Jednička triumfuje nad ostatními číslicemi

Konkrétně, 1 je na počátku čísel asi ve 30 % případů, na 9 zbude už jen cca 5 %. Platnost zákona má ovšem mnohá omezení a úplně jasno v těchto záležitostech asi stále nemáme. Mělo by se jednat o „přirozená“ data (co to ale přesně je? navíc zákon neplatí ani pro všechna přirozená data) a čísla zastoupená v souborech by měla pokrývat alespoň 3 řády. Benfordův zákon se tedy neuplatní pro čísla padlé v ruletě, ale ani pro výšku lidské populace. Ve druhém případě postrádáme potřebný rozsah dat (shodou okolností číslice 1 na začátku bude převládat, ovšem přes 3 metry už má opravdu málokdo).

Každopádně se ale Benfordův zákon dobře uplatňuje třeba pro mnohá data z účetnictví. Pokud někdo účetnictví falšuje, mnohdy vymyšlené položky volí náhodně a myslí si, že právě tak to bude vypadat nenápadně – což se dá odhalit. Na základě Benfordova zákona se dalo odhadnout např. i to, že falšovány byly zřejmě poslední prezidentské volby v Íránu (článek zde).

Jak uvádí podrobný článek v časopisu Ekonom (online na Ihned, odkazuje se dále na text v recenzovaném German Economic Review), podobné triky se statistickými ekonomickými daty se provádějí i v zemích EU. Podle Benfordova zákona lze odhalit, jaká čísla jsou nejpravděpodobněji výsledkem „kreativní manipulace“.

A jaký je výsledek srovnání? Nejvíce se od očekávaných rozloření číslic odlišují Rumunsko, Řecko (kde bylo falšování prokázáno), Lotyšsko a Belgie. V jiných státech jsou nejpodezřelejší data předcházející zavedení eura. ČR se v žebříčku umístila slušně, nejlépe obstálo Nizozemí.

Samozřejmě z toho nelze odhalit, kdo je viníkem, respektive na jakém stupni – zpracováním již zmanipulovaných dat můžete (byť nemusíte) dostat opět podezřelé statistiky. Pokud tedy zpracováváte data např. už ze zmanipulovaných daňových přiznání apod., jaký bude výsledek? Asi nelze dělat jednoznačné závěry, nicméně krčení ramen jako závěr zase působí poněkud alibisticky a nudně (nakonec ve vědeckém zkoumání se“těžko říct“ nepokládá za optimální závěr, i když to tak často dopadá).

Každopádně, je-li podezření pravdivé, je to smutné. A tím nemyslím samotný fakt falšování, ale to, že profesionální statistici nedokáží data dát do souladu ani s Benfordovým zákonem. Možná jsou příslušní úředníci tak kompetentní, že o jeho existenci ani nevědí? Nebo jen líní? Chtělo by se říci, že to ukazuje, že matematické znalosti jsou k něčemu dobré a i podvádět se musí umět, jenže nejspíš nemusí. Usvědčit na tomto základě asi nikoho stejně nelze…

Nebo je to paradoxně spíše důkaz o opaku (žádné „kreativní účetnictví“) či dokonce trik na druhou? Třeba ve stylu „Vidíte, že jsme nefalšovali, protože jinak bychom si ta čísla přece vymysleli v souladu s Benfordovým zákonem.“ Pak jsou zde ještě bizarnější možnosti – třeba chyba (jakého typu ale?) v nějakém plošně používaném softwaru… Plus se různé příčiny mohou samozřejmě kombinovat.

 

Poznámka: Možná by se leccos dalo rozhodnout takto. Jsou ve shodě s Benfordovým zákonem další data produkovaná příslušnými institucemi, u nichž „o nic nejde“ a není důvod s nimi manipulovat?











Komentáře

Napsat vlastní komentář

Pro přidání příspěvku do diskuze se prosím přihlašte v pravém horním rohu, nebo se prosím nejprve registrujte.