Tvrdé dáta verzus chrípková šuškanda

Google prišiel s nápadom zistiť, či neexistuje náhodou korelácia medzi počtom vyhľadávaní slova chrípka a jej reálnym výskytom. A na počudovanie zistil, že existuje.  Dá sa na tom stavať nejaký zmysluplný predpovedný model? Ja tvrdím že nie!

Ale poďme pekne poporiadku. Google hovorí:

For epidemiologists, this is an exciting development, because early detection of a disease outbreak can reduce the number of people affected. If a new strain of influenza virus emerges under certain conditions, a pandemic could emerge and cause millions of deaths (as happened, for example, in 1918). Our up-to-date influenza estimates may enable public health officials and health professionals to better respond to seasonal epidemics and — though we hope never to find out — pandemics.

We shared our preliminary results with the Epidemiology and Prevention Branch of the Influenza Division at CDC throughout the 2007-2008 flu season, and together we saw that our search-based flu estimates had a consistently strong correlation with real CDC surveillance data. Our system is still very experimental, so anything is possible, but we’re hoping to see similar correlations in the coming year. Zdroj: Official Google Blog: Tracking flu trends.

Tak a dáme si ešte jednu citáciu. Pamätáte toť nedávno ako nám zinfarktovali akcie spoločnosti Apple:

Server občanské žurnalistiky CNN iReport má průšvih. Objevila se na něm zpráva o tom, že Steve Jobs, šéf firmy Apple, skončil s infarktem v nemocnici. Zpráva se dále šířila přes Twitter a další weby a následkem toho spadly akcie Applu o 5.4 %. Zprávu zveřejnil i populární blog Silicon Alley Insider. Autor blogu poté zavolal do Applu, zjistil, že se jedná o fámu a zápisek přepsal. Akcie se rychle vrátily víceméně na původní pozici (v součtu stále spadly, ale to už by neměl být důsledek falešné zprávy). Zdroj: Úřad zkoumá nepravdivou zprávu o infarktu Steva Jobse

Sociológovia sú veľkí srandisti. Na ekonómov nemajú, ale istú mieru humoru im netreba upierať. Dokázali nájsť koreláciu medzi dĺžkou sukní a výskytom finančných kríz. Bez srandy, je to tak. Google isto vie zaplatiť kdejaký mozgový trast. Verím tomu, že javy vo veľkých súboroch môžu byť predmetom zaujímavého skúmania. Akurát viem, že zaplatiť sa dajú aj výsledky výskumu.  Vo farmakológii, a to je prosím brutálne exaktná veda, toho máme každú chvíľu plné noviny.

A viete ako sa šíri chrípka? Že vás niekto okašle. Úmyselné šírenie choroby je trestné. Ale dokážte to autorovi hry na výskum, ktorý potrebuje, aby dáta z výsledkov vyhľadávania korelovali s aktuálnym výskytom choroby v populácii. Pretože ak sa choroba vyskytuje, ľudia sa chcú liečiť, tí čo to ešte nemajú sa chcú chrániť a všetci dohromady začnú hľadať informácie. Viete aká hotovosť sa v Google točí? Všeličo môže byť investíciou. Už som videl aj volebnú prehru ako kalkulovanú finančnú investíciu s kladným hospodárskym výsledkom.

Vidím to ako novú formu predpovede počasia. Tú považujem za príjemné spestrenie večera, ale ráno sa vždy pozriem von oknom a beriem si dáždnik podľa toho čo je výsledkom organoleptického skúmania pri pohľade na oblohu. Výsledky pozorovania a predpovede na základe výsledkov sú totiž dve nesúmiestne a nesúčasné udalosti.