Verím len tým RSS štatistikám, ktoré Feedburner umožní sfalšovať

Ako ukázalo veľmi pôvabne a vtipne urobené video na thenextweb.org, štatistiky služby Feedburner sa dajú sfalšovať elegantným a jednoduchým spôsobom.

Principiálne ide o to, že si naimportujete OPML súbor do  webovej čítačky Netvibes. Obsahom tohoto OPML súboru je K-krát nakopírovaný riadok s vašim feedburnovým RSS kanálom, kde K je želaný počet odberateľov. Ak som to pochopil správne, Feedburner je tak blbý, že identifikuje 12467 požiadaviek z jedného Netvibes účtu ako 12467 rôznych užívateľov.

V tej súvislosti sa mi pripomenul článok Zlý, zlý referer, v ktorom synopsi rozoberá refererové dáta z rôznych pohľadov. Neviem, do akej miery je práve identifikácia odberateľa vecou refererov, ale odhadujem, že nejaký veľmi významnú úlohu v tom práve referer hrá. Ak je to tak, je sofistikovanejšie faľšovanie štatistík len otázka hrajkania sa s ním.

Ozaj a prečo tak zložito. Čo neurobí puška dokončí tužka, hovorilo sa pradávno na strelnici. Dnes by sa to dalo parafrázovať: Čo neurobí merák, to dokončí Photoshop.

Ešte pár súvisiacich myšlienok:

Prečo som to aj ja neurobil? Pretože moje vlastné etické pravidlá mi rovnako nedovoľujú načiahnuť sa k susedovmu stromu pre čerešne aj keď plot meria len 1,2 metra a sú na dosah z ulice. Rovnako zmažem súbor s cudzími heslami a rovnako nepátram v rodných číslach pacientov.

Ako sa dopátrať orientačných čísiel o počte odberateľov akéhokoľvek webu? Urobte si konto v niekoľkých RSS čítačkách, ktoré informujú o počte odberateľov. Napríklad Google Reader poskytuje takúto informáciu. Po uplatnení bulharskej konštanty v podobe  čísla zohľadňujúceho podiel Google Readera v cieľovej skupine daného webu, môžete dospieť k nejakému absolútnemu číslu. No ako je v prípade internetových štatistík obvyklé, oveľa rozumnejšie je sledovať trendy.

Toto je ďalší argument, prečo nepoužívam cudzie služby tam, kde si vystačím so svojimi. V prípade RSS je naozaj dôležité mať URL RSS kanála pod kontrolou a byť dostatočne flexibilný v prípade potreby presmerovania.

Jediným argumentom pre používanie cudzej služby na poskytovanie obsahu RSS kanála by bolo, keby takáto služba umožňovala cez webové rozhranie nadefinovať, aký obsah sa bude posielať jednotlivým robotom/IP adresám, ktoré si RSS kanál sťahujú. Znalí vedia, že mi v žalúdku ležia rôzne MFA 2.0 stránky, ktoré kradnú obsah prostredníctvom RSS kanálov. V prípade záujmu individuálne poskytnem zadanie. Ale wordpressovský plugin by som privítal asi radšej.

Prvé upozornenie na hack som videl dnes ráno na johnchow.com. a postupne o tom píše už kde kto. V súvislosti s podobnými článkami som si všimol zaujímavú komentárovo-spamerskú fintu. Vrhnite do komentára text: The hack seems to have been FIXED. Keďže na overenie je treba prečkať dlhú noc čakania, chvíľu vám návštevnosť vydrží.

A tak mi napadlo, nie je to celé len a len výmysel thenextweb.org? Aj v tom prípade je to poučná prípadová štúdia. Síce o inej podstate, ale pozornosť si zaslúži.

A ešte jedna okrajová poznámka: Všimli ste ti, že na štatistické čísla návštevnosti nikto neuplatňuje štatistickú matematiku (také to priemer, smerodajná odchýlka a správny spôsob počítania s nimi)?  Trendy vývoja v čase, na to si človek užije, ale vyčíslenej chybe merania sa človek nedočká.

11 komentárov pri “Verím len tým RSS štatistikám, ktoré Feedburner umožní sfalšovať

  1. Krasna to finta. Bolo by zaujimave vediet kolko ludi si takto doteraz umelo tie cisla aj zvysovalo. Vidis, to by bolo WOW pocas mojho 30C :p

  2. uhm, nic nove. feedburner trpi na ovela zavaznejsie zranitelnosti, lenze pani z ggl ich este nestihli odstranit a tak mi meska aj clanok. snad v par kratkych dnoch sa dockate, no ved uvidime. inak umelo zdvihat statistiku je celkom hlupost, pretoze to cislo je informativne hlavne pre autora a nie pre okoloiducich. sice je to pekne na ohurovaci efekt, ale inak…

  3. Spätné upozornenie: 30C, stálo to za to? (štatistiky) - depi.sk - ešte lepší blog

Komentáre sú uzavreté.