Miara mierze nierówna, czyli dlaczego trzeba wątpić w każdy indeks i ranking

Miara mierze nierówna, czyli dlaczego trzeba wątpić w każdy indeks i ranking

Każdy prawdziwy i nieprawdziwy polski kibic jest zachwycony trafieniem naszej reprezentacji do czołowej piątki rankingu FIFA. Nie każdy jednak zna sposób naliczania punktów rankingowych. Oczywiście nie istnieje idealny sposób mierzenia siły reprezentacji. W szczególności trudno jest porównywać klasę drużyn z różnych kontynentów, które mają szansę spotkać się w meczu o stawkę co najwyżej raz na cztery lata. Niemniej wśród rożnych niedoskonałych metod, ta wybrana przez FIFA cechuje się szczególnie spektakularnymi nonsensami. Po pierwsze, na liczbę punktów nie ma wpływu czy mecz przegra się (lub wygra) jedną czy dziesięcioma bramkami (tylko kto wygrał oraz czy w karnych). Po drugie, w przypadku porażki nie ma znaczenia czy przegrało się mecz eliminacyjny z Liechtensteinem czy np. towarzyski z Brazylią (tak czy inaczej zdobywa się 0 punktów). Po trzecie, dokładnie w rok (i dwa i trzy) po dobrym występie w mistrzostwach świata czy Europy, reprezentacja nagle leci w rankingu na łeb na szyję (bo ten wynik zaczyna być mocniej dyskontowany). Po czwarte, może się zdarzyć, że po wygranej nawet 10:0 z aktualnymi mistrzami świata, reprezentacja odnotuje spadek w rankingu, bo liczy się średnia punktacja a np. mecze towarzyskie, nawet zwycięskie, są nisko punktowane. Te nierozsądne właściwości mają swoje praktyczne konsekwencje. Badania pokazują, że inne zasady punktowania (np. bardziej zbliżone do używanego w szachach systemu Elo) dałyby ranking, który pozwalałby trafniej przewidzieć wynik meczu. Inaczej mówiąc, obiektywnie lepiej odzwierciedlałby aktualną siłę reprezentacji. Wychodzi więc na to, że setki milionów kibiców na świecie z pasją śledzą zmiany w bardzo źle pomyślanym rankingu. Nawiasem mówiąc, ranking piłki nożnej kobiet jest konstruowany znacznie sensowniej.

Niestety, nierozsądne konstruowanie rankingów (czy stanowiących ich podstawę indeksów albo innych syntetycznych miar) nie jest wyłącznie domeną piłki nożnej. Rankingi szkół średnich uwzględniają liczbę laureatów olimpiad, których w ogólnej liczbie uczniów tych szkół jest mniej niż promil, a sukces w olimpiadzie jednego ucznia w niewielkim stopniu odzwierciedla talent dydaktyczny przeciętnego nauczyciela podstawowych przedmiotów maturalnych. Także rankingi uczniów ubiegających się o przyjęcie do tych szkół ustala się na podstawie tak istotnych dla oceny potencjału dziecka kryteriów, jak liczba międzynarodowych konkursów sportowych, w których uczeń wziął udział do 13 roku życia. Niektóre niemądre indeksy rzutują na dzieje krajów, a nie tylko trzynastolatków. Przez kilka dekad oceniano politykę handlową krajów na podstawie jednego sumarycznego indeksu. Podobnie jak zbiorowe utalentowanie w kopaniu piłki, także polityka handlowa nie jest łatwa do opisania liczbami: czy obostrzenia fitosanitarne dla jednego tylko produktu to duże czy niewielkie ograniczenie w wolności handlu? A jeśli dotyczą eksportu jabłek z Polski do Rosji? Albo orzeszków ziemnych – napływających skądkolwiek na teren Unii Europejskiej? W danych handlowych zakodowano ponad 13 mln różnych produktów i jest fizycznie niemożliwe, by opisać i aktualizować bilateralne i multilateralne ograniczenia handlowe dla każdego z nich. Stąd pomysł, by skonstruować indeks, z którego potem można korzystać dla porównań międzynarodowych oraz zaleceń dla krajów wchodzących do światowych łańcuchów handlowych. Zanim sformułuje się zalecenia, dobrze sprawdzić, czy mają sens, czyli przeprowadzić badania, czy bardziej otwarta polityka handlowa szkodzi czy pomaga w rozwoju. Takich badań przeprowadzono w latach 1980-tych i 1990-tych sześć, dwa z nich miały bardzo duży wpływ na formułowanie rekomendacji przez Bank Światowy oraz Międzynarodowy Fundusz Walutowy, także wobec Polski. Niemal 20 lat temu Dani Rodrik i Fracisco Rodriguez (obaj Harvard) rozebrali na części ten indeks i pokazali, że jedyną składową indeksu, która faktycznie dawała statystyczne podstawy by cokolwiek rekomendować była premia wymiany na czarnym rynku walutowym – daleko od tego do zaleceń dotyczących polityki handlowej (np. tempa obniżania ceł na żywność).

Mierzenie indeksami, wskaźnikami albo rankingami także słabo się sprawdza, gdy zjawisko jest bardzo zróżnicowane. By argumentować, który kraj jest (naj)bardziej niesprawiedliwy komentatorzy wielką acz niekoniecznie uzasadnioną miłością pałają do miar nierówności, w tym w szczególności udziałowi górnego 1% populacji w majątku. Im wyższy ten udział, tym – zdaniem wielu – wyższe nierówności. Powtarzając za jedną z organizacji pozarządowych, wielu załamuje ręce, że „zaledwie 8 ludzi ma majątek taki sam, jak najuboższa połowa świata”. Fakt 1: nie majątek, tylko aktywa finansowe. Pomiar ten nie uwzględnia tego wszystkiego, co mamy, a co nie jest aktywem finansowym (np. samochody, sprzęty trwałego użytku czy wspomnienia z bajecznych podróży pod powiekami). Fakt 2: w większości krajów średnio zamożnych, takich jak Polska, większość obywateli nie ma żadnych aktywów finansowych, lub ma je zaniedbywalne. Słusznie bądź niesłusznie, ludzie zwykle nie mają zwyczaju gromadzenia środków finansowych. Według wielu badań ankietowych, większość gospodarstw z kredytem hipotecznym nie posiada „poduszki” nawet na 6 miesięcy rat. Gdy dostajemy podwyżkę, w większym stopniu podnosimy stopę życia, a jak coś zostanie, to może także nieco zwiększamy lokaty, które w większości krajów są niewielką częścią zgromadzonych majątków, bo większość z nich stanowią inne aktywa finansowe (głównie udziały w firmach) i nieruchomości. Fakt 3: wielu krajach mniej niż średniozamożnych dominuje tzw. gospodarka towarowa (co czyni aktywa finansowe relatywnie mniej ważnymi), a w większości krajów świata pieniądz jest sposobem gromadzenia środków … na kolejny zakup. Gromadzenie pieniędzy dla samego gromadzenia pieniędzy jest rzadkie nawet w krajach wysokorozwiniętych, bo zazwyczaj oszczędzamy na coś: dom, studia dzieci, w najlepszym razie na podtrzymanie stopy życia na emeryturze. Wniosek: skupianie uwagi na udziale górnego 1% populacji w majątku ma równie wiele sensu, co ogrzewanie górskich chat ubogich mieszkańców najbiedniejszych rejonów świata ogniskiem z dolarów skonfiskowanych Billowi Gatesowi.

Jaki z tego morał? Gdy następnym razem ktoś przedstawi Wam ranking najlepszych banków, najlepszych szkół, najlepszych lekarzy albo najlepszych samochodów, sprawdźcie dokładnie, w jaki sposób skonstruowano ten ranking. Czy zawarte w nim składowe odpowiadają Waszym preferencjom? Może autor rankingu – podobnie do FIFA – zawarł w nim kryteria sprzeczne z Waszym zdrowym rozsądkiem? Sprawdźcie też, jak dokładnie jest skonstruowany. Czy aby autor nie przypisał ogromnej wagi ślicznemu skąd inąd logo, ale podobnie jak w przypadku polityki handlowej, nazwał go rankingiem jakości usług finansowych? Wreszcie, przyjrzyjcie się uważnie, czy analizowane oferty są od siebie rzeczywiście na tyle różne, żeby porównywanie ich za pomocą indeksu w ogóle miało sens. I czy nie są za bardzo różne, żeby zestawiać je w jednym wskaźniku. Ile roboty, żeby nie wyjść na idiotę…

GRAPE | Tłoczone z Danych - Dziennik Gazeta Prawna (4 Wrzesień 2017)

Tags: 
Tłoczone z danych