Update: 11/12/2022

Zasadniczo tytuł nie kłamie, niemniej jest to tylko pretekst do porównania kilku metod prezentacji danych i popatrzenie sobie na nie przez pryzmat skali Clevelanda McGilla.

W połowie lat 80tych, gdy systematyczne podejście do graficznej prezentacji danych miało jeszcze swoje pionierskie czasy, zajmujący się zawodowo percepcją grafiki tudzież modną wizualizacją danych (dataviz) panowie William S. Cleveland i Robert McGill opublikowali wyniki swoich badań dotyczących postrzegania przez ankietowanych składowych prezentacji graficznej, takich jak kształt, kolor, długość, powierzchnia – konkretnie kazali ludziom szacować wartości na podstawie różnorakich wykresów. Po opracowaniu statystycznym wyników wyszła im skala, co ludzie najpoprawniej a co najmniej poprawnie odczytują. Można sobie oryginalny artykuł zerknąć >>tutaj<<.

Ich wyniki były później niejednokrotnie zarówno powtarzane, doprecyzowane jak i prowadzono z nimi polemiki jeśli idzie o szczegóły, niemniej zasadniczo niemal wszyscy się zgadzają, że skala jest prawdziwa. Już nieco doprecyzowana poniżej – podprowadzone z niepodpisanego źródła:

W sumie zgodnie z intuicją wychodzi, może poza aż tak nisko umieszczonymi zabawami z kolorami… W związku z czym te same dane na wykresach operujących konkretnym aspektem prezentacji, w kolejności od najgorzej interpretowalnych.

Przy czym żeby dla danych z tytułu miało to sens, to jeszcze jedno nazwisko zasłużone pada – czyli Edward Tufte, znany głównie z idei sparklines, który opisał również po raz pierwszy tzw “small multiple”, czyli przedstawienie czegośtam jako zbioru małych, analogicznych względem siebie wykresów. Metoda stosowana co prawda od końca XIX wieku, niemniej opisanie jej też się liczy. A metoda fajna, do danych z UT bardzo często przydatna i coraz bardziej mi się podobająca.

No to do wykresów piwnych wracając, to sobie zorganizowałem dane w prosty sposób: wybrałem 10 piwnych knajp w bezpośredniej okolicy linii Jerozolimskich. Przeciąłem je z listą tegorocznych czekinów osób z listy 5K+PL. Odrzuciłem dwie knajpy (PiwPaw na Foksal i Drugie Dno) które miały symboliczne liczby czekinków osób z tej listy. KiK Nowy Świat został, acz ma pod górkę jako otwarty w ciągu roku. Odrzuciłem wszystkie osoby mające poniżej 30 czekinów (no tak, zostali sami warszawiacy). I mam dwuwymiarową tabelę z danymi osoba per knajpa. Niemniej, jako że osoby piją więcej lub mniej na mieście, to tabelka zawiera procenty, gdzie 100% to komplet czekinów danej osoby we wszystkich 8 omawianych knajpach. Więc kolejne przedstawienia tematu poniżej

Aha, starałem się tam gdzie to możliwe zachować wspólna skalę kolorów per knajpa (acz ta paleta nie jest sensownie dobrana, tylko lenistwo nie pozwala zmieniać w 7 miejscach), zaś dla kolejnych osób jakoś tam dowiązać liczbę czekinów w tych 8 pubach (sztuk, nie procent) – zresztą po tej liczbie sortowane. Kolejność knajp zgodnie z ich popularnością. Tam gdzie się dało (czytaj: chyba wszędzie) jest średnia z sumy czekinów kompletu osób.

Wykresy w kolejności odwrotnej do skali Cleveland – McGilla

Kolor:

Powierzchnia:

Kąt:

(częściowo) Niewyrównana długość:

Powierzchnia + Kształt + Długość / Położenie:

Tak, mimo redundancji wcale nie jest specjalnie czytelnie....

Wyrównana długość:

No i kurde nie wychodzi mi zgodnie z teorią. Znaczy pewnie tak, ale zarazem jakieś aspekty atrakcyjności oraz generalnej czytelności zaczynają mieć przewagę. Jako, że tego typu prezentacji pewnie będę jeszcze potrzebował niejednokrotnie, to trza by wybrać - a wybór mój prywatny absolutnie nie jest "od dołu" jak skala Clevelanda McGilla mogłaby sugerować. Chociaż... ostatni wykresik niewątpliwie w czołowce. Ale podobnie mam z kołowym (w którym człowiek musi interpretować kąty) oraz z otwierającymi zestawienie teoretycznie najtrudniej interpretowalnych heatmapą (kolory) i hmmm... dot plotem (? powierzchnia) .

No dobra, to w bonusie jeszcze sobie zafundowałem ostatni wykresik, który dzieżko przypisać do którejś kategorii, a jest (przynajmniej dla mnie) dość atrakcyjny, czyli Radar Chart (po włączeniu animacji zwłaszcza śmisznie - wiadomo, wodotrysk jedynie w imię wow-effectu, ale ojtamojtam)