Ostatni update: 11/01/2023

Zasadniczo ciekawe dane, pokazujące rozwój krafciku i covidowe cofnięcie tegoż rozwoju. Niemniej zarazem niestety dane możliwe do uzyskania powodują, że owo zestawienie nieco traci na wartości – z prostej przyczyny. Liczba premier – wszystko OK, ale liczba czekinów premier jest zastępcza, bo tak naprawdę powinna być tu po prostu liczba czekinów wszystkich piw. Niestety – nie ma jak tego wysmyknąć :/

Ale nawet na takich nieco “felernych” danych, obarczonych bagażem faktu, że premiera z roku 2011 może być czekinowana do dziś, i tak widać w sumie sporo. Warto również pamiętać, że widoczny spadek liczby czekinów premier z 2022 będzie jeszcze mitygowany i liczba czekinów wzrośnie (w sensie: w 2023 roku będzie sporo czekinów piw z 2022 – dane z 10 stycznia).

Ale same dane są przesłanką do sprawdzenia w praktyce niemalże obowiązującej i promowanej w wielu miejscach, księgach, na blogach tematycznych itp zasady: nie używać wykresów (słupkowych, liniowych itp) z więcej niż jedną osią, czy jedną skalą. A dlaczemu wgl jesteśmy wodzeni na pokuszenie użycia tego typu wykresów? z kilku powodów:

  • Dwie serie (bądź grupy serii) są bardzo rozbieżne jeśli idzie o wartości. Tutaj właśnie mamy ten przypadek: piw są tysiące co roku, czekinów są setki tysięcy rocznie. I przedstawienie tego na jednej, spójnej osi spowoduje, że ta mniej znacząca seria (czyli w tym przypadku liczba premier) będzie praktycznie niezauważalna, słupki, punkty kreski, cośtam – wszystkie będą tuż tuż przy osi, optycznie w okolicach zera.
  • Serie danych przedstawiają inne wartości, inne miana, inne jednostki. No nie da się ich przedstawić na jednej osi, ale zasadniczo da się w odradzany wszem i wobec sposób, co jednak bywa stosowane – np klimatogramy, przedstawiające średnie miesięczne temperatury i wysokości opadów na jednym wykresie (typowo: na tej samej osi miesięcy opady wykresem słupkowym, temperatury liniowym) – aż pozwolę sobie na podprowadzony przykład:

A czemu niby takich wykresów należy nie stosować? a proszę, dwa podstawowe powody za dość wyczerpującym artykułem z bloga datawrapper:

  • Trudne w interpretacji… cóż, ciężko mi się do tego punktu jednoznacznie odnieść, może i tak jest i ja dobrze czytam wykresy, ale jeśli chwilę uwagi poświęcić (a każdemu wykresowi trzeba chwilę uwagi poświecić) oraz zadbać, by wykres podkreślał, która oś / skala jest dla których prezentowanych danych (typowo: kolorem lub wartościami naniesionymi na wykres), to problem jest mocno minimalizowany.
  • Możliwość nieczytelności czy wręcz manipulacji danymi w zależności od zastosowanych skal dla obu osi. A warto wszak pamiętać, że osie te są określane przez robiącego wykres arbitralnie, z możliwościami nie robienia ich od zera, ściskania bądź rozciągania każdej z nich w imię większej widoczności jakiejś tezy itp – i zgoda. Jednak też można to minimalizować (w tym premierowo / czekinowym przypadku – wystarczy obie skale mieć od zera i do “maksimum plus troche do okrągłej wartości”). Niemniej nie da się ukryć, że poniższy przykład (podprowadzony z linkowanego bloga) ładnie unaocznia problem. Tak, każdy z 6 poniższych to dokładnie te same dane:

A jakie są proponowane lepsiejsze podejścia i przedstawienia danych? 4 metody, w skrócie:

  1. Dwa wykresy obok siebie, na każdym jedna seria danych.
  2. Zindeksowanie danych czy też ich znormalizowanie, tak, by uspójnić czytelnym wskaźnikiem obie serie
  3. pominięcie jednej z serii na rysunku, a uwzględnienie jej w opisach, przypisach, uwagach itp
  4. Zbudowanie wykresu tak, by serie były na dwóch oddzielnych osiach, przy czym jednej pionowej drugiej poziomej.

Punkty 1, 2 oraz 4 przedstawiam na przykładzie dla danych premierowo/czekinowych, jednak najpierw ten niepolecany sposób:

1. Dwa wykresy obok siebie, na każdym jedna seria danych:

2. Zindeksowanie danych czy też ich znormalizowanie, tak, by uspójnić czytelnym wskaźnikiem obie serie

4. Zbudowanie wykresu tak, by serie były na dwóch oddzielnych osiach, przy czym jednej pionowej drugiej poziomej.

No i w sumie nie wiem, czy ten niepolecany nie jest dla mnie najczytelniejszy…