Rozkład gęstości ocen 74 najpopularniejszych stylów wśród 5K+PL

Ostatni update: 06/06/2023

Te rozkłady gęstości to nieco podbajerowana metoda wygładzenia histogramu – jeśli ktoś chce, to sporo znajdzie o tym na necie, nalezy wbić w googla “Kernel Density Estimation” – ta metoda tutaj została zastosowana. Specyfika UT (a konkretnie stosowane dwie skale ocen) wymusiły dodatkowo użycie wysokiego współczynnika wygładzania (dla bawiących się: w skrypciku pythonowym używającym scipy.stats było to: kde = gaussian_kde(style_ratings, bw_method=0.33))

Aha, 74 style, bo akurat tyle wyszło dla ustawienia “minimum 2000 ocen zrobionych przez osoby z 5K+PL” – a są to dane z kompletu mniej więcej 3/4 miliona ocen

Warto pamiętać, że to, że dla danej oceny wykres osiąga jakieś górne stany oznacza, że jest tam wysokie zagęszczenie ocen w danym stylu, a nie, że dużo ocen względem innych stylów, więc style majace 2 i 20 tysięcy ocen mogą mieć identyczne wykresy.

Na pierwszy rzut oka straszliwe spagetti, ale sensu nabiera po wybraniu dwóch czy nieco więcej interesujących nas stylów (niestety próba zrobienia z tego wielu małych wykresików vel small multiples co prawda wyglądała bardzo schludnie, ale porównywanie było niemal niemożliwe poza jaskrawymi różnicami. Uwaga: flourish niestety przy tej liczbie danych na wykresie jest nieszaleńczo responsywny.