Update: 08/03/2023
Jako, że jest sporo (no dobra, słyszałem o kilku) zwolenników oceniania na UT “w stylu”, tak, że np koncernowy eurolagerek jak idealnie w stylu i bez wad to powinien dostać to 5/5 czy tam prawie 5/5, a sam jestem negatywnie nastawiony do takiego pomysłu (głównie z uwagi na jego utopijność, nie wyobrażam sobie na portalu konsumenckim przymuszania użytkowników do stosowania jakichś sędziowskich zabiegów i wymagania sędziowskiej wiedzy i tłumaczenie, że “to nic, że Ci nie smakuje, ważne, że takie właśnie miało być”), to postanowiłem sobie sprawdzić, jak by to wyglądało, gdyby jednak stał się cud i untappd nagle zaczął mieć oceny wystawiane przez wszystkich zgodnie z tymi sędziowskimi zasadami.
Samo sprawdzenie jest raczej czysto teoretycznym ćwiczeniem myślowym, do tego obarczonym jakimiś założeniami, znaczy w sumie jednym, podstawowym założeniem: ze piwowarzy w PL piwa we wszystkich stylach wypuszczają na mniej więcej jednym poziomie. Pewnie tak nie jest, ale jakieśtam przybliżenie rzeczywistości trzeba zastosować, bo zakładanie który styl w PL robi się lepsiejszy a który nie to paranoja.
Uwzględniając powyższe zrobiłem więc tak:
- Ściągnięcie danych z UT dla kompletu PL piw (dane mają kilkanaście dni, ale nie chciało mi się powtórnie puszczać skrypciku który chodziłby ponad dobę, nie o super-aktualność tu biega). Mamy więc dla każdego z piw średnią arytmetyczną, liczbę ocen, średnią bayesa (tą z top50) – to ostatnie teoretycznie mógłbym sam policzyć, ale musiałbym ściągnąc dane do kompletu piw (nie tylko PL) na UT 😉
- Czysto matematyczne czy tam statystyczne działanie: standaryzacja stylów. Czyli każda średnia arytmetyczna każdego piwa została przeliczona z uwzględnieniem średniej dla stylu i odchylenia standardowego tak, by – w dużym uproszczeniu – każdy styl miał podobny rozkład ocen.
- Kolejne czysto matematyczno – statystyczne działanie: jako, że po standaryzacji skala ocen wyszła poza 0-5, to trzeba było normalizować każdą z tych ocen tak, by była w spójnej, untappdowej skali
- Zarówno dla średnich arytmetycznych jak i tych standaryzowano-normalizowanych policzona średnia Bayesowska
I właściwie tyle. Na potrzeby tabelki jeszcze dodatkowe myki:
- dla wszystkich 4 wymienionych wartości policzone rankinki.
- dodatkowe dwa rankingi dla piw wg średnich niebayesowskich z uwzględnieniem minimalnej liczby ocen (100), tak, by odsiać to, co niepopularne. Bayesa w tym kontekście nie dotykałem, bo sam z siebie uwzględnia popularność piwa
- tabela to top500 piw w każdej z podstawowych czterech kategorii. Oczywiście część piw przy takim podejściu byłaby zduplikowana, więc duplikaty wywalone. Sumarycznie wyszło więc 1291 piw.
- Aha, w rankingach coponiektórych użyłem jako miejsca 18888 – z prostej przyczyny: pustka tutaj psułaby sortowanie tabelki (byłaby interpretowana jako miejsce “0”), zaś jakieś inne specyficzne wartości czy to tekstowe czy np 9999999 psułyby heatmapę.
Po różnorakich sortowaniach, przyglądaniach się, sprawdzaniach, weryfikowaniach itp poniższej tabelki wniosków mam sporo, ale z dowolnym wnioskiem jak z dupą – każdy ma własną. Acz jak najbardziej pozostaję przy pierwotnym spojrzeniu na sprawę ocen na portalu konsumenckim 🙂
Jeśli idzie o średnie “zastane” w stylach, to zgodnie z oczekiwaniami – najwyższe u miodów, wymrażanek (w tym cydrów czy icebocków), różnych imperialnych ciemnych piwek… i właśnie one najbardziej dostały w dupę po tych przeliczeniach. Największego kopa w górę zaś jakieś wynalazki a la malt liquory, hard zeltzery, root beery, kvasy, malt beery, radlery itp. – już nie wnikam lepiej, bo to potencjalne oddzielne statsy.
Koniec przydługiego pierdololo, tabelka. Zachęcam do sortowań / filtrowań :>