Update: 10/04/2025
Zasadniczo należy to traktować jako zabawę trochę, bo nie dysponuję pełnymi danymi z bazy UT, ale wszystko co mi się udało pozyskać (w tej chwili około 200K userów i 600K powiązań (posiadania we friendsach) pomiędzy nimi, nie licząc tych wychodzących do kolejnych userów, których jest kilkukrotnie więcej). Niemniej dane dotyczące „okolic PL” (blisko 10K userów) są stosunkowo pełne, pewnie nie 100%, ale na pewno powyżej 90%. Dane pochodzą z marca i kwietnia (to się tygodniami ciągnie)
Tak czy inaczej z tymi danymi co można zrobić? ano rysunek grafu, naturalnie do uzyskania na pierdyliard różnych sposobów z użyciem setki algorytmów, ale wybrałem taki, który mi się podoba i pokazuje klastry / grupy oraz co istotniejsze węzły. Przy czym on pokazuje tylko osoby z PL (a dokładniej: osoby pijące głównie PL piwa). Uwaga – to spory obrazek, klikalny:
Niestety nie wiem, jak powyższe udostępnić jako interaktywne – bo lokalnie u mnie to sobie mogę po tym łazić, wyświetlać informacje, filtrować itp itd 🙁
Ale żeby coś poza wrażeniami estetycznymi i ciekawostką było wynikiem, to dodatkowo tabelka przedstawiająca Top200 najbardziej wpływowych userów jeśli idzie o innych w PL wyliczanych na podstawie teorii grafów i związanych z nią równań. W tabelce poza zrozumiałymi kolumnami są 3 których sam do końca nie rozumiem, a mianowicie:
- Eigenvector centrality vel Prestige Score) – opis na wiki – ale w największym uproszczeniu to miara znaczenia węzła (czyli usera) wynikająca z powiązań z innymi węzłami o wysokim prestige score. Owa miara jest wykorzystywana np w wyliczaniu Google PageRank.
- Clustering coefficient (uwaga, wyliczana tylko dla PL, bo komplet by się na moim sprzęcie kilka dni liczył) – opis na wiki – a w uproszczeniu: miara tendencji tworzenia skupisk / klastrów / grup węzłów (userów). Czyli czy dany user ma w znajomych bardziej lokalną, powiązana ze sobą nawzajem grupe znajomych, czy znajomi raczej z dookoła Untappda.
- Triangles – pomocniczy współczynnik wykorzystywany przy wyliczaniu Clustering coefficient – czyli liczba powiązań trójkątnych na grafie (przypominam: tylko userów PL), w których dany user jest jednym z wierzchołków / węzłów.
No to prosz, tabelka: