Update: 22/07/2025

Heatmapa powodowała nieładowanie się całości na niektórych przeglądarkach, więc taka nieco wykastrowana wersja…

Całość na podstawie ponad półtora miliona ocen: heatmapa korelacji ocen userów + scatter plot na podstawie t-SNE + 2x graf sieci + dendrogram. Czyli w założeniu sprawdzanie zbieżności gustów vel czyim ocenom ufać bo są zazwyczaj zgodne z naszymi…

W skrócie:

  • Heatmapa – to zasadniczo surowe dane, ma własny opis. Uwaga: strasznie powoli się ładuje.
  • Scatter plot – czyli przeliczenie tych wszystkich zależności na dwa wymiary (żaden z tych wymiarów vel osi nie jest mianowany, jeno symboliczny), co pozwoliło narysować te punkty na zasadzie mniej więcej „im bliżej tym zbieżniej”. Kolorowanie miastami, wielkość to liczba czkn
  • Grafy sieci, oba pokazują korelacje powyżej wartości granicznej, przy czym pierwszy graniczna to 0.7 (a więc silne) a drugi to 0.6 (a więc od połowy zakresu umiarkowanie silnych) – korzystanie ma sens przy zaznaczaniu konkretnego usera (podświetla wtedy jego sąsiadów z wystarczająco silną korelacją)
  • Dendrogram – widać „pokrewieństwa” vel spatial distance – raczej jako ciekawostka.

I przyznam się uczciwie, że nie chce mi się aktualnie jakoś obrazować hipotezy, ale po mojemu to ją widać już tutaj bardzo wyraźnie: W CHOLERĘ to z kim pijamy ma wpływ w na odbiór piwa. Zbieżności ocen wśród wspólnie pijących (a przy okazji potencjalnie nieopacznie wymieniających spostrzeżenia o pitych piwach) są ryli spore. Wiedziałem, że takie zależności są, ale nie sądziłem, że tak wyraźne. Naturalnie mogę mylić korelację z przyczynowością i powyższy wniosek jest nie całkiem prawdziwy zaś obserwowane korelacje to wynik bardziej skomplikowanych zależności, ale ojtam ojtam, to już temat dla socjologów.