Update: 22/07/2025
Heatmapa powodowała nieładowanie się całości na niektórych przeglądarkach, więc taka nieco wykastrowana wersja…
Całość na podstawie ponad półtora miliona ocen: heatmapa korelacji ocen userów + scatter plot na podstawie t-SNE + 2x graf sieci + dendrogram. Czyli w założeniu sprawdzanie zbieżności gustów vel czyim ocenom ufać bo są zazwyczaj zgodne z naszymi…
W skrócie:
Heatmapa – to zasadniczo surowe dane, ma własny opis. Uwaga: strasznie powoli się ładuje.- Scatter plot – czyli przeliczenie tych wszystkich zależności na dwa wymiary (żaden z tych wymiarów vel osi nie jest mianowany, jeno symboliczny), co pozwoliło narysować te punkty na zasadzie mniej więcej „im bliżej tym zbieżniej”. Kolorowanie miastami, wielkość to liczba czkn
- Grafy sieci, oba pokazują korelacje powyżej wartości granicznej, przy czym pierwszy graniczna to 0.7 (a więc silne) a drugi to 0.6 (a więc od połowy zakresu umiarkowanie silnych) – korzystanie ma sens przy zaznaczaniu konkretnego usera (podświetla wtedy jego sąsiadów z wystarczająco silną korelacją)
- Dendrogram – widać „pokrewieństwa” vel spatial distance – raczej jako ciekawostka.
I przyznam się uczciwie, że nie chce mi się aktualnie jakoś obrazować hipotezy, ale po mojemu to ją widać już tutaj bardzo wyraźnie: W CHOLERĘ to z kim pijamy ma wpływ w na odbiór piwa. Zbieżności ocen wśród wspólnie pijących (a przy okazji potencjalnie nieopacznie wymieniających spostrzeżenia o pitych piwach) są ryli spore. Wiedziałem, że takie zależności są, ale nie sądziłem, że tak wyraźne. Naturalnie mogę mylić korelację z przyczynowością i powyższy wniosek jest nie całkiem prawdziwy zaś obserwowane korelacje to wynik bardziej skomplikowanych zależności, ale ojtam ojtam, to już temat dla socjologów.
