Update: 19/05/2024

Zestaw użytkowników UT 5K+ z przypisaniami do konkretnego kraju na 3 sposoby:

  • Na podstawie najczęściej pitych piw
  • Na podstawie największej liczby UT-Friendsów z danego kraju (przypisanie friendsów do krajów na podstawie pitych piw)
  • Na podstawie najczęściej oznaczanego Venue (z pominięciem festiwali i miejsc bez lokalizacji, a la UT@Home)

Jako, że takie przypisania nie zawsze są zgodne, a z niezgodności wynikają dość dla mnie interesujące rzeczy, to chciałem jakoś to zbiorczo przedstawić na wykresie. I kuźwa metody za wygodnej na to nie ma. Dodatkowo sprawę utrudnia fakt, że kraje są niespójne zależnie od metody przypisywania (np “United Kingdom” niekiedy jako całość, ale częściej rozbite) oraz są bardzo duże dysproporcje w liczbach przy jednoczesnej dużej liczbie krajów i ich kombinacji (a nie chcę pomijać krajów zakładając jakieś tam minimalne liczby userów)

Ostatecznie chyba jedyne co w miarę sensowne, to Sankey Diagram. Wgl dość ciekawy wykres, niekoniecznie popularny, a znany od dość dawna. Praprzodek z 1869 roku to rysunek (dzisiaj zwany flow map) obrazujący wyprawę Napoleona na Moskwę – naniesione na mapę linie, których grubość nawiązywała do liczebności armii (acz autor – Charles Joseph Minard – sporządzał podobną metodą wcześniej już diagramy przepływu dóbr na świecie, tyle że nie cieszyły się one większą rozpoznawalnością, dopiero poniższy diagram zyskał rozgłos). Zresztą Minard wzorował się być może na jeszcze wcześniejszych (z 1837 roku) mapach Henryego Harnessa przedstawiających analogiczną metodą grubości linii ruch kolejowy w Irlandii). Ale wracając do wspomnianej napoleońskiej “flow map”, to wyglądała tak:

Kilkadziesiąt lat później, w 1898 roku niejaki – uwaga, krótkie nazwisko – Matthew Henry Phineas Riall Sankey, zajmujący się zagadnieniami efektywności wykorzystania energii w silnikach parowych narysował coś takiego jak niżej:

Taki diagram miał już praktycznie wszystkie cechy dzisiaj stosowanych diagramów nazwanych od nazwiska twórcy – zasadniczo na tym co sam zastosowałem różnica jest jedynie taka, że węzły są na jednej osi plus skrajny (czyli użytkownicy przypisani do kraju na podstawie pitych piw) jest zdublowany, by widoczna była korelacja z oboma pozostałymi przypisaniami – takie podejście zapożyczone z innego acz pokrewnego typu wykresów, czyli z alluvial diagram.

Tak czy inaczej przedstawienie kompletu krajów daje kompletnie nieczytelną całość vel spaghetti, stąd możliwość wyboru interesującego nas kraju (przedstawiane są wtedy relacje dla tego kraju, niezależnie w którym z węzłów on występuje). Jako, że całość nie jest intuicyjna, to dodatkowo sposób czytania na mikroprzykładzie, wycinku całości austryjackiej:

Na tym fragmencie widać, że 10 osób (wciąż mowa wyłącznie o osobach z 5K+ Unique) czekinuje głównie na terenie Austrii, niemniej z tych 10 osób po jednej osobie ma najwięcej znajomych ze Szwecji, Holandii, Norwegii, zaś dwie osoby ze Stanów Zjednoczonych. Pozostałe 5 osób nie wiadomo, bo wykres obcięty na dole. Za to wiadomo, że spośród omawianych 10 osób aż trzy osoby najczęściej piją piwa z USA, jedna najczęściej niemieckie, pozostałe przycięte. Być może jasne, mimo niskiej intuicyjności. Jeśli ktoś ma pomysł jak tego typu dane przedstawić czytelniej, to będę mega wdzięczny za pomysł.

Zważywszy, że takiego pitolenia i tak nikt prawie nie czyta, to wreszcie po wstępnych bólach wykres. Kraj wręcz należy wybrać, a dodatkowo można pojeździć myszką czy tam poklikać w imię wyświetlania wartości czy zaznaczania czegośtam.