Update: 18/08/2023

Podejście pierwsze. Zasadniczo wykres ma prezentować podobieństwa organoleptyczne czy też sensoryczne pomiędzy różnymi whisky. Sama metodyka taka:

  • Ściągnięty z Distillera komplet danych, w szczególności flavor profile (a więc to, co oni przedstawiają na wykresie a jest w praktyce oceną jednej z osób z ichniego “Tasting Table” – grupy kilkudziesięciu ekspertów – tu >>lista<<, nie znam nikogo, ale to absolutnie nie znaczy, że nie jest ekspertem tylko świadczy o mojej ignorancji w temacie. Sam flavor profile to oceny w skali 0 do 100 dla 14 parametrów (głównie aromatów), prezentowane w postaci takiego wykresu:
  • Dane wyczyszczone, ograniczone do grupy whisky (Distiller ogarnia jak łatwo zgadnąć również inne destylaty), posiadających Flavor Profile. Ta grupa zawiera:
    • American Single Malt
    • Blended
    • Blended American Whiskey
    • Blended Grain
    • Blended Malt
    • Bourbon
    • Canadian
    • Corn
    • Other Whiskey
    • Peated Blend
    • Peated Blended Malt
    • Peated Single Malt
    • Rye
    • Single Grain
    • Single Malt
    • Single Pot Still
    • Tennessee Whiskey
    • Wheat Whiskey
  • Jako, że wyszło w cholerę etykiet (ponad 3 i pół tysiąca), to dodatkowe kryterium popularności czyli minimum 500 recenzji od użytkowników. Głównie amerykańskich użytkowników, więc ciężar został przesunięty w stronę amerykańskich odmian whisky. Pozostało 347 sztuk. Tyle już da radę przedstawić na jednym dendrogramie (mało czytelnie, acz dla mnie wystarczająco)
  • Sam dendrogram został stworzony w oparciu o metodę grupowania Warda – cytując za wikipedią: Metoda Warda to jedna z aglomeracyjnych metod grupowania, którą spośród pozostałych wyróżnia wykorzystanie podejścia analizy wariancji do oszacowania odległości między skupieniami. Zmierza ona do minimalizacji sumy kwadratów odchyleń dowolnych dwóch skupień, które mogą zostać uformowane na każdym etapie. Traktowana jest jako bardzo efektywna, chociaż zmierza do tworzenia skupień o małej wielkości.
  • Dendrogram jest stosunkowo prosty w interpretacji, można poruszać się po nim jak po drzewie, im bliżej siebie licząc po osi poziomej koniecznej do przemierzenia są dwie whisky, tym bardziej podobny profil mają. Również w ten sposób – czyli maksymalna konieczna do pokonania w poziomie odległość (bez “zawracania”) został ustalony punkt odcięcia grup whisky oznaczonych kolorami. Konkretnie: 250 (oś X wyskalowana na dole, ale kolorki pokazują, gdzie to 250 jest)
  • Sama prezentacja dość niewygodna, bo jeden wielki plik graficzny (po kliknięciu >tutaj< lub w obrazek – źródłowa wersja Hi-res – uwaga, 5400 x 8500 pikseli) – niestety za słaby jestem na jakieś interaktywne przedstawienie tego. Niemniej smacznego 🙂