INPUTしたらOUTPUT!

忘れっぽいんでメモっとく

Rでウイスキー分析(1/3) フレーバーの可視化

これをRでやりたい。

itpro.nikkeibp.co.jp


データのロード

データセットClassification of whiskiesからダウンロードできる。

w <- read.csv("https://www.mathstat.strath.ac.uk/outreach/nessie/datasets/whiskies.txt", header=TRUE, stringsAsFactor=FALSE)
rownames(w) <- w$Distillery


フレーバーの可視化

上記文中と同様に代表的な7銘柄についてフレーバーの傾向をレーダーチャートで可視化してみる。全体の平均を描画してみると以下のようになる。

library(dplyr)

overall <- w %>%
  select(-RowID, -Distillery, -Postcode, -Latitude, -Longitude) %>%
  summarise_each(funs(mean), everything()) %>%
  add_rownames("group") %>%
  mutate(group = "overall")

library(ggradar)
ggradar(overall, grid.min=0, grid.mid=2, grid.max=4)

f:id:tak95:20160412203805p:plain


次に以下の7銘柄について同様にプロットしてみる。

  1. OldFettercairn
  2. Caol Ila
  3. Talker
  4. Highland Park
  5. Macallan
  6. Auchentoshan
  7. Glenfiddich
w.list <- c("OldFettercairn","Caol Ila", "Talisker", "Highland Park", "Macallan", "Auchentoshan", "Glenfiddich")
w.sub <- w %>%
  filter(Distillery %in% w.list) %>%
  select(-RowID, -Postcode, -Latitude, -Longitude)
ggradar(w.sub, grid.min=0, grid.mid=2, grid.max=4)

f:id:tak95:20160414195314p:plain

ごちゃごちゃして分からん・・・

それぞれ個別にプロットしてみると以下のようになり傾向が分かりやすくなった。

f:id:tak95:20160414195327p:plain f:id:tak95:20160413083522p:plain f:id:tak95:20160413083531p:plain f:id:tak95:20160413083537p:plain f:id:tak95:20160413083545p:plain f:id:tak95:20160413083551p:plain f:id:tak95:20160413083558p:plain



  • ggradarでレーダーチャートも簡単にプロットできた
  • 次はネットワーク図を描いてみる