INPUTしたらOUTPUT!

忘れっぽいんでメモっとく

第7回 「データ解析のための統計モデリング入門」 読書会に参加してきた

以下メモ


第7章 「 一般化線形混合モデル(GLMM)」

  • 本名だと思っていた時期が私にもありました。。。
  • 過分散
    • 傲慢な観測者に対して自然界が仕掛けた罠
    • "データから得られる分散が平均から推定される分散に比べて大きすぎる"
      • 平均から推定される分散というのがよく分からなかったので参考図書に挙げられている以下の書籍を参照してみた。
        • 確率変数 X B(n, p)の二項分布にしたがう場合、分散 Var(X) = np(1-p)
        • ポアソン分布の場合は分散 = 平均
          • どれだけ大きかったら過分散と言えるのかよく分からない・・・overdispersion検定すると良いのかな?
        • 過小分散が起こることもあるらしい
  • GLMMはサンプルの数だけ積分するので計算負荷が高い
  • 個体差が見えるときは疑似反復 = GLMMが必要

一般化線形モデル (Rで学ぶデータサイエンス 10)

一般化線形モデル (Rで学ぶデータサイエンス 10)


LT 「 Rと確率分布」

  • 2月にUstで見たときは時間切れだった気がする。。。
    • 今回最後まで見れて良かった
  • 時間があったらShinyで色んな分布試せるようにしたい


LT データ解析でご飯を食べるという事

  • CRISP-DMは以下が作業リストレベルで記載されているので分かりやすいかも
  • 分析PJ発注側への文句は?
    • せっかくいいデータあるんだったら意味を理解して欲しい
  • 当たり前のことが出てきたら見せる?
    • 見せる
      • KKD(感と経験と度胸)で決めていたことが統計学的にも決められるようになったらそれはそれで価値だと思う

  • 次回は8/26(火)
  • もっと盛り上げないといけないのかなー