INPUTしたらOUTPUT!

忘れっぽいんでメモっとく

第5回 「データ解析のための統計モデリング入門」 読書会に参加してきた

以下メモ


オープニングトーク


第5章 「 GLMの尤度比検定と検定の非対称性 」 前半



第5章 「 GLMの尤度比検定と検定の非対称性 」 後半


  • pixivの@k66mk2とは別の人(重要)
  • P値(第一種の過誤をおかす確率)の計算方法は2種類ある
  • P値が有意垂準αより小さければ帰無仮説を棄却できる
  • カイ二乗分布を使った近似計算法を使用しても良いサンプル数の目安は?
    • 一概には言えない
      • パラメータが増えるとサンプル数も増やす必要がある
      • ポアソン分布のような綺麗な分布でない場合もサンプル数を多くした方が良い
      • 怪しかったらPB法、カイ二乗分布を使った近似計算法両方すべき
  • PB法の繰り返し数が教科書では1000回になっているが1万回、10万回に増やしても意味はあるか?
    • ある
      • 論文では1000回はまず見ない。1万回くらいはよく見る
      • 回数を増やすと精度は増すが効率は悪くなる
        • 繰り返し数の平方根しか改善しないので精度と処理時間のバランスで決める



  • AICでモデル選択することはあっても一定モデルとの検定は行ったことがなかったので今回も非常に参考になった。
  • 検定の説明もすごく分かりやすかった。検定の考え方を人に伝えるとき苦労するので参考にさせてもらおう。
  • 次回はよく使うロジスティック回帰。ちゃんと理解して使えるようにならねば。