第5回 「データ解析のための統計モデリング入門」 読書会に参加してきた
以下メモ
オープニングトーク
- 後半の担当の募集始めました
- 次回(第6回)は2週空いて7/29(火)
- 第7回は8/5(火)予定
第5章 「 GLMの尤度比検定と検定の非対称性 」 前半
第5章glmの尤度比検定と検定の非対称性 前編 by @tanimocchi http://t.co/aJtudG2gXj @SlideShareさんから #みどりぼん
— もっちぃ (@tanimocchi) 2014, 7月 8
- 参考資料
- 尤度関数と確率密度関数は動く変数が異なる
- 動きが似ていることもあるけど尤度関数と確率密度関数を同じと考えてはダメ
- 尤度比は尤度の比をとっているので確率ではなくなっている
- 0.1108が1割くらい起こりそうという解釈は間違っている
- 第一種の過誤
- 帰無仮説が正しいのに棄却してしまうこと
- 尤度比検定での帰無仮説は"真のモデルは一定モデル"
- 帰無仮説が正しいのに棄却してしまうこと
第5章 「 GLMの尤度比検定と検定の非対称性 」 後半
本日の後半分資料、先立ってアップしてくださいました! #みどりぼん RT @k66mk2: @yamakatu お疲れ様です。こちらに資料をアップ致しました。https://t.co/14nPryehRT
よろしくお願い致します。
— やまかつ (@yamakatu) 2014, 7月 8
- pixivの@k66mk2とは別の人(重要)
- P値(第一種の過誤をおかす確率)の計算方法は2種類ある
- P値が有意垂準αより小さければ帰無仮説を棄却できる
- カイ二乗分布を使った近似計算法を使用しても良いサンプル数の目安は?
- PB法の繰り返し数が教科書では1000回になっているが1万回、10万回に増やしても意味はあるか?
- ある
- 論文では1000回はまず見ない。1万回くらいはよく見る
- 回数を増やすと精度は増すが効率は悪くなる
- 繰り返し数の平方根しか改善しないので精度と処理時間のバランスで決める
- ある
- AICでモデル選択することはあっても一定モデルとの検定は行ったことがなかったので今回も非常に参考になった。
- 検定の説明もすごく分かりやすかった。検定の考え方を人に伝えるとき苦労するので参考にさせてもらおう。
- 次回はよく使うロジスティック回帰。ちゃんと理解して使えるようにならねば。