読者です 読者をやめる 読者になる 読者になる

INPUTしたらOUTPUT!

忘れっぽいんでメモっとく

基礎からのベイズ統計学入門 輪読会 #4で発表してきた

R Stan 統計

#みどりぼん 読書会から約1年4ヶ月、まったく定着していないので復習を兼ねて以下の本の輪読会で発表してきました。

基礎からのベイズ統計学入門 輪読会 #4 - connpass

基礎からのベイズ統計学: ハミルトニアンモンテカルロ法による実践的入門

基礎からのベイズ統計学: ハミルトニアンモンテカルロ法による実践的入門



自分が担当した6章には以下の記述があります。

伝統的な統計学では、5%, 1%, 0.1%という有意水準を設定し、検定統計量から得られる限界水準(p値)との比較によって、仮説の採択・棄却を行います。その際に、限界水準が小さいほど、2群の平均値差には大きな差があるという間違った解釈がなされることがあります。(p.136)

タイムリーなことにアメリカ統計学会がp値に対して表明*1*2*3*4を出しており、上記の記載とも一致するのかなと感じています。

p値だけで判断するのではなく、信頼区間の推定やベイズ統計モデルの活用が今後増えていきそうなので今回の勉強会は良いきっかけだったと思います。


以下は質疑応答

  • transformed parametersブロックとgenerated quantitiesブロックの違いは何?
    • generated quantitiesブロックの内容をtransformed parametersブロックに記述しても結果は同じになる
    • 尤度とは分離されたパラメータはgenerated quantitiesブロックに記述することで計算速度を向上させることができる
  • mu_over, es_overなどのtraceplotは何を意味している?
    • step()で0 or 1しか取らないパラメータなのであまり意味はない
    • generated quantitiesブロックで生成したパラメータについてはtraceplotを見る必要はない
    • 事後分布は確認した方がよい(単峰性かどうかなど)

帰宅してからふと疑問になったんだけど6.2.1は独立な事象として取り扱っていいのかな?同じ人に対して安静時と運動後の比較をするのであれば対応のある分析の気がする・・・


  • 次回は著者の一人が発表してくださるので直接教えを請いたい人は是非ご参加を
  • slideshareにアップするときはメイリオ推奨