INPUTしたらOUTPUT!

忘れっぽいんでメモっとく

第2回 「データ解析のための統計モデリング入門」 読書会に参加してきた

以下メモ


オープニングトーク

  • 9/16(火)は著者参加!


第2章 「確率分布と統計モデルの最尤推定

  • データを確率分布に対応付けるという基本を学ぶ
  • データを統計もデルとして表現するためにデータの特徴を見る
    • 標本の大きさ、最小値、最大値などなど
  • カウントデータをプロットするだけであればplot(table(data), frame.plot=FALSE, ylab="Frequency")の方が綺麗
  • ポアソン分布の性質
    • 0〜∞
    • 平均=分散=λ
  • 尤度 = パラメータのあてはまりの良さを表す推定量
  • ポアソン分布の最尤推定量 = 平均
  • 確率分布の選び方
    • 離散 or 連続
    • とりうる値の範囲
    • 標本の分散と平均の関係
      • 分散と平均が大きく異なるようなデータに対してはポアソン分布をあてはめるのは不適切
  • 測定データの平均と分散が僅かに異なる場合はλは平均と分散の間にすべき?
    • 平均にフィッティングすべき
  • ポアソン分布を当てはめると決めたらλは最尤推定で求めなくても平均値でよい?
    • 良い
  • ポアソン分布を当てはめる実務的な例はある?
    • カタログを送付してレスポンスがあるまでの日数
    • 放射線量
    • 人生における交通事故にあう確率
    • サッカーでゴールが入る確率


普通に読み流しただけだと定着しにくいポアソン分布の特徴などを丁寧に数式で説明して頂いたので非常に理解しやすかった。 λを変えて色々見たくなったのでShinyで試してみる。
データ解析のための統計モデリング入門 第2章
(VPSなので重たい。。。ご了承ください)


確かに平均の3.56でlogLが最大になるっぽい


LT アジャイルデータサイエンス第2章「データ」


  • SQLは宣言的、NoSQLは手続き的
  • 第3章は濃さそうだな・・・


LT awkでEffective前処理

  • awkで処理する際、ヘッダーは入れている?
    • 入れてない
      • nr使う方がawkっぽい


飛び込みLT IT系エンジニアのための統計学

@piroyoung

  • 尤度ちゃんと理解しておかないと


飛び込みLT 最尤推定の話をPHPで書いてみた

@y__uti

  • PHPにも統計用の関数がある
  • PMF … Probability Math Function

  • 今回も非常に参考になった!
  • 次回は6/10(火)