INPUTしたらOUTPUT!

忘れっぽいんでメモっとく

第57回R勉強会@東京で発表してきた

以下メモ


初心者セッション

10分で分かるR言語入門 ver2.22


はじめてのR


ゆるふわ文字型データの取り扱い入門


応用セッション

RとStanでクラウドセットアップ時間を分析してみたら

  • 各サービスのセットアップ時間を分析
    • 重回帰
      • jtime = 4.2 + 1.5kintone+31.2garoon+6.8office+8.5mailwise * 5.4*skylab
        • skylabは単機能なのに高機能なofficeと同等なセットアップ時間
      • モデルに問題がないか?
        • 残差εがサービスによらず共通
          • garoonの分散、officeの分散、kintoneの分散は異なるはず
          • garoonと一緒に申し込まれるskylabにgaroonの分散が紛れ込んでいないか?
        • 右に裾が長いことを考慮していない * 各サービスごとに対数正規分布にあてはめてモデルを作成
      • μ, σ, c, sを点推定
      • ベイズ化してμ, σ, c, sも確率変数に
    • モデルはできるだけ単純な方がいい


いろいろ試した変化点検知

  • 目的によって使い分けが必要

    • 外れ値検知
    • 変化点検知
    • 異常検知
  • 変化点検知のR package

  • Twitter AnomalyDetection

    • スパイクを除去しないと話にならない
      • 区間nを指定して2σ以上を平均に置換
  • Changepointが良さげ

  • 状態空間モデルでトレンド成分の差分をとってスムージングすると綺麗に検知できた。


mxnetで頑張る深層学習

8月からDeep Learningに携わるようになると同時にPythonハラスメントに怯えるようになりました。本資料がきっかけでRでDeep Learningする人が増えると幸いです。以下頂いた質問


LT

おじさんの体重をダッシュボードで監視する話


Exploratory紹介


Rの社内勉強会を立ち上げた話(タイトルうろ覚え)

  • モチベーション
    • 職場にRを普及したい
  • 立ち上げ
    • 隔週1時間
  • 資料の準備
    • RmdをKnitしてhtml → PDF


メールアプローチの現場とR

  • 時間切れで最後まで聴けず。。。


今さらrvest使ってみた

  • ATNDのデータを取得するのであればスクレイピングよりもAPIを叩く方が行儀良い気がする。。。

  • Cyboze様、素敵な会場提供ありがとうございました
  • 次回は未定