INPUTしたらOUTPUT!

忘れっぽいんでメモっとく

第45回R勉強会@東京で受付してきた

取り急ぎ資料をメモしとく

前半セッション



R言語入門

  • 可視化についてはそろそろ@teramonagi氏がhtmlwidgetsの発表してくれるのかなー


Rによる回帰分析

  • 正規QQプロット
    • 残差が直線上になっていれば残差が正規分布になっている
  • 影響力プロット
    • クックの距離の外にいると外れ値としてみなす


後半セッション

2015 Rコトハジメ

  • AnomalyDetectionパッケージ
    • ある程度周期性がないと検知できなそう
    • InfluxDBに時系列データ突っ込んで異常検知したい
  • LEAN ANALYTICSの翻訳が出る
    • 分析者が提案するKPIは巡り巡って現場に落ちてくる


前処理のための前処理

  • Please remember "Why are you using SJIS?" !!!
  • Tsuramiに以下も加えたい
    • 乱数のシードが設定されていない
    • 環境依存の変数がハードコーディング
  • R PresentationでなくR Markdown使う理由は?
    • LaTeXが使えるから


typedFunction ∼型情報で
 Rをスピードアップ


  • typedFunction
    • Rの関数とその型情報を与えると対応するRcppのソースを生成してくれる


カーネル多変量解析

  • 非線形データに対するアプローチ
    • データ同士の近さに着目した方法
    • データを何らかの関数で非線形変換する方法
  • カーネル法
  • 多項式カーネル
    • サンプル領域外は発散する
  • ガウスカーネル
    • サンプル領域外は0に近づく
  • どのカーネル関数が良いかみたいなベストプラクティスはある?
    • データ依存なのでとりあえず全てのカーネル関数を試す
  • なぜ今カーネル多変量解析?
    • そこにカーネル多変量解析があったから
      • 最近エアロバイクを再開した
      • エアロバイク中、暇なので身近にあった本を読んだ
  • カーネル関数をあえて使わないケースはある?
    • 変数間の相関を見たいときなど


LT

男の価値は作ったパッケージで決まる@dichika

  • Advanced R翻訳おめでとうございます!
  • 進捗が出る = 異常値w


LT:KHCoderご紹介@doradora

  • 黒い画面(コマンドライン
  • 白い画面(Excel)
  • デメリット
    • mac版はない
    • 有償サポートはある
  • KHCoderの出力ソース2195行 orz
  • KHCoder、簡単に形態素解析や共起ネットワークの作成が出来るので使いやすい
    • テキスト解析の前処理も気になる
      • 全角英数は半角に統一するとかアルファベットは小文字に統一するとか
      • 単語のゆらぎをどうやってまとめるかも知りたい


「R for Cloud Computing」の紹介


Jenkinsによるレポートスクリプト管理


  • パラメータ付きで再実行ができる
  • crontabで第2月曜日に実行する方法知りたい


分析で好みの娘をぶっこぬく

  • まさかのBKBw


Shinyで確率分布を学ぶアプリ作った


巨人の勝率を上げるbot作りました

  • 利用者の声w
  • 野球botとかBKB botをカジュアルに作れる実行力見倣いたい