INPUTしたらOUTPUT!

忘れっぽいんでメモっとく

第50回R勉強会@東京で発表してきた

以下メモ

(9/11 資料追加)


初心者セッション

10分で分かるR入門


続はじめてのR

  • Google BigQueryにもRから接続できるようになっている。
    • hadley/bigrquery


lubridateパッケージで君も日付処理スタ☆

www.slideshare.net

estrellita.hatenablog.comとほぼ同じ内容なのですが、あまりlubridateパッケージが知られていないので発表枠を頂きました。

「日本の祝日に対応している?」との質問で「Japanパッケージで対応している」と回答したのですがNipponパッケージの誤りです。申し訳ございません。

またRで文字列からPOSIXtに変換するのが遅くて困られている方は以下のリンクをご参照ください。

qiita.com

ちなみにlubridateの読み方は Extraction of time components in R by Lubridate Package - YouTube

を見るとリュブリデイトと読むようです。(作成者による解説ではないので間違っているかもしれません)


応用セッション

RStan と ShinyStan によるベイズ統計モデリング入門

  • Stan
    • 目的の分布に素早く収束しやすい
    • 十巣のパラメータしか推定できない
      • 離散パラメータを含むモデルも工夫すれば推定できないわけではない
  • ShinyStan
    • RStanの推定結果をいい感じに表示してくれる
    • 形式を合わせればStan以外のMCMCツールの結果も取り込める
    • diagnose : 収束診断
    • estimate : 推定結果
    • explore : すてきなグラフ
    • more : stanコード、単語の説明など
  • MCMCは全てのパラメータが収束していないと正しい事後分布は得られない

  • 自己相関するときはどういうとき?

    • やってみたら自己相関した
  • 自己相関した場合はパラメータを間引く?
    • 間引く
  • HMCは自己相関しにくい
  • 事前分布はどこまで気にした方が良い?
    • 分析の目的を考慮した上で恣意的に偏らないようにする
  • ShinyStanはどれくらいかっこいいグラフが書ける?
    • 事後分布をぐりぐりできる

みどりぼん以降、Stanに全然触れていないので良い復習になった。資料もすごく分かりやすいので参考にしたい。


21世紀の相関MICやHSICを超えたTICやSDDPをRで計算してみた

  • Pearsonの相関係数
    • 直線的な相関しかわからない
  • MICのアイデア
    • グリッドを細分してサンプルが何個のグリッド内に入っているかを見る
    • 少なければ関係があると言えるのでは?
  • MICの課題
    • ノイズに弱い
      • グリッドでやるやり方はオワコン
      • これからは再生核ヒルベルト空間
      • と思ってた時代がありました(2年前)
  • HSIC/dCorよりもTICを使った方がよい
  • SDDPも良いかも
  • minervaパッケージで計算可
    • CRAN版にはTICは入っていないのでgithubからインストールすること
  • SDDP HHGパッケージで計算可能
  • 相関のように使うには0〜1の間に入るよう正規化すること


Rの光に闇をあてる

  • shadowy
    • Rで簡単にAPIを作ることができる
  • Rookに親和性が高い作りになっている
  • Rook+rApacheよりもRook+リバースプロキシが良いかも

  • 用語

    • ソース
      • コンテキストを受け取ってコンテキストを返す関数
    • コンテキスト
      • リクエストやレスポンスの情報を持つ
    • 成功と失敗
      • 成功したらsomeを返す
      • 失敗したらnoneを返す
  • クエリ文字列の処理などにはまだ対応していない

shinyは複数同時接続に弱いらしいけどshadowyはどうなんだろ?


RStudioでギョームを加速する

  • Option + Shift + Kでショートカットキーを表示
  • ショートカットキーの割当を変更することができるようになった
  • スニペットを共有できるようになった。

  • RStudioからgithubへのアクセスには闇があるのが分かった。


LT

リア充の僕がリア充に勝つ話

  • 今年もJapan.Rは12/5
  • 山手線トレインネット、パケットキャプチャして解析できる
    • 7月以降、jsonが全部暗号化
  • 5号車は空いている


Rによる言語処理(N/100)本ノック

speakerdeck.com

  • 鍵垢なので直リンクさせて頂きます。
  • あとで熟読する


KDD CUP 2015で惨敗した話

  • 特徴量生成職人のノウハウが公開されている


Tokyo.R #50 LT@soultoru

  • IBM Watson Visual Recognition
    • RESTful APIを叩くだけ
    • 花畑 → Golf
    • 車 → graphics
    • メッシとロナウド → Team Field Sport
    • 洋式トイレ → Room
      • laundry RoomとかBath Roomとか

Watsonまだまだなのかなー


機械の体を手に入れるのよ!!! 鉄朗

  • r-wakalang、女性のふりすると回答率が高い


押してダメなら引いてみろ! ggplot2逆引きプロジェクト

  • 逆引きggplot2、すごく参考になる



  • 自分がTokyo.Rに参加させていただくようになって早2年、少しは成長できたのかな
  • 次回は未定