第50回R勉強会@東京で発表してきた
以下メモ
(9/11 資料追加)
初心者セッション
10分で分かるR入門
初心者セッション 1:10分でわかるR言語入門
http://t.co/9dhpf0rgqu #TokyoR
— akiaki5516 (@doradora09) 2015, 9月 5
続はじめてのR
遅ればせながら、第50回 #TokyoR で発表したスライドをアップロードしました。
続 はじめてのR
http://t.co/Ow2KcSrTne
— Minoda Takashi (@aad34210) 2015, 9月 10
- Google BigQueryにもRから接続できるようになっている。
- hadley/bigrquery
lubridateパッケージで君も日付処理スタ☆
www.slideshare.net
estrellita.hatenablog.comとほぼ同じ内容なのですが、あまりlubridateパッケージが知られていないので発表枠を頂きました。
「日本の祝日に対応している?」との質問で「Japanパッケージで対応している」と回答したのですがNipponパッケージの誤りです。申し訳ございません。
またRで文字列からPOSIXtに変換するのが遅くて困られている方は以下のリンクをご参照ください。
ちなみにlubridateの読み方は Extraction of time components in R by Lubridate Package - YouTube
を見るとリュブリデイトと読むようです。(作成者による解説ではないので間違っているかもしれません)
応用セッション
RStan と ShinyStan によるベイズ統計モデリング入門
たった今 #TokyoR で Stan について発表しました〜。
http://t.co/vCDEWRk6HU
— 津駄 (Masaki E. Tsuda) (@teuder) 2015, 9月 5
- Stan
- 目的の分布に素早く収束しやすい
- 十巣のパラメータしか推定できない
- 離散パラメータを含むモデルも工夫すれば推定できないわけではない
- ShinyStan
MCMCは全てのパラメータが収束していないと正しい事後分布は得られない
自己相関するときはどういうとき?
- やってみたら自己相関した
- 自己相関した場合はパラメータを間引く?
- 間引く
- HMCは自己相関しにくい
- 事前分布はどこまで気にした方が良い?
- 分析の目的を考慮した上で恣意的に偏らないようにする
- ShinyStanはどれくらいかっこいいグラフが書ける?
- 事後分布をぐりぐりできる
みどりぼん以降、Stanに全然触れていないので良い復習になった。資料もすごく分かりやすいので参考にしたい。
21世紀の相関MICやHSICを超えたTICやSDDPをRで計算してみた
- Pearsonの相関係数
- 直線的な相関しかわからない
- MICのアイデア
- グリッドを細分してサンプルが何個のグリッド内に入っているかを見る
- 少なければ関係があると言えるのでは?
- MICの課題
- HSIC/dCorよりもTICを使った方がよい
- SDDPも良いかも
- minervaパッケージで計算可
- CRAN版にはTICは入っていないのでgithubからインストールすること
- SDDP HHGパッケージで計算可能
- 相関のように使うには0〜1の間に入るよう正規化すること
Rの光に闇をあてる
先ほどの発表資料です。 http://t.co/8i5isrwV3t #TokyoR
— kos59125 (@kos59125) 2015, 9月 5
- shadowy
- Rで簡単にAPIを作ることができる
- Rookに親和性が高い作りになっている
Rook+rApacheよりもRook+リバースプロキシが良いかも
用語
- ソース
- コンテキストを受け取ってコンテキストを返す関数
- コンテキスト
- リクエストやレスポンスの情報を持つ
- 成功と失敗
- 成功したらsomeを返す
- 失敗したらnoneを返す
- ソース
- クエリ文字列の処理などにはまだ対応していない
shinyは複数同時接続に弱いらしいけどshadowyはどうなんだろ?
RStudioでギョームを加速する
- Option + Shift + Kでショートカットキーを表示
- ショートカットキーの割当を変更することができるようになった
スニペットを共有できるようになった。
- 他の人のスニペットをインストールすることができる
RStudioからgithubへのアクセスには闇があるのが分かった。
- git連携はRStudio経由ではなくコマンドラインで行なった方が良いらしい
LT
非リア充の僕がリア充に勝つ話
本日のLTのスライドです。
非リアの僕がリア充に勝つ話 (TokyoR #50 LT) http://t.co/0cfcJSOI0j @SlideShareさんから #TokyoR
— 12/5にJapan.Rしゅる缶これ (@wonder_zone) 2015, 9月 5
- 今年もJapan.Rは12/5
- 山手線トレインネット、パケットキャプチャして解析できる
- 7月以降、jsonが全部暗号化
- 5号車は空いている
Rによる言語処理(N/100)本ノック
- 鍵垢なので直リンクさせて頂きます。
- あとで熟読する
KDD CUP 2015で惨敗した話
- 特徴量生成職人のノウハウが公開されている
- KDD CUP 2015
- これは熟読しないと!!
- KDD CUP 2015
Tokyo.R #50 LT@soultoru
LT資料 UPしました。http://t.co/GauvJn7HHB #TokyoR
— ほくそうる (@soultoru) 2015, 9月 5
- IBM Watson Visual Recognition
Watsonまだまだなのかなー
機械の体を手に入れるのよ!!! 鉄朗
- r-wakalang、女性のふりすると回答率が高い
押してダメなら引いてみろ! ggplot2逆引きプロジェクト
押してダメなら引いてみろ! ggplot2逆引きプロジェクト #ggplot2 #tokyor http://t.co/4lhoAkQupp さっきの発表資料です。
— Hiroaki Yutani (@yutannihilation) 2015, 9月 5
- 逆引きggplot2、すごく参考になる
- 自分がTokyo.Rに参加させていただくようになって早2年、少しは成長できたのかな
- 次回は未定