第48回R勉強会@東京に参加してきた
以下メモ
(2015.06.23)資料追加
前半セッション
10分で分かるR言語入門
- 転職おめでとうございます!
- これまでは本気でRやっていなかったのか。。。
続はじめてのR
第48回 Tokyo.Rの発表資料を公開しました。
「はじめてのR」
http://t.co/ttMBRJGskU
#TokyoR
— Minoda Takashi (@aad34210) 2015, 6月 22
- Rのロゴがフラットデザインになった
- 「はじめてのR」のはじめては5年前
- 最近の傾向に沿って内容を改訂
後半セッション
Rを極めて個人的な意思決定に活かす
- jaguchiパッケージ
- APIを統一インタフェースで呼び出しできる
- 盆栽 ・・・ 凡才 → bonsAI
Rの最新情報は「ぞうさん通信」を読めば大体掴める
Face++
- アジア人は若く判定される傾向がある
R のモデルの扱い方
先ほどの発表資料です。 #TokyoR http://t.co/kEhG5uhF9s
— kos59125 (@kos59125) 2015, 6月 20
- DYM(Did you mean:もしかして?)パッケージがCRANに登録された
- formula(paste(v, collapse="+"))よりreformulate(v)の方が簡単
↑試してみた
> v <- c("Sepal.Length", "Sepal.Width", "Petal.Length", "Petal.Width") > formula(paste0("~", paste(v, collapse="+"))) ~Sepal.Length + Sepal.Width + Petal.Length + Petal.Width > reformulate(v) ~Sepal.Length + Sepal.Width + Petal.Length + Petal.Width
reformulate()便利!
- formulaはパッケージに異なるが今日の説明はRの仕様に沿ったもの?
- Rのstatsパッケージに沿ったもの
プログラミング言語Roop
アップするの忘れてた。プログラミング言語Roop http://t.co/Uhgr5xSgWM #TokyoR
— 茶蔦 (@chatsuta) 2015, 6月 22
- 150117tokyorの続き
- Roopのターゲット層
- Rは遅いがRcppはハードルが高い人向け
- MCMCとか反復処理したい人
- JuliaとかSparkとかと比較してどうなんだろ?
- Rcpp syntax sugar = 構文糖(糖衣構文)
RユーザのためのSpark入門
先ほどの発表資料です./ RユーザのためのSpark入門 http://t.co/TsBcmzLPha #TokyoR
— sfchaos (@sfchaos) 2015, 6月 20
- dplyrを読込むと名前の衝突が起きて面倒なことになる
- summarizeに注意
- dplyrではsummarise
- MLLib
- クロスバリデーションやハイパーパラメータのグリッドサーチもある
- 現状はあえてSparkRを使う理由はないとのこと
- New – Apache Spark on Amazon EMR | AWS Official Blog見てSpark始めてみたけど色々ハマってる。。。
- Output出来そうになったら共有する【ToDo】
LT
Github PagesでRPubsにサヨナラ!
さっきのLTのスライドです。 Github pagesでRPubsにサヨナラ! http://t.co/dZMzl7SoUo #TokyoR
— Hiroaki Yutani (@yutannihilation) 2015, 6月 20
- JekyllでGithub Pages更新、環境整えるの難しいのか。。。
R HTMLでドキュメントを作るのは間違っているのだろうか
今日のLTの資料です http://t.co/JdlBYM5458 #TokyoR
— kazutan (@kazutan) 2015, 6月 20
- RStudio 0.99でHTMLタグのコード補完が充実
Rによる特徴抽出
本日の発表資料です。GBDT feature生成の説明は最後のほうに載っています。|Rによる特徴抽出 第48回R勉強会@東京(#TokyoR) http://t.co/5s9JvwrYIa
— Think more, try less (@Keiku) 2015, 6月 20
- 特徴抽出が網羅されてて分かりやすい!
- FeatureHashingパッケージはオンライン学習でも使える
- Rでオンライン学習するイメージがないけどできたら便利そう
- Xgboost、時間切れ残念
俺のオジーがそんなにアホなわけがない(仮)
Rでリーダビリティを計算する
Rでリーダビリティを計算する - langstat blog http://t.co/1yAzzvJn8R 今日の #TokyoR のLT資料をアップロードしました。 #rstatsj
— Yuichiro Kobayashi (@langstat) 2015, 6月 20
- FKGL
- 文章の読みやすさを測るための一般的な指標
- koRpusパッケージ
- テキスト解析する際に有用なパッケージ
- 日本語テキストのリーダビリティは別ツールで計算できる
5分でわかるglmnet
- glmnet = glm + 愛の鞭
- 愛の鞭 : 正則化
- Lasso
- Ridge
- Elastic-net
- glmnetではmatrixにする必要がある
- glmnetは因子型不可
1億5千万円欲しい (ロト6で遊ぶ)
本日の発表資料です。ロト6のデータで遊びます。
http://t.co/Fo3SHI4mEy
#TokyoR
— はたむ (@gg_hatano) 2015, 6月 20
規約にまつわるエトセトラ
#TokyoR
本日のLTの関連資料です。
http://t.co/hrshVlmKYr
— ホクソバイアス (@yamano357) 2015, 6月 20
- .区切り負けたんだ。。。
- SASにコーディング規約がないことを最近知った。
- 誰か作ってくれないかなー
- 過去記事紹介頂きありがとうございましたm( )m
データの不備を統計的に見抜く(Gelman's Secret Weapon)
- coefplot()便利そう
- 係数の信頼区間が0をまたぐ場合とか見やすい
- 「みんなのR」買わなきゃ

- 作者: Jared P. Lander,Tokyo.R(協力),高柳慎一,牧山幸史,簑田高志
- 出版社/メーカー: マイナビ
- 発売日: 2015/06/30
- メディア: 単行本(ソフトカバー)
- この商品を含むブログ (1件) を見る
代謝解析練習用データUpした
代謝解析練習用データUpした #TokyoR 48 LT by @siero5335 http://t.co/M6WNLPDBQq @SlideShareさんから
— ホクソシエロ_悪魔の囁き (@siero5335) 2015, 6月 20
- 尿のデータを公開するとかどうしてしまったんや。。。
- 自分もSmartBandつけて半年くらい経つのでデータ公開してみようかな
- 次回は7/18(土) @nifty