Japan.R 2015に参加してきた
以下メモ
- Japan.R 2015 : ATND
- Japan.R 2015 #JapanRの座席表 - セキココ
- Japan.R 2015 前半セッション - Togetterまとめ
- Japan.R 2015 後半セッション - Togetterまとめ
- Japan.R 2015 LT大会以降 - Togetterまとめ
LTが多く長くなったので資料に記載されていることは極力メモらない。
(2015.12.15 公開資料追加)
『Python Machine Learning』Chapter.3をRでやってみた(後編)
の続き。
決定境界を可視化する関数ができたので複数のアルゴリズムの決定境界を比較してみる。
scikit-learnのモジュールとcaretのメソッドは一致しないので単純に比較はできないが以下の組み合わせで行なった。
アルゴリズム | scikit-leanのパッケージ | scikit-learnのモジュール | caretのmethod |
---|---|---|---|
パーセプトロン | sklearn.linear_model | Perceptron | mlp |
ロジスティック回帰 | sklearn.linear_model | LogisticRegression | multinom |
サポートベクターマシン | sklearn.svm | SVC(kernel='linear') | svmLinear |
カーネルSVM | sklearn.svm | SVC(kernel='rbf') | svmRadial |
決定木 | sklearn.tree | DecisionTreeClassifier | rpart2 |
ランダムフォレスト | sklearn.ensemble | RandomForestClassifier | rf |
k近傍法 | sklearn.neighbors | KNeighborsClassifier | knn |
『Python Machine Learning』Chapter.3をRでやってみた(前編)
@sfchaos氏がデータサイエンティスト養成読本機械学習入門編の振り返りと補足 - sfchaos blogで紹介している以下の本を写経している。
- 作者: Sebastian Raschka
- 出版社/メーカー: Packt Publishing
- 発売日: 2015/09/23
- メディア: Kindle版
- この商品を含むブログを見る
単純パーセプトロンの解説・実装から始まり、scikit-learnによるクラス分類器の紹介、前処理、次元削減、モデル評価、アンサンブル学習と順を追って機械学習の手法が学べるので良書だと思う。Chapter.3のscikit-learnによるクラス分類器の紹介では以下のアルゴリズム毎にIrisのクラス分類の決定境界をmatplotlibで可視化しており直感的で分かりやすい。
- パーセプトロン
- ロジスティック回帰
- サポートベクターマシン
- 決定木
- ランダムフォレスト
- k近傍法
Rでもcaretとggplot2を使用して同じことができそうだったのでやってみた。
"次へ"のURLを取得するにはrvest::follow_linkが便利
検索結果などpaginationされたページをクローリングする際、rvestパッケージのfollow_link()を使うと簡単に"次へ"のURLを取得できるのでメモしとく。
以下は10秒毎に"次の20件"のURLを取得するサンプル
某グルメサイトで実行した結果↓
> library(rvest) > > page <- 1 > sesh <- html_session('http://**********/tokyo/') > Sys.sleep(10) > repeat{ + sesh <- tryCatch(follow_link(sesh, "次の20件"), error=function(e)(return(NULL))) + message(Sys.time(), ' ', sesh$url) + page <- page + 1 + + # "次の20件"がない or 10回進んだらループを抜ける + if(is.null(sesh) || page == 10) break + + Sys.sleep(10) + } Navigating to http://**********/tokyo/rstLst/2/ 2015-11-11 08:33:40 http://**********/tokyo/rstLst/2/ Navigating to http://**********/tokyo/rstLst/3/ 2015-11-11 08:33:51 http://**********/tokyo/rstLst/3/ Navigating to http://**********/tokyo/rstLst/4/ 2015-11-11 08:34:02 http://**********/tokyo/rstLst/4/ Navigating to http://**********/tokyo/rstLst/5/ 2015-11-11 08:34:13 http://**********/tokyo/rstLst/5/ Navigating to http://**********/tokyo/rstLst/6/ 2015-11-11 08:34:23 http://**********/tokyo/rstLst/6/ Navigating to http://**********/tokyo/rstLst/7/ 2015-11-11 08:34:34 http://**********/tokyo/rstLst/7/ Navigating to http://**********/tokyo/rstLst/8/ 2015-11-11 08:34:44 http://**********/tokyo/rstLst/8/ Navigating to http://**********/tokyo/rstLst/9/ 2015-11-11 08:34:55 http://**********/tokyo/rstLst/9/ Navigating to http://**********/tokyo/rstLst/10/ 2015-11-11 08:35:05 http://**********/tokyo/rstLst/10/ >
- 某グルメサイト、Webからだと60ページまでしか見れないのか・・・