INPUTしたらOUTPUT!

忘れっぽいんでメモっとく

RStan v2.8.2でエラーが発生する場合の対処法

R

(2015.1.7追記) このポストとほぼ同時にRSrtan v2.9.0がCRANに上がってた。。。orz 久しぶりにRStanを実行しようとしたら色々ハマったのでメモしとく。 (@sinhrks氏と@hoxo_m親分に大感謝) 環境 MacBook Pro (15-inch, Late 2011) OS X EI Capitan(10.11.2…

携帯キャリアショップをイルミネーション風にプロットしてみた

R

クリスマスですね。 クリスマスといえばイルミネーション ということでleafletで携帯キャリアショップをイルミネーション風にプロットしてみた。

Japan.R 2015に参加してきた

R

以下メモ Japan.R 2015 : ATND Japan.R 2015 #JapanRの座席表 - セキココ Japan.R 2015 前半セッション - Togetterまとめ Japan.R 2015 後半セッション - Togetterまとめ Japan.R 2015 LT大会以降 - Togetterまとめ LTが多く長くなったので資料に記載されて…

『Python Machine Learning』Chapter.3をRでやってみた(後編)

R

estrellita.hatenablog.com の続き。 決定境界を可視化する関数ができたので複数のアルゴリズムの決定境界を比較してみる。 scikit-learnのモジュールとcaretのメソッドは一致しないので単純に比較はできないが以下の組み合わせで行なった。 アルゴリズム sc…

『Python Machine Learning』Chapter.3をRでやってみた(前編)

@sfchaos氏がデータサイエンティスト養成読本機械学習入門編の振り返りと補足 - sfchaos blogで紹介している以下の本を写経している。 Python Machine Learning作者: Sebastian Raschka出版社/メーカー: Packt Publishing発売日: 2015/09/23メディア: Kindle…

第52回R勉強会@東京で受付&発表してきた

R

以下メモ 第52回R勉強会@東京(#TokyoR) : ATND 第52回R勉強会@東京(#TokyoR)の座席表 - セキココ 第52回R勉強会@東京まとめ - Togetterまとめ

RでMicrosoft Face APIsを実行する(3)

R

間が大分開いたけど estrellita.hatenablog.com の続き。FindSimilarFaces APIで自分と似ている芸能人を探す。

"次へ"のURLを取得するにはrvest::follow_linkが便利

R

検索結果などpaginationされたページをクローリングする際、rvestパッケージのfollow_link()を使うと簡単に"次へ"のURLを取得できるのでメモしとく。 以下は10秒毎に"次の20件"のURLを取得するサンプル rvest::follow_linkサンプル 某グルメサイトで実行した…

RでMicrosoft Face APIsを実行する(2)

R

今から約10年前、 「"いつもここから"に似てますよね」 と言われたことがある。 参照 → いつもここから - Yahoo!検索(人物) ググって写真を見た第一声が「どっち?」だったことを今でも覚えてる。そんな十年来の疑問に対してFace APIsのVerificatoinで解決…

RでMicrosoft Face APIsを実行する(1)

R

画像から顔を検出して色々試してみたくなったのでAzureのFace APIsをRで実行してみる。 参考: gigazine.net

第51回R勉強会@東京に参加できなかった

R

運動会からの http://gamesymphony.jp/concert/2015/14th.html 鑑賞で第51回R勉強会には参加できなかったのでInputはできていないけど後から見るために発表資料だけメモしとく。 第51回R勉強会@東京(#TokyoR) : ATND 第51回R勉強会@東京(#TokyoR)の座…

第50回R勉強会@東京で発表してきた

R

以下メモ 第50回R勉強会@東京(#TokyoR) : ATND 第50回R勉強会@東京(#TokyoR)の座席表 - セキココ 第50回R勉強会@東京まとめ - Togetterまとめ (9/11 資料追加)

CentOS6.6(64bit)にJupyterHubをインストールする

CentOS 6.6(64bit)にPython 3.3をインストールする - INPUTしたらOUTPUT!estrellita.hatenablog.com の続き。 jupyter/jupyterhub · GitHubに従ってJupyterHubをインストールする。

CentOS 6.6(64bit)にPython 3.3をインストールする

手持ちのVPSはCentOS 6.6でyumではPython 2.6.6までしか入らない。 以下の動機によりPython 3.3をインストールしたので手順をメモしとく。 最近流行のDeep Learningフレームワークchainerを試したいがPython 2.7以上が必要 JupyterHubを試したいがPython 3.3…

第49回R勉強会@東京に参加してきた

R

以下メモ 第49回R勉強会@東京(#TokyoR) : ATND TokyoR#49の座席表 - セキココ 第49回R勉強会@東京まとめ - Togetterまとめ

Tokyo.Rの新規率・直帰率について集計・プロットしてみた

R

第48回 R勉強会@東京のLTにて 「R勉強会の新規率・リピート率ってどうなんだろうね?」 という話があったので確認してみた。 新規率などの定義が間違っていたらご指摘ください。 また実際の出席ベースではなくATNDの登録に基づいているので実態と乖離があり…

Rでロト6を当てたい(番外編)

R

前々回の冒頭の書籍には共連れ分析も記載されていたのでarulesパッケージを使って一緒によく出る組み合わせを探してみる。 arulesパッケージについては以下の記事が詳しくて参考になる。 R {arules} によるアソシエーション分析をちょっと詳しく <1> - Stats…

Rでロト6を当てたい(3)

R

前回までで以下のように数字選びの方針が決まったので実際にピックアップしていく。 奇数は2〜4個 23以上の数字は2〜4個 前回出た数字の中から1個 11回以上出ていない数字の中から1個 5回以内に出た数字の中から3個

Rでロト6を当てたい(2)

R

前回の続き。 ゲイル理論なるものがある。 ロト6の神様 最強のゲイル理論 (ギャンブル財テクブックス)作者: スマートラックジャパン出版社/メーカー: メタモル出版発売日: 2006/10/01メディア: 単行本購入: 7人 クリック: 90回この商品を含むブログ (2件) を…

Rでロト6を当てたい(1)

R

2年ほど前に某分析会社の人と以下のような会話をしたことがある。 自分:ロト6って均等に数字が出るんだったら予想できないっすか? 某分析者:いやー ロト6よりtotoの方が当てやすいっすよ 上記の会話の後、何もしてこなかったけど@gg_hatano氏がロト6の過去…

Spark on EMR 始めました & やめました

Amazon EMRのオプションにSparkが追加されたとのこと。 New – Apache Spark on Amazon EMR | AWS Official Blog 以下の書籍に参考に早速試してみたが色々ハマったのでメモしとく。 Machine Learning with Spark作者: Nick Pentreath出版社/メーカー: Packt P…

第48回R勉強会@東京に参加してきた

R

以下メモ 第48回R勉強会@東京(#TokyoR) : ATND 第48回R勉強会@東京(#TokyoR)の座席表 - セキココ 第48回R勉強会@東京まとめ - Togetterまとめ (2015.06.23)資料追加 前半セッション 10分で分かるR言語入門 転職おめでとうございます! これまでは本気…

lubridateパッケージによる日付型データの加工

R

以下の本をペラペラ見てたら日付データの加工にはlubridateパッケージが便利とのこと。 3年前に既に@dichika氏が紹介してたけど試してみる。 Data Manipulation With R作者: Jaynal Abedin,Kishor Kumar Das出版社/メーカー: Packt Publishing発売日: 2015/0…

Cox比例ハザードモデルによる生存分析を試してみた

R

Tokyo.R #46 Cox比例ハザードモデルとその周辺拝見してから生存時間分析試したいと思ってたらちょうど良い題材が見つかったのでやってみた。 Survival Analysis for Telecom Churn using Rstackoverflow.com

不均衡データの対応時における予測確率調整

不均衡データのクラス分類やPython - 不均衡データにおけるsampling - Qiitaにあるように不均衡データへの対応としては algorithm-level approaches data-level approaches の2つがある。 後者のように正例をオーバーサンプリングしたり負例をダウンサンプリ…

Rでコーディングスタイルを適用させる方法

R

Hadleyの新刊ペラペラ見てたらコーディングスタイルに関する記載があったのでメモしとく。 formatR, lintrパッケージなどがあるようでそれぞれ試してみる。 R Packages作者: Hadley Wickham出版社/メーカー: Oreilly & Associates Inc発売日: 2015/04/16メデ…

黒田博樹選手のフロントドア/バックドアをRで可視化したい

R

黒田選手のフロントドア/バックドアが凄いらしい。 野球にはさほど興味はないのだけれど、どれくらい凄いのか可視化したくなったので試してみた。 参考サイト メジャーリーグのデータ解析をしたい (pitch f/xって何) - 300億円欲しい pitchRx: Tools for Col…

第47回R勉強会@東京で発表してきた

R

もうすぐ春ですね → 春といえばキャッシュバック合戦 → キャッシュバックのTweetを見える化したい → Twitter Streaming API + fluentd + InfluxDB + Rで発表したかったけど間に合わなかった。。。 参加者の中でTwitter分析やテキストマイニングしてる方が多…

第1回Vertica勉強会に参加してきた

HP様のVerticaとDistributed Rに興味があって第1回Vertica勉強会に参加してきたのでメモしとく。 第1回 Vertica 勉強会 : ATND 第1回 Vertica 勉強会 - Togetterまとめ 参考:何故DeNAがverticaを選んだか?

Neo4j 説明会に参加してきた

グラフDBがレコメンドや不正検知にも使えると聞いてNeo4j説明会に参加してきたのでメモしとく。 Neo4j 説明会(NeoTechnology社 COO Lars Nordwall氏 来日講演) - connpass Neo4jユーザグループからのお知らせ(案浦氏) 今後の活動について 勉強会/ミートアッ…