読者です 読者をやめる 読者になる 読者になる

INPUTしたらOUTPUT!

忘れっぽいんでメモっとく

第54回R勉強会@東京に参加してきた

R

以下メモ



初心者セッション

10分で分かるR言語入門 ver.2.19

  • パッケージを手動で入れるには?
    • 社内サーバーなどインターネットにつながっていない場合、ソースを持ち込んでパッケージをインストールする必要がある
      • R 3.2.3でcaret入れようとするとnloptrが入らなくて困ってる。。。
  • 初心者におすすめのサイトは?
    • r-wakalang
  • Rで処理の進捗が分からない


続 はじめてのR

  • loopするモチベーションは?
    • 関数のパラメータだけをループで変えて実行する
  • SQLにRからクエリパラメータを与えのに効率的に行うには?
    • sprintf
  • 目的変数が正規分布でない場合、どうすれば良い?
    • みどりぼん読め
    • 正規分布に近づけるのであればbox-cox変換


2016年上半期版データマエショリスト入門

  • readr::read_csvはstringAsFactorsの指定が不要
  • data.table::freadでdeta.frameとして処理したい場合はdata.table=Falseを指定する
  • data.table::freadは文字コードでトラブることが多い
  • readxl::read_excel

    • 爆速、かつ文字コードや日付の処理も完璧にやってくれる
  • なんで早くなる?

    • Rの特徴としてわかりやすくかけるが遅い
    • dplyr等はC++で処理しているので速い
  • 100テーブルくらいのJOINは可能?
    • メモリの制限で落ちるかも


応用セッション

Datascience for me(仮)

  • ggrepelパッケージ
    • テキストラベルを配置する際に重なりをいい感じで配置してくれる
  • githubinstallパッケージ
    • パッケージ名だけでgithubからパッケージをインストールできる
  • 質の高い睡眠
    • 入眠後180分以内の深い睡眠において成長ホルモンが分泌される
    • 成長ホルモンは成人の場合、体の修復に関わっている
    • 今回は入眠180分居ないの深い睡眠の割合を睡眠の質の指標と定義する
  • 寝る直前に筋トレすると交感神経が活発になり、浅い睡眠になる
  • 睡眠の質の因子
    • 寝る前のブルーライト
    • 飲酒
    • 運動
    • 部屋の明るさ
    • 食事のタイミング
  • 運動パターンについて1時間単位の歩数データをLDAで5群にクラスタリング
  • LDAにはtopicmodelsパッケージのLDA関数を用いる
  • 運動パターンと他の因子を併せてrpartパッケージで決定木
  • openairパッケージ
    • カレンダープロット
  • さだまさし x アドベントカレンダー

  • BLは制限したほうが良い

  • 今後の展望は?
    • 新しいツールが出たら試す
    • ボットAPI


Rで(当たらない)競馬予想をやってみた

  • トータライザー
    • 主観の入らないデータだけの競馬新聞
  • 決定木
    • 近走で賞金を稼いでいる馬が強い
    • 退廃続きからの大逆転というのは滅多にない
  • 競馬実況の安定感はんぱない


LT

懇親会LTの資料準備のため資料リンクのみ

Splatoon界での壮絶な戦い & Japan.Rの宣伝


🍣


SeekR Search Trend Report


よいモデルを選びたい


Rによる単変量データのプロット

www.slideshare.net


healthplanetパッケージで体組成データを手に入れて健康な体も手に入れる

www.slideshare.net



  • 自己紹介を聞いているとデジタルマーケティングの人が多かった気がする。また層が変わったのかな
  • ネタ切れなので飛び込み発表用のネタ作っておかねば
  • 筋トレ。。。