INPUTしたらOUTPUT!

忘れっぽいんでメモっとく

第60回R勉強会@東京に参加してきた

以下メモ


初心者セッション

Rによるデータサイエンス 第1部 Rとデータマイニングの基礎

> c(TRUE, TRUE) & c(TRUE, FALSE)
[1]  TRUE FALSE
> c(TRUE, TRUE) && c(TRUE, FALSE)
[1] TRUE
> TRUE && TRUE
[1] TRUE
> TRUE && FALSE
[1] FALSE


初心者セッション 3 俺、俺。Rだよ

  • 都道府県別の犯罪件数を主成分分析しバイプロット
    • 東京、大阪、福岡などの大都市が表示される
      • 単純に人口が多いから
  • からだが赤く輝くとき、未知のものに立ち向かう勇気と情熱がわいている
  • 慌てず 必ず カクニンダー


初心者セッション 2


応用セッション

dplyr再入門

  • xxx_each()はdeprecated
  • funs()と.で任意の関数が作れる
  • SE版の関数もdeprecated(select_()など)

  • lazyevalもdeprecated予定?

    • その予定。rlangに移行予定


Rでendogenous stratification

  • 分析課題

    • 少人数クラスは学習に効果があるのか
    • その効果は元々の学力でどう異なるのか?
  • 以下の書籍の2章を参照

「ほとんど無害」な計量経済学―応用経済学のための実証分析ガイド

「ほとんど無害」な計量経済学―応用経済学のための実証分析ガイド


ガンマ分布の最尤推定法について

  • 混合ガンマ分布
    • ガンマ分布が混じった状態
  • 混合ガンマ分布のパラメータ推定

公開スライドはだいぶ端折られているので全編見たい方は会場まで是非!


LT

DockerでRStudio Server + MeCab + tidyverse(+ 日本語)

  • RStudio Serverの認証はデフォルトOSアカウント&パスワードだと思うんだけどどうしてるんだろ?


rPrefパッケージでパレート非優越ソートとデータ抽出

  • プライベートでの分析で役に立ちそう


男心をくすぐる女の戦略.R

  • 今日のキスより3日後のキス
    • ワクワク感が加算されるため

発表面白すぎてメモとれてなかった。。。資料公開されないかなー


Rによる感情分析

  • 感情分析するためのRパッケージ
    • {ditytext}
    • {SentimentAnalysis}


クラスター分析におけるクラスタ数の決め方

  • クラスタの数は分析者が意思を持って決めるべき
    • 上記パッケージの指標は参考に止めること
  • 上記の指標でもGIGO(Gabage In Gabage Out: いくら綺麗に分析してもデータが汚かったら分析結果もゴミ)は変わらない


Prophetでお手軽未来予測

  • Prophet
  • exploratoryにProphetを組み込み



  • dplyrの文法からビジネス課題の解決など今回も非常に参考になった!
  • 次回は5/20 or 5/27
    • 絶賛会場募集中