第49回R勉強会@東京に参加してきた

以下メモ

今日発表した内容になります。はじめてのR http://t.co/NgN5DA7Oug #TokyoR
— Minoda Takashi (@aad34210) 2015, 7月 18

統計ファンダメンタリスト = 統計原理主義者
参加者の統計検定受験経験(2級以上)、3割くらい
幹葉図
- 比較的小規模で一番したの桁がそろっているデータに対して使われる
- 外れ値や最頻値の探索に有効
- 大まかな分布の形状が把握できる
- 大規模なデータには適用しない
- プロットはstem()
ローレンツ曲線
- 事象の集中の程度を示した曲線
- ineq::Lcでローレンツ曲線を描く
- ineq::Giniでジニ係数を計算
ポアソン分布
- 適合度検定
  - 観測されたデータがある分布に従っていると仮定して、本当にその仮定に従っているか検定
  - 検定統計量は $x^2=\sum \frac{\left(O-E\right)^2}{E}$ で与えられる
平均への回帰
- 極端なことが観測されると、次はよくあることが起こることが期待されるという現象
- 結果の分布が正規分布のように中央に集まっていることに対して起こる

統計検定2級、復習しなきゃ

for を捨てよ、foreach を書こう from hoxo_m

t.co

R で超簡単に並列処理を書けるpforeach パッケージ from hoxo_m

t.co

@hoxo_m氏がLT職人化してた。非常に良かった。見倣いたい。

#TokyoR 本日の発表資料です。 https://t.co/pv7QQGkjV0
— ホクソバイアス (@yamano357) 2015, 7月 18

> is.na(paste0(NA))
[1] FALSE

これ知らんかった。。。

以下の記事でも参考にした"Data Manipulation with R"にもstringrは言及されていて今回は飛ばされたstr_length(), str_dup(), str_trim(), str_pad()についても記載されていた。

<a href="http://estrellita.hatenablog.com/entry/2015/06/18/080651">lubridateパッケージによる日付型データの加工 - INPUTしたらOUTPUT!</a>estrellita.hatenablog.com

文字列の長さはbase::nchar()でも取得できるがpaste()と同じくNAの挙動が不自然なので要注意。

> nchar(c("x","y",NA))
[1] 1 1 2
> str_length(c("x","y",NA))
[1]  1  1 NA

[R言語]「Japan.R開催のお知らせ」と「Rでワンライナー」というタイトルで第49回R勉強会＠東京（#TokyoR）にて発表してきました - gepulog http://t.co/AvRnZw4UNG
— 時をかけるgepuro (@gepuro) 2015, 7月 19

7/28のTokyoR LTの資料です。http://t.co/hzKTsYwWiY
— ほくそうる (@soultoru) 2015, 7月 22

先ほどのLTの内容です。 https://t.co/OnIDF9GwZa #TokyoR
— weda_654 (@weda_654) 2015, 7月 18

f:id:tak95:20150719070051j:plain

『みんなのR』、サイン頂きました！ありがとうございました。