行列屋さんの作業ログ

行列まわりで色々やってたエンジニアの作業メモ&国内外旅行記ブログ

2015-04-26から1日間の記事一覧

dplyrでデータの集計を行う

大量(1億件くらい)のデータを集計する必要が生じた。 ということで今回は、Rであるラベル(複数)のデータがいくつ存在しているのか高速に集計するお話。 アンケートを取って、下のような結果が得られたとする。 adress <- sample(c('千葉','滋賀','佐賀'),siz…