作者単位の投稿数分布を見てみる
さて、では本題というか、作者単位で集計してデータを見てみましょう。
新しくシートを作成し、ピボットテーブルを挿入します。
作者はwriterでまとめるか、useridでまとめるか。後者の方がより厳密ではありますが、複数使い分けは別人格、と考える事も出来るので、ここではwriterでまとめる事にしましょう。
値は少しまとめて色々と取ってみる事にします。
点数について、個数(投稿数)、合計、平均。Over100とIsZeroの個人での平均。特に前者はいわば「打率」を意味します。以前の解析では点数平均を用いましたが、今回はこの「打率」をメインで見ていきたいと思います。それから、投稿日の最大と最少は、いわば筆者のエッセイジャンルのデビュー日と、そして最新投稿日を示します。
ピボットテーブルは値の順に並べ替えはできますが、値で表示をフィルタリングなどはできません。このために、色々解析するにはテーブルに直してしまう方が簡単です。
まず、ピボットテーブルのシートでctrl+Aで全選択します。次に、新しいシートを作成し、そこで貼り付けをするのですが、そのままだとまたピボットテーブルが出来てしまうので、値の貼り付けをします。右クリックから、貼り付けのオプションで123..とあるものを選択すると、値のみがコピーされます。
次に、そのまま挿入/テーブルとクリックすると、テーブルの作成ダイアログが表示されるので、そのままOKすると、テーブルが作成されます。
あとは、このテーブルを使って解析をすればよいわけです。そうそう、邪魔になるので最終行の総計行は忘れずに削除してしまいましょう。あと、general_firstupのセル書式は日付付きの時刻にしましょう。
さて、8/1の時点で、総投稿者は8221人。ただし、ほとんどが1件しか投稿をしていません。個数/global_pointで昇順ソートをすると、投稿数順に表示されます。これを見ると、実に5477人が1件しか投稿していません。2件までで6587人。3件までで7068人。比率でみると、1件のみが67%、2件までで80%、3件までだと86%となります。80:20の法則なら、3件投稿すれば、20%に入っちゃうということです。
まあ、いつものようにヒストグラムでまとめてみますと次のように。
ともかくも、エッセイはあるいは新規参入するのは容易かもしれないけれど、継続して投稿する人が非常に少ない。一回で断念してしまう作者さんが非常に多いジャンル、という事になりそうです。
ま、この辺りは他のジャンルと比較してみないと判らないのですが。
今日は短い