ポイントランキングと分布を見てみる
集計する、というのはデータを何らかの基準、例えば今回の場合は筆者ごととか、ある程度の期間ごとにまとめて、個数・合計・平均・最大・最小などを求めて、その本質を探る事です。
ここでは、まず集計をする前に単にAPIデータをそのまま(つまり作品単位で)解析してみましょう。まず、再度新しいExcelで部分データを読み込んでテーブルを作成します。このExcelはいくら加工しても元データは壊れません。
では、まずglobal_pointでソートしてみましょう。つまりは、歴代級のエントリを探ろう、というわけです。ま、この程度は小説を読もう、の小説検索で、ジャンル・小説種別を絞り込んで、ポイントでソートした結果と同じものになるわけなのですが。
ソートをするためには、global_point列の右端のボタンをクリックし、コンテキストメニューを出して昇順または降順を選択するだけです。
ソートした結果のtop20はこれ。いくつかのカラムは非表示にしてあります。
歴代topは、かの有名な燦々SUN氏のエントリ。エッセイでも16000ptなんて取れるんですね。top20まで行っても4000pt。凄いものです。ただ、燦々SUN氏も少なくとも現状ではエッセイのエントリは一つだけです。
20位の中で、複数ランクインしているのは中々中氏と時の権能者氏の二人。基本的には、「大当たり」というのは有りうるのだけれど、狙って当て続けるのはとても困難、なんじゃないかな、と思います。
まあ、エッセイの「外部」に膨大な「お客さん」を抱えている方は別。燦々SUN氏のエッセイは、そもそもがとこ、それがエッセイジャンルである、という事すら知らずに読まれた方が多いのではないかと推測します。そして、内容がまた時流にドンピシャだったためにポイントが上がる。そうしてつけられた歴代1位ではないかと。だから、もしもう一篇何か書いていただければ、多分ランク上位に入ることは間違いありませんが、残念ながら今は少しなろうから離れていらっしゃるようです。
さて、上だけ見ていてもしようがない。まずは、前回の「今年1-4月期」の解析で提唱した20:80の法則が、スパンを広げても成立するか。についてみてみましょう。20:80の法則は、別に働きアリの法則ではなく(もしかしたら働きアリかもしれない)、20という数字を基調とした
・0ptの作品は全体の20%である
・100pt以上の作品は全体の20%である
・ポイントの中央値は20pt前後である
についてです。
0ptの数、100ptの数はソートして何件あるかを数えればそれですみます。8/1の時点で、条件に合致する投稿数は25752件(約2.5万件)。0ptの件数は6674件。100pt以上の件数は4879件。まあちょっとずれは有りますが、おおむね2割と考えてもそう差は無いでしょう(26%ぐらい)。スクロールして探した中央値は18pt。
つまり、全スパンを通してみても、これらの分布はあまり変わらない、時期によるものではない、という事が言えると思います。
次に、ヒストグラムを見てみましょう。global_point列を選択したうえで、挿入/グラフから統計グラフのヒストグラムを選択します。
そうすると、次のグラフが挿入されます。
これは使い物になりませんね。そこで区切りを調整します。ヒストグラムの横軸の数字をクリックすると右ペインに軸の書式設定が開かれます。その「軸のオプション」を(選択されていなければ)選択します。
自動になっているからこのように全範囲を表示してしまうわけで、ここではオーバーフローを100(100pt以上はまとめて表示する)、ピンの幅を10としてみましょう。
すると、ヒストグラムは次のようになります。
うん、なんか絶望ですね。ポイントが高い投稿の割合は、もう完全に単調減少していく。
果たしてどうやったら、高ポイントなんて取れるんでしょうね。