時間帯別の解析
さて、年別の解析をしましたから、今度は投稿の時間別の解析をしてみましょう。
今度はAO2セルに「=HOUR([@[general_firstup]])」と入力すると、投稿時間の列が追加されます。列見出しも時間に変えておきます。
これで、AO列を選択してヒストグラムを作ります。すると次のようになるので
例によって横軸をクリックし、軸のプロパティからビンの幅を1に設定します。すると、次のようになります。
良さそうに思えるのですが、最初の棒がちょっと高すぎますよね。それに、プロパティで軸のビンの数を見てみると、23しかありません。
最後のバーが[22,23]となっているので、終端がinclusiveであるのは判るのですが、どうも最初のバーは始端である0もinclusiveになってしまうので、0時台と1時台が合わせて表示されてしまうようです。この辺りは、連続値で散らばっている場合はあまり問題になりませんが、離散値だとこのように影響が出てしまいます。
これは、明示的にビンの数を24と指定してもうまく行かないので、とりあえずアンダーフローの設定を適当にすることにより
うまく1時間ごとのヒストグラムが作成できようになりました。
傾向ははっきりしていると言えますが
・4時台が投稿の底で、8時台に向けて増加する。
・8時台から14時台はほぼ同様だけれど、12時台だけは少し突出する
・14時台からは、22時台に向けて単調に増加する
・22時から0時台はほぼ変化なし
・1時台から急速に減少し、4時台に底に至る
という感じになります。午後、特に夜、の投稿が多いけれど、深夜丑三つ時とかになるとかなり減ってしまうということですね。
さて、では果たして有利な時間帯があるのかどうか。とりあえず、また2000pt以上の投稿に限って同じ解析をしましょうか。
そのためには、前回述べたようにヒストグラムやデータの作り直しはせずに、単に元データのglobal_pointで範囲フィルタをかけてやるだけです。そうすると次のようになります。
大当たりに限っていえば、投稿数の形とは大きく違いますね。夜は当たりにくい感じ。比率で行けば朝一とか、午後一の方が高いように思われます。いずれにしろ、深夜はだめ。
ただ、このあたりって因果律の逆転解釈とかする可能性もあるので、何とも言えません。単に良いエッセイを書ける人が、午後に活動している、というだけかもしれないのです。
では、最後に大当たりでなく大外れ、0ptのエッセイ分布を見てみましょうか。同様にglobal_pointで0と等しい、とフィルタをかけます。これは、数値フィルタでも可能ですし、数値の列挙値が24しかないので、チェックボックスで直接0のみを選択することでも実現できます。結果は
まあ、総投稿数とあまり大きな差異は無いのですが、見比べてみると21時以降の夜時間帯は比率が高くなっているようにも見えます。夜投稿するなら、早めの方が良い、のかもしれません。
ただ、どの時間帯でもそこまで違いはありません。ちゃんと新着に目を通していただくスコッパーさんとかの努力もあるのではと思います。
そろそろ、ピボットテーブルの集計動作に入りましょうか。