時間帯別に、もう少し詳しく集計してみる②
続き
さて、ではピボットテーブルによる集計でしかできない処理について、みてみましょう。
まず、投稿数ではなく、時間帯ごとの投稿のポイント合計について。これを見るためには、値のglobal_pointの計算方法を合計に変更します。その結果、ピボットグラフも自動的に変化し、次のようになります。
これは、件数と顕著な差がありますね。まずわかる事は12時のバーが件数に比べて相対的に高い事。そして、21時以降のバーが件数に比して低い事。つまりは、12時は有利で21時以降はあまり有利ではない、という事を示している可能性があります。
合計ですので、あるいは一つの大当たりが大きく影響を与えることもあります。歴代最高点の投稿は20時台ですが、これが一件なくなるだけで合計は1割下がる事でしょう。ですので、12時台にも何か特別なエントリが有ったのかを確認してみます。
そのために、もとのリストに立ち返って、global_pointの降順は維持したまま、時間にフィルタリングを掛けて12時のみのものを選択します。すると、次のような結果になります。
どうも、特別な少数のエントリが合計を引き上げるというよりは、そこそこのエントリが沢山あって、それで合計が大きくなっているように思われます。
当たっている人が、好んで12時に投稿するのか。それとも何かほかの理由があるのか。ともかくも、アノーマリがありそうな話ではあります。
さて、合計と来たら、次は平均です。平均なら、投稿数比を考えてよいので簡単です。集計方法を平均に切り替えてみます。すると、グラフは次のように変化します。
大きな差とは言えませんが、やはり12時投稿が一番有利に見えます。そして、夜は19時超えると未明にかけてどんどん平均値が低下していきます。ですので、やはり12時投稿はメリット有り。そうでなければ午後一が夜の早い時間、というのが一つのねらい目かもしれません。
さて、global_pointだとどうしても点数自体の多寡が影響してしまいますので、最後に追加した100pt以上のフラグ、および0ptのフラグを用いて時間帯別の影響を見る事にしましょう。
新しくシートを作ってピボットテーブルも新しいものを作ってしまいましょう。ピボットテーブルは削除するのが少しだけ面倒くさいので、そうなったらシートごとがさっと削除してしまうのが簡単です。そこで、行に時間を。値にOver100とIsZeroをD&Dして、計算方法を平均にします。
そして、グラフを作成しますが、今回は系統が二つあるので折れ線グラフにしてみましょう。結果は次のようになります。
これは、傾向がはっきり出ますね。まずOver100から。山は3つあります。朝の山はちょっと低いですが、要するに7時・12時・19時のいわば食事時間帯は100pt超えるエントリが多いという事です。特に5時台と12時台を比べると2.5倍も違います。
続いて、IsZeroの方を見てみますと、こちらはそこまで差はありませんが、夜の時間帯、そして深夜から未明にかけての時間帯が顕著に上がっていることが判ります。人目に付かない時間帯、というのはやっぱり不利なのかもしれません。
ご飯時間に投稿するのは、悪くないプランだよ、というのはちょっと面白い結論かもしれないです。