番外編3-レビューについてグラフ化してみた。
ゆう(以下ゆ)「さあ、始めるザマスよ(`・ω・´)」
友人A(以下A)「……」
ゆ「行くでガンス(>_<)」
A「……」
ゆ「フンガー( ゜Д゜)」
A「うるさい」
ゆ「……えっ!? そっち!? そっちですか。Aさんってそっち世代でしたっけ?」
A「……」
ゆ「これは年齢詐称の……え、あ、ちょ、Aさん! その関節はそっちには曲がらないぃ! 」
A「……いいからまともに始めるぞ」
ゆ「……はい(……結局そっちも言うんだ)」
A「で、今回はなにすんだ?」
ゆ「えーっと、今回はですね、レビューについてデータ集めたので、それをグラフ化して解析した結果について発表しようと考えてて……」
A「ああ、前回みたいにAPIでデータ取得してってやつね。レビューも取れたんだ」
ゆ「いえ、レビューはAPIでは提供されてませんよ。作品についたレビュー数は取得できますが、ユーザーが書いたレビュー本体の情報はAPIでは取得できないです。仕方ないので小説を読もうのレビュー一覧から集めました」
A「……え、まさか手作業で集めたのか」
ゆ「まさか、数万件あるんですよ? Excel VBAでプログラム組んで集めました」
A「まあそうだろな。って、またExcelかよ。ゆうってほんとExcel好きだよな」
ゆ「ふふふ、Excelは便利なんですよ! 大抵のことはExcelでできるのです。ちなみに前回の番外編2のデータもExcelで取得、集計、グラフ化を行っています」
A「へー、ちなみに今回はExcelでどうやって取得したんだ?」
ゆ「ExcelでInternet Explorerを操作してHTMLのソースコードを読み込ませて必要なところだけ抜き出しました。どうでもいいことですが、こういう行為を行うことをスクレイピングと言います。普通はPerlとかRubyとかPython、Javaとかでやるそうですね」
A「何言ってるかよくわかんないけど、お前が変わり者だってことは改めて理解した」
ゆ「えー普通だよ。結構やってる人とかいるよ。……多分。というわけで、改めて今回はレビューについてデータ集めたのでグラフ化した結果を解説しようと思います。データ範囲はレビュー機能が実装された2009年10月1日~2017年12月31日までのレビューが対象です。一応、今までのを全部取得してますが、きりがいいので2017年まででグラフは作りました」
A「また全部取ったのかよ。だから凝り性とか、細かいとか言われるんだよ」
ゆ「こ、細かくないよ!」
A「どうかな、とりあえず先に進めようぜ。あまり与太話が過ぎると怒られるんだろ」
ゆ「そうですね、そろそろめんどくさい人たちはブラウザバックするころですし、始めますか。というわけでまずは全体からです。どーん」
A「(えっ、茶番ってそういう意味でやってたのか?)」
ゆ「レビュー一覧のところに書いてある全~件というのは今までに投稿されたレビューの件数のことです。削除された小説に付けられたレビュー、削除されたレビューも含まれています。これらのレビューは見ることができません。取得したデータが全件数と合わなかったので調べたらそういうことでした。あと、今存在している作品におけるレビューがつけられた割合は約2.6 %です。約1万4千作品にレビューが書かれていました」
A「へー、そうだったんだ。知らなかった。にしてもその2.6 %の中にこのエッセイが入るんだな……」
ゆ「そうなんですよ。もっと褒めてくださいよAさん。私は褒められたら伸びるタイプなんですよ。ほらほら私を讃えてくださいよ」
A「やだよ、褒めたらすぐ調子乗るじゃん」
ゆ「えー、ソンナコトナイデスヨ」
A「なんで片言なんだよ」
ゆ「え、なんとなく。では次行きますか。そいや」
※ここから先のデータは現存する作品に付けられたレビューの解析結果です。
A「えーっとなになに、レビューの投稿数?」
ゆ「はい、年ごと、月ごと、日ごとのレビューの投稿数の推移です。確実に投稿されるレビューの数は増えてきています。それも線形ではなく指数で伸びてます。ここ最近だと年間2倍で増えていってます。月で換算すると毎月の投稿量が8%ずつ増えていっていることになります」
A「えっ、そんな増えてんの? なんで?」
ゆ「うーん、ユーザー数の増加も要因ですが、レビュー慣れしたのではないかと思います」
A「レビュー慣れ?」
ゆ「昔はレビューって、結構敷居が高かったんですけどね。最近はレビューの書き方やレビューに関するエッセイも増えてて、以前よりレビューを行うハードルが下がったと思います」
A「ああ、そういやエッセイジャンルでよく見るようになった気がするわ」
ゆ「それもあって、2018年もどんどん増えるんじゃないかなって思います。いまだと1日当たり30~40件が普通になってますからね。昔は10件以下が普通だったんですけどね」
A「ふーん。レビュアーも頑張ってんだな。そういや日間でやたら飛び出てるとこあるけど、これはなんなん?」
ゆ「ああ、この時々レビュー数が跳ね上がるところですか? どうも、同じ人が連続でレビューしてるときがあるようでそれで増えているようです。あとは企画かなにかで一斉にレビューしてるのだと思います。どうも1月の2~3週目にその傾向があるようで、レビューしようぜ! みたいなのがあるんじゃないですか? 詳しく調べてはないので推測ですが。というか調べると闇を見そうで怖いんですが……」
A「闇?」
ゆ「ヨイコハシラナクテイイコトダヨ」
A「なんで片言なんだよ」
ゆ「あはは、次行きましょう。ほい」
A「これは去年のデータか。やっぱところどころレビューが増えてる時期があるな」
ゆ「件数が件数ですからね。1人が10件とか投稿するとすぐに増えますし。レビューアーが増えればもう少しきれいな感じになりそうですね。実はポイントの時のようにきれいな感じになるかと思ったんですけど、そうもいかないみたいですね。ちょっと残念です」
A「これも土日の投稿数が多いのか?」
ゆ「概ねそうなんですが、時々レビューが増える時期があって、きれいにピークは出ないんですよね。1人1人の影響が大きいのが原因だと思いますが」
A「でもやっぱり増えてきてるな。最後らへんとかボーダーが30件になってんじゃん」
ゆ「年末から年始にかけての平均は今年は50超えてましたからね。2018年はボーダーが50くらいになるんじゃないですか」
A「レビュー型スコッパーは大変だな。競合が多くなって」
ゆ「その分発掘してもらえる頻度が増えるからいいんじゃないですか? レビューされる頻度が高くなったぶん、見てもらえる可能性は上がりますし良いことだと思いますけど。気を取り直して次行きましょうか。てい」
A「なになに、タイトルの文字数分布と内容の文字数分布?」
ゆ「レビューのタイトルは8文字以上100文字以内、レビュー本文は150文字以上400文字以内で入力する制限があります。皆さんがどれくらい書いてるか調べてみました」
A「また変なものを。……タイトルは50文字以内がほとんどで100文字も使う人はいないんだな」
ゆ「グラフでは見えませんが91-100文字は20件程度あります。51文字以上書く人は全体の1 %程度ですね」
A「逆に内容は制限ぎりぎりまで使う人が多いんだな。381-400がすごいことなってるぞ」
ゆ「そうですよね。びっくりです。こんなグラフになるとは思っていませんでしたよ。それだけレビュー愛に満ちているんですね。それだけ作品に込める思いが強いんですよ。私はそんなに書いてないですけど」
A「おい」
ゆ「いや、だってレビューって難しいんですよ。むしろこういったデータ解析する方が簡単ですよ」
A「レビュー書いたことないからわからんけどそうなのか」
ゆ「ソウナンデスヨ」
A「なんで片言なんだ」
ゆ「深い意味はないですヨ。では次のグラフ行っちゃいましょうか。ぽいっ」
A「レビューの編集割合? なんだそりゃ」
ゆ「レビューを使ってない人はあまり知らないことなんですが、レビューは投稿した後でも編集することができます。実はこの機能が実装されたのは2017年7月13日のことでつい最近なのです。またこのレビューの編集情報はレビューを書かれた作品の作者に通知されるのです。私は投稿したらそのままなので使ってる人ってどれぐらいいるんだろうと、ちょっと気になったので調べてみました」
A「ふーん、編集した割合は12 %か少数派なんだな。ほとんどは投稿してそのままなんだな。まぁそりゃそうか」
ゆ「読者の反応を見て内容を変えているって人もいるみたいですが、どうやら少数派だったようですね。では最後のグラフへ行きましょうか。皆さんあと少しです。てーい」
A「投稿時間割合? ああ、レビューの投稿時間を解析したのか。へー3時~5時あたりが少なくて、21時から0時ごろが多いんだな。まあ、そんなもんか。あと土日は昼が増えてるけど平日とそこまで変わらないんだな。意外だ」
ゆ「そうなんですよねー。もう少し顕著に変わるかと思ったんですけど。そこまで変わらないようですね。土日でもライフサイクルが変わらないのはすごいです」
A「ゆうは休日になると一日中本読んでるからな」
ゆ「休日の使い方は人それぞれなんですー」
A「はぁ、まあいいか。話し戻すけど、てことは3時~5時に投稿すればよく見られるってことなのか?」
ゆ「うーん、そうとも一概には言えないんですよ。実はこのレビューのグラフはランキング上位のPV分布と同じような形をしているんですよ。ということは、その時間帯には読者数も少ないので、よく見られるかはわからないんですよ。小説を読もうのTop画面には新着レビューの5作品が並びます。確かに投稿数が少ない時間帯だと、そこへの滞在時間は長くなりますが見る人自体も少なくなるので他の時間帯より見てもらえるかはわかりませんね」
A「そんなに考えてやる人もいないか。いたらもっと偏ってそうだしな」
ゆ「そうなんですよね。レビューは予約投稿ができないので、その時間にいる必要がありますから。自分の生活リズムに合わせて投稿している人ばっかりなんじゃないですか?」
A「ま、自分の作品をレビューするわけでもないしな」
ゆ「もし極端に偏ったらそれは……」
A「それは?」
ゆ「……いえ、やめておきましょう。ということで、今回の解析は終わりです。ここまで見てくださってありがとうございます」
A「唐突だな」
◆ ◆ ◆
ゆ「ふー、なんとか今回も終わりましたね。お疲れさまでした」
A「お疲れ。一応聞いておくけどさ、なんでこんなこと調べてたん?」
ゆ「えっ。それは……こ、この作品を見てくれる皆へのちょっと遅いお年玉だよ。皆いつも見てくれてありがとうって感謝の気持ちを込めて作りました。うん、そうだよ。そうに決まってるさ」
A「ふーん。で、本音は?」
ゆ「むしゃむしゃしてやった、今は反すうしている。」
A「牛かよ」
ゆ「コタツで本を読みながら食べるお餅っていいよね。むしゃむしゃ」
A「牛だった。太るぞ」
ゆ「違います―。私食べても太らないんです。いやそうじゃなくて、違うんです。あっ、太らないのは本当ですよ。じゃなくて、違うんです、別に、レビューでこのエッセイをべた褒めされてうれしかった、とかじゃないんです。違うんです、この人天才かって言われて舞い上がったんじゃないんです。違うんです、レビューもらった2.6 %に入って底辺脱出とか思ったんじゃないんです。ちがうんですよー」
A「おい、全部言ってるけど。つまりレビューもらったって自慢したかったってわけか」
ゆ「そうだよ。さすが、Aさん。名探偵だね。金田一の犯人もびっくりだよ」
A「あたしはあの人達の行動力にびっくりだよ。その力をもっと別のところで発揮しろよ」
ゆ「というわけで、番外編3はこれで終わりです。長々と付き合っていただいてありがとうございます。それではまた次回あいましょう(`・ω・´)ノシ」
A「えっ? また、次回?」
ゆ「え?」
A「次回の番外編はあたしらの出番なしって聞いたけど」
ゆ「なんですと!?」
ちなみにですが、作品ごとのレビュー回数の分布は下のようになってます。
~2017/12/31
回数 作品数 割合
1 10042( 70.9%)
2~4 3582 ( 25.3%)
5~9 377 ( 2.7%)
10~19 124 ( 0.9%)
20~49 28 (0.2%)
50~99 6 (0.0%)
100~ 2 (0.0%)
計14161作品




