ユーザーについて知ろう1
☆データ情報☆
※今回の使用したデータは2018年10月13日現在のものです。
※レビュー率->ユーザー検索欄(全数検査)
※ブクマ率、評価率->ランダムサンプリング2.2万件 全数調査ではないため多少は誤差が出ます。ただし、137万に対しての2.2万件のぬきだしなので、95%信頼区間での誤差は1%以下です。その程度の信頼性だと思ってください。
※これらのデータは公式から提供されるものではなく、個人が集めたデータからの推測です。そのため実際の値から多少ずれがあります。ご承知おきください。
「さて、今回はユーザーの活動状況について見ていこう。小説家になろうのユーザーのうちそれぞれの機能を使っているのはどれくらいの割合なのか調べてみた」
「前回、評価をしたことがある人は20%って言ってましたけどほんとなんですか? そんなにみんな評価しないもんなんですか?」
「そうだな。多くのユーザーは評価をしたことがない。評価機能があること自体知らないユーザーもいるな」
「えー、そうなんだ」
「というわけで今回はユーザーがどれくらい機能を使っているか、またどれくらいの数をブックマーク、評価などをしているのか調べてみた。
項目としては『ブックマーク』、『評価』、『レビュー』、『活動報告』、『お気に入り登録』、『作品投稿』だ。
なお、『ブックマーク』、『活動報告』、『お気に入り登録』、『作品投稿』は非公開が選べる。さすがに非公開は調べられないので、あくまでも公開している率や数になる。そこに注意な。
また、『ブックマーク』、『評価』、『活動報告』、『お気に入り登録』は抜き出し調査だ。全数調べるのに膨大な時間がかかるため2.2万人のランダムサンプリングを行った。その程度集まれば95%信頼区間において誤差率は最大でも1%未満だ。それくらいの精度だと思ってくれ。
あとの『レビュー』、『作品投稿』は全数調査だ。こちらは調べるのにそんなに労力はかからなかった」
「えーっと、あの先輩、95%信頼区間とか、誤差率ってなんですか?」
「統計用語で、その調査がどのくらい信頼できるものかを表すものだな。まぁ今回は詳細な説明はしないが、今回出すデータの割合の誤差が1%以下だと考えてもらっていいぞ」
「統計ですか、なんだか難しそう」
「勉強してみると案外面白いぞ。ただ今回の趣旨ではないので割愛する。さて、まずはユーザーがブクマをしている率から見ていこう。どの程度の人がブクマをしているのか集計した」
「え、ブクマしている人って半分くらいしかいないんだ。意外、ん? 先輩、このNとかnって何です?」
「さっき言った抜き出し調査の対象を表すものだ。Nが調査対象の数、nが抜き出した数だな。あまり気にしなくてもいいぞ。
それで、ブクマを1つでも公開している割合は50%程度だな。全てのブクマを非公開にしている人もいるが、多くの人は一部だけ非公開だったりする。50%は最小だな。ただ、全てが非公開の人もそこまで多くはないので、全体としては55%~75%あたりかと思われる」
「でも、半分以上の人は確実にブクマ機能を使っているんですね。何個くらいブクマしてるのだろう」
「それも調べてみたぞ。累積度数でも見ていこう。1個以上ブクマを公開している人のブクマ個数を集計した」
「ほえー。10個で45%ですか」
「ブクマは最大4000個までできるが、90%以上のユーザーは200個もブクマしてない。半分のユーザーは13個以下だ。このグラフからブクマ分布の推定人数を出してみた」
「0個が70万人……。だいたい2~5個か11個~50個か、101個~500個くらいが多いんだ。確かにキリがいいですからね。それくらいなんですか」
「そのようだな。4000個のキャパシティ限界まで使う人は5000人もいないようだ。ただ、非公開ブクマは含んでいないのでこれが最低ラインだと思うといいぞ。
さて、次は評価だな。評価を1回でもしたユーザーは20%だ」
「全然評価してないんだ……。あー、だからブクマに比べてもつきにくいんだ」
「しかも評価は隠せない。これがほぼ現実だ。ちなみに別のエッセイの調査でも約20%だという結果が出ている。
※『一度も作品を評価したことのない人ってどの位いるの? ~8割です~』
https://ncode.syosetu.com/n1689dl/
この調査が行われたのは2016年だ。それから2年程度たっているがその割合はほぼ変わっていない。つまりどういうことがわかるか?」
「え? 評価をする人の割合はだいたい決まっているってことになるんですか?」
「その可能性が高いな。2016年からユーザーは倍に増えているが評価割合は変わらない。通常なら流入層や志向などが変わって、割合が変わってもおかしくはない。この評価システム自体の問題なのかもしれないな。
まぁそれは置いておこうか、累積度数も調べてみた。1回でも評価した人の回数を調べた」
「さっきよりも上な気がする。ということはつける回数も少ないってことですか」
「そうだな。評価をしても1回だけが33%だ。10個以上評価している割合は25%、全体ならこう推定できる」
「あー、いっぱい評価する人すごい少ないんだぁ。1000個以上って1000人くらいなんだ……」
「まぁ、普通はそんなに読まないからな。ちなみに俺が見た中では7000作品に評価をしているユーザーもいた」
「10ポイント付けたら1人で7万ポイント生み出しちゃう」
「ブクマや評価でランキングが決まっているが、使用している割合は少ないようだな。
そして次はさらに少ないレビューを見ていこう」
「なんですとー! えっ、レビューをつける人ってこんなに少ないんですか?」
「ああレビューを書いたことがある人は全員で1.3万人。小説家になろうのユーザーの1%でしかない。これがレビューが希少と言われるゆえんでもある。そして分布。こっちは推定ではなくて全数調べている」
「これはひどいですね。棒が見えない……」
「レビューをした人でも1回だけが9千人。レビューを2回以上書いている人は4千人だ10回以上書いている人は500人程度しかいない。累積度数もあまり意味はないが見てみる。これも1回以上レビューした人の累積度数だ」
「あー、そりゃもらえないわけです……ほとんどの人が書いていないんですからね」
「これが、なろうユーザーの現実だな。作品でもらえない順(ブクマ、評価、レビュー)と同じようにして割合も減っているようだな」
「はー、思っていた以上にブクマも評価もレビューもしている人は少ないんですね……うーん」
「そのようだな。さて、次からは活動報告、お気に入りユーザー登録、投稿数を見ていくぞ」
「はーい……」
※グラフが多くなったので分割しています。
以下は参考。今回の非公開ブクマの推定と実験の妥当性の確認です。
ーー非公開ブクマの数の推定ーー
調査したブクマ数の合計が約83万個でした。調査対象が137万で抜き出したのが2.2万そのブクマが83万なので全体の推定数は
137万人 / 2.2万人 × 83万個 = 5200万個
APIを使って集めた数は5900万で非公開作品を含めるとおよそ6300万個ってところです。※非公開と全体のブクマ割合が同一と仮定
なので1100万個少ないですね。恐らくその数が非公開と考えられます。
1100 / 6300 = 0.17
よって、だいたいブクマの17%くらいが非公開設定にされていると考えられます。
ーー評価回数の推定値の精度ーー
集計した評価は約10万回なので全体の推定数は
137万人 / 2.2万人 × 10万個 = 623万個
全体の評価数は587万個で、非公開作品を含めると626万個くらい。
なので、3万個少ないです。
なのでずれは
3 / 630 = 0.005
誤差としては概ね0.5%程度かな
だいたい今回の調査の信頼度は1%以下ではありそうです。
そこそこの精度であっていそうですね。