文字数・ポイント・書籍化の関係を統計から読み解く
♦︎ 初めに
ここで扱うデータは、全てなろうの検索から得たものです。データの取得は自動化していないので、なんらかのミスがある可能性があります。ミスがあったとしても、データを誤解させるためといった意図的なものではないので、生暖かく報告して頂けると幸いです。
この集計は連載形式のみで、短編は含んでいません。
こちらにて元データを公開しております。
https://docs.google.com/spreadsheets/u/2/d/e/2PACX-1vS8jpmVOCDVcTy5DC5obZ1_Wos93D_DwA24Hd_Z8N_-3Ij2MFkgP_K03bYODbqRA0-6bmy0DHbymwrd/pubhtml?gid=53198764&single=true
あんまりミスが多いようなら、自動化して API からデータの取得をやり直すかもしれません。もともとこんなに大掛かりに調べるつもりはなかったんだ……
♦︎ 文書の意図と動機、及び謝辞
なろうを読み始めて早10年以上。創作などまるで経験のない自分が、過労で倒れたのを契機に暇つぶしに小説らしきものを書き始めたのが6月下旬。
右も左もわからぬありさまだったところ、古い付き合いの友人が、知らないうちになろうやカクヨムで作品を公開していて驚きました。しかも結構、いや、かなり人気がある。
これは色々きくしかねー! と思い、ごくごく基本的なことを教えてもらったり。
色々と興味深い話を聞くうちに、ふと思ったわけです。
これって、なろうの検索結果から調べられるデータでも、数字に出るのではないか?
興味本位でネトゲの仕様検証をやるくらいのノリでデータを取り出した所、見事に数字に出てくる出てくる。結果を見て、これは結構夢のあるデータだなぁとなり、二人で盛り上がりました。
いつか自分が作品を公開したときに、無条件に沢山の人に読んでもらえるなどと安易な夢を描いてはいません。ましてや、ポイントのために書くわけでもない。それでも、見る人がそう見るとは限りません。こんなものを公開しておいて、クソも読まれない作品を世に出せば、それ見たことかと指をさす人はいるでしょう。ぶっちゃけ、そんなことはどうでもいいのです。
データを取るまでは、人気作や書籍化は別世界の頂点で計り知れない天上にあるイメージだったのが、誰でもやることをやれば条件には届く、地続きの世界なのだと実感できた。その視点を多くの人に知ってもらったほうが、多くの人にとってハッピーなのではないか。そんなわけで、これを公開するに至りました。
数々の知見を示してくれた、えりまし圭多さんにお礼申し上げます。
♦︎ 文字数による作品数分布とポイントの関係
まずはハイファンから。
このパーセンテージは、計測幅を一万字の範囲とした場合の概算になっています。
まずは 0-1000pt の黒い線を御覧ください。左側で天井に突き抜けて行っています。これは、ハイファンでは低文字数の作品の低ポイント率が極めて高いためです。
一切のポイント制限をしない集計では、2万字までの作品でハイファン全体の作品数の実に 45% を占めます。短編は集計に含んでいないにも関わらずです。これが、1000pt 以上に制限するだけで、2万字ではたったの 2.6%、30万字でようやく 49% になることからも、その極端さがわかります。
大量の書き捨てや書きかけがあるとも言えますし、ハイファンではある程度の文字数を書かなければ評価をもらうのが難しいとも言えます。卵が先か問題みたいなもので、おそらく両面のループなのでしょう。
次に、色の付いた線を見ますと、13万字付近にピークがあります。これは本一冊分のラインです。
赤い線、10000-50000pt では、10万字以下は減り 13万字のピークにより集中しています。これはちょうど書籍化を狙えるあたりなので、書籍を意識したムーブをしている人が多いのかもしれません。もしくは単に本一冊分というのは読み手にとっても『そこそこ気軽に読めて食いごたえがある』量なのでポイントが伸びてくる、という可能性もあります。
50000pt 以上になると、10万字以下の作品は数えるほどしかなく 13万字のピークは痕跡を残すのみとなり、30~40万字が最も作品数が多い層になります。
この要因は複数考えられます。
・スケールの大きなファンタジーを描くには、一冊分は短い。30~40万字はそこそこ長編らしくできて且つ適度に短い、バランスが良いラインである可能性。
・ハイファンは長い期間に渡ってポイントが入る作品が多い。したがって、文字数が多い作品ほど長く連載していてポイントが育つため、50000pt 以上という条件では文字数が多い作品が残った可能性。
・50000pt 以上という実績があれば、出版社側も二巻や三巻の書籍化の保証をしやすくなる可能性。
個人的には全部かなぁと思いますね。他にもあるかも知れません。複数の要因でこう、ループしてるんじゃないでしょうか。
50000pt 以上は、100万字前後も厚みがあって、大作が豊富なのも印象的です。
では、次に異世界恋愛の同様のグラフを見てみましょう。
比較しやすいよう、縮尺を同じくしたハイファンのグラフをその下に並べてみます。
異世界恋愛の方はギュッと左に押しつぶしたような形になっています。異世界恋愛の短い作品の多さが極端すぎて、その縮尺に合わせたハイファンのグラフが潰れてしまいました。
ハイファンで顕著だった 13万字のピークは異世界恋愛でもありますが、それとは別に 2~3万字に大きなピークがあります。全てのポイント層において長編作品が極めて少ないのも特徴です。
10000-50000pt までは 3万字あたりの割合が多くなっていたのが、50000pt 以上では途端に反転、少ない文字数の作品数が減り 10万文字にはっきりしたピークを持っています。
結論から言えば、異世界恋愛というジャンルは短い作品が多く、作品のサイクルが早いということです。このグラフからも、3~10万字の作品を大量に連発している……という実態が想像できます。短い文字数では低ポイントがめちゃくちゃ多かったハイファンとは対照的です。
50000pt 以上の 10万字のピークはともかく、それ以下の 2~3万字のピークはどのような目的や需要なんでしょうか。物理書籍化はこの短さではアンソロ等でなければ無理なので、電子コミックの原作を狙ってるのでは? といった見解がありました。単に、読み手側がこの長さの物を求めている、という可能性もありますね。
50000pt だけ違うラインを描いているのも気になります。
個人的な見解ですが、50000pt ともなれば高確率で書籍化しているので
本一冊分を満たす量を書けば書籍化の最低要件を満たす
→書籍化される
→さらに知られてポイントが長い期間に渡って入る
みたいな好循環になっているんじゃないかなーと想像します。
まとめると。
異世界恋愛は pop が早い獲物を効率狩り。
ハイファンはじっくりと腰を据えて大物狩り。
そんな印象を受けました。
♦︎ 作品数で直接に比較してみる
これまでのグラフでは、ポイント層毎の分布の形を比較するために、全体に対する作品数のパーセンテージで見ていました。実際の作品数で比較すると低ポイントの方が圧倒的に多いので、そうしなければ高ポイントのグラフが潰れてしまうからです。
ですが、同じポイント帯であれば近い作品数になるので、比率ではなく直接に作品数で比較できるはずです。ハイファンの 3000pt 以上と異世界恋愛の 3000pt 以上で見てみましょう。
実際に文字数幅 1万毎に全ての区間でカウントするのは面倒なので、概算になります。文字数が増えるほど、大きな幅で計測しているのでそれを計測幅で割った数を使うことで、相対的な大きさの比較をできるようにしてあります。
異世界恋愛の短い作品の尖った多さ、ハイファンの 30万文字以降の粘りがよくわかります。
ちなみに、積分チックに見ても異世界恋愛の方がボリュームありそうに見えますが、文字数の多い層が厚いためにハイファンの方が文章量は多いです。3000pt 以上 700万文字未満でクソ雑計算ですが、ハイファン 34億文字 異世界恋愛 10億文字くらいです。多分。
♦︎ 文字数とヒット率の関係
なにをもってヒットとするか、難しいところですが、深く考えず適当に 3000pt 以上になる率をグラフにしてみました。これまでのデータを読み取っていれば、これを見て「露骨だな~」と思ったのではないでしょうか。
ハイファンはかなりリニアです。少ない文字数では高ポイントの作品は極めて珍しいですが、文字数が増えれば増えるほど素直にヒット率が上がっていきます。このグラフでは見切れていますが、500万文字以上となれば、3000pt 以上になる率は 8割近くにせまります。
異世界恋愛では、しょっぱなから急激に率が伸びています。短くても高ポイントの作品が多いということです。全体的に評価率が高そうな感じ。50万字あたりから先は、サンプルが足りないのでガッタガタです。それだけ短い作品が多いのですね。
この差って、読者の習性の差もありそうですけど、恋愛の場合とにかく短い作品が多くてサイクルが早いので完結ブーストを受けている作品が多い、といった背景もあるかもしれません。
ブクマはするけど完結するまで評価はしないスタイルのユーザーが多くいる場合、大物狩り志向のハイファンは短期のポイント合戦では不利です。そのかわり、ハイファンは長期に渡って伸び続ける作品が多いので、4半期や年間ランキングになれば目立ってくるはずです。実際、そうなっているんじゃないかな。
♦︎ ちょっと強引だけど書籍化を数えてみる
なろうって OR 検索ができないんですよね。書籍化でも巻発売中でも検索するというのができない。なので、これ調べるのが難しいんだよなぁ。書籍化しても書籍化と書かない作者も当然いるし、ほかのワードだったり。
まぁ、そこは割り切って、実際の書籍化数よりかなり少なく出たとしても傾向は読み取れるはずだ、と。次の条件で検索しました。
検索ワード 書籍化
除外ワード 短編 外伝 資料 設定集 SS 番外編 引き下げ 引下げ 引っ越し 引越 電子書籍化 ダイジェスト 試し読み
対象 タイトル あらすじ タグ
書籍化したい!などがかかったため 1000pt 以上に絞っています。
電子書籍化を除外ワードにしているのは、初めは自作で Kindle で発売しているものがかかったため……だったのですが、調べていると電子オンリーで書籍化するのを異世界恋愛の方だとちょくちょくみかけて、それが結構低いポイントからあったので「書籍化ってどこからなんだ」と悩みました。恋愛側に不利な集計になる可能性がありますが、除外ワードに入れて調査しています。
この検索条件でかかる総数は、ハイファン 735 異世界恋愛 448。除外ワードなしでは、ハイファン 814 異世界恋愛 608。異世界恋愛の方が差が大きいです。恐らく電子書籍化のワードが大きいかと。異世界恋愛だと電子書籍化を含むものは 70作品程あるのですが、ハイファンだと 9作品しかありません。
統計を取る側としては悩ましいですが、販売形態や展開の違いとして捉えると興味深いです。
自分の第一印象は「あれ? ハイファンかなり頑張ってる? っていうかそもそも書籍化数はハイファンの方が多いのか……」でした。ポイント基準での調査と違い、ハイファンのグラフのテール部分、30~40万字以降の粘りの部分がかなり効いてきているように見えます。
書籍化には最低 13万文字位必要なんだな、というのもわかりやすいですね。あれだけあった異世界恋愛の低文字数の高ポイント作品も、書籍化にはそこまでの影響は見られません。
異世界恋愛の低文字数の作品は、商業化を目指すとしてもターゲットとする戦場が異なる可能性が高いかなーと。読み切りコミカライズとか、コミック原作とか。詳しくないので全部聞いた話ですけど。
♦︎ 多分みんなが知りたい書籍率
書籍化数の方で述べた通り、書籍化を全て拾えているわけではないので、実際の書籍化率はもっと高くなります。(重要)
このデータを見るときには、ちょっと気をつけてほしいです。どうしてもサンプルサイズが足りないため、ガッタガタになっています。それを少しでも有意義なデータとするために、どの程度の誤差が見込まれるのかを計算しています。
標本誤差は、95%信頼区間でのものです。
異世界恋愛は50万文字以降のサンプルが足りなすぎてガタガタで使えないのと、ハイファンの方の推移を見るにあきらかに数百万字まで横ばいなのでこのグラフは 50万字までにしてあります。つまり、1万pt 以上での書籍化率は文字数を増やしても 31% あたりで頭打ちになるということです。横ばいの推移を見たい方はリンク先のスプシをどうぞ。
ただし、全部は拾えてないので実際はもっと高いはず。大事なことなのでもう一度書いた。では、グラフを御覧ください。
標本誤差の破線の範囲を見てもらうとわかるのですが、恋愛の方の 15万字あたりまではかなり精度が良いです。逆に、そこから先はハイファンの方が精度が良いです。
このグラフからわかる結論をクソ雑に言うならば「書籍化こねーってのは恋愛なら13万字、ハイファンなら 30~40万字書いてから考えたらいいんじゃないかな」ってとこでしょうか。
自分は書籍化どころかまだ作品も投稿したことのない人間なので、本当に数字を見ただけの感想です。でも聞いた感じ、これってさほど現実と乖離してないっぽいんですよね。
まーこれ、そもそも 10000pt 以上に対する率なので……そもそも 10000pt が天上人だろ!ってのはあるんですが。それでも、それでもです。思ったよりこう、見えないほど高い世界のことではなくて、地続きの世界で起きてることなんだな、というか。
まぁ、そんな感じです。
♦︎ 最後に
これで、やる気が出た人が増えたら嬉しいです。