0.全体的な文字数の傾向
ジャンルごとに見る前に、全短編での傾向を記します。
1.全短編のポイント上位500位内の統計的な傾向
表1: 全短編のうちポイント上位500位までの作品の傾向
※全ての短編の作品数: 206,275作品
※「検索除外中」の作品は対象に含まれません。
・表1の対象範囲
上記は「小説家になろう」の検索可能な全短編、調査時で206,275作品のうち「ポイントが上位500位までの作品」に関する統計です。
そのため、表1の対象は500作品、平均値など各種の値も上位500作品に対するものです。
また、以下では「全短編のうちポイント上位500位までの作品」を「全短編500位内」と記します。
・表1の各項目
各項目について、左のものから説明します。
「500位のpt」は該当区分で第500位の作品のポイントです。「全短編500位内」の場合、第500位の作品は2,946ポイントでした。
「作品ごとの文字数」の平均値、中央値、最小値、最大値は、対象となる上位500作品の統計値です。
「全短編500位内」の場合、該当する500作品の平均文字数は10,093文字、中央値は8,031文字、最小の作品の文字数は1,669文字、最大の作品の文字数は61,497文字です。
「作品数の最頻値」は、該当する500作品で何千文字台のものが最頻出したかを示しています。
「全短編500位内」の場合、最も作品が多かったのは6千文字台で、その範囲の作品数は56でした。
「全短編500位内」では、平均値が1万文字台、中央値が8千文字と比較的高めとなっています。しかし最頻出は6千文字台ですので、1万文字以上が幅広く続いていると予想できます。分布については、次項で記します。
・表1からの所感
上記は「206,275作品の上位500位まで」、全体の0.24%に入った人気作品です。したがって、これが全体的な傾向と一致するとは限りません。
第500位は3000ポイント近いので、ここに入っている作品はかなり多くの読者がブックマークをしポイントをつけたことになります。
しかし含まれなかった層、たとえば500位以降に相当する「約3000ポイント未満で1000ポイント以上」などだと傾向が異なる可能性があります。それらについては、別途論じます。
2.全短編のポイント上位500位内の文字数の傾向
統計上の平均値や中央値には現れない傾向もあります。そこで、千文字台ごとに該当する作品数を表しました。
図1: 全短編 ポイント上位500内 文字数ごとの作品数
※横軸は2万9千文字台以下に限定。今後も同形式の図は同様の範囲とする。
「全短編500位内」の最頻出は、表1だと6千文字台でした。しかし実際には、4千文字台から6千文字台がほぼ同じです。
それと興味を惹くのは一万字以上も多く、平均値や中央値を押し上げていることです。表からは一万文字を超える短編も相当数が上位に入っていることが読み取れます。
ちなみに「全短編500位内」の内訳ですが、以下のようになります。
「恋愛」ジャンル=267作品
「ファンタジー」ジャンル=65作品
「文芸」ジャンル=50作品
「SF」ジャンル=0作品
「その他」ジャンル=8作品
ノンジャンル=110作品
つまり短編の人気作品は「恋愛」ジャンルが半数以上を占めます。
3.「全短編500位内」の文字数とポイントでの分布
文字数とポイントの関係を分布図で表現すると、以下のようになります。
図2: 全短編 ポイント上位500内 文字数とポイントでの分布(全体)
500位が2,946ポイントですから、全作品の分布図から約3000ポイント以上を切り取った形になります。
また、以下に二万文字以下で一万ポイント以下に範囲を絞ったものを示します。
図3: 全短編 ポイント上位500内 文字数とポイントでの分布(部分)
これを見ると、3000~5000ポイントの範囲なら三千文字から一万文字くらいに集中しているように思えます。ただし、6000ポイント以上になると、文字数との関係性は低くなるようです。
もっとも該当範囲で二千文字以下のものは稀ですし、広範囲に目を転じても三万文字、四万文字となると同じく稀です。
一見すると「極めて稀な人気作品ではなくとも一定レベル」となるには、三千文字から一万文字が良さそうに思えます。しかし全体の作品数、つまり500位に入らなかったものも合わせて考える必要があります。
4.「全短編」の全作品の文字数の傾向
以下は「全短編」の全作品について、千文字台ごとに該当する作品数を表したものです。
図4: 全短編作品 文字数ごとの作品数
上記から、文字数が少ない作品が極めて多いと判ります。したがって表や図の最頻出などが文字数の少ないものに偏るのは、自然なことです。
つまり「どの範囲の文字数だと好まれるか」を論ずるときに、母集団の大きさは無視できません。
少ない文字数の作品が多い理由は、推測ですが「短いものの方が書きやすい」や「試しに書いてみた」などだと思います。
上位の傾向が全体と異なるのは、「読者が望む分量」や「テーマやジャンルを表現できる分量」には一定の文字数が必要だからと考えます。もしくは「文字数が多いと再読をするためブックマークする」や「それだけの大作を書いたことに敬意を表して評価ポイントを入れる」などもあるかもしれません。
いずれにしても、一定以下の文字数だと数多くの作品に埋もれる可能性がある、ということは言えると思います。
ちなみに傾向分析と直接関係ありませんが、ノンジャンルの1千文字未満の作品は52,011でした。そのため1千文字未満についての多くは「作者様が再設定の必要はないと考えた」作品だと思われます。
5.「全短編」の文字数ごとの上位500位に入った割合
前項で気になるのが「数多くの作品に埋もれる」の実態です。そこで上位500位に入った作品を、千文字台ごとに「該当作品数/総数」の割合を図と表で示してみました。
図5: 全短編 上位500内 文字数ごとの作品数の割合
表2: 全短編 上位500内や総数の実数と割合
※左端の列は何千文字台かを意味する
※「総数」は該当範囲の作品数
※「該当数」は上位500内の作品数
※「割合」は「該当数/総数」
上記からは、文字数が多い方が上位に入る割合は高いと理解できます。
1万文字台から2万文字台の間には、割合が2%を超えるものが幾つかあります。それに対し4千字台までは全て0.5%を切っていますし、そこから1万文字台までは1%程度までです。
もっとも文字数が多くなると母集団が小さくなり該当数も少なくなるため、割合の精度に問題が出てきます。そのため後半については、数字の有効性に疑問が残ります。
しかし大よその傾向として、該当数は54と最頻出値に近い4千文字台より数は少なくとも更に文字数の多い作品の方が、上位に入る割合が大きいのは確かだと思います。
つまり、ある意味では「文字数の多い作品の方が上位に入りやすい」となります。
もちろんボリュームのある作品を作り上げる能力があり、更に必要な労力を費やしてのことです。また、それだけの時間を用意できる作者様も多くないでしょう。
しかし仮に「長い短編」を完成させ、その作品が文字数に相応しい内容を備えていた場合、多く見られる作品の何倍もの分量でも良い結果が得られるのでは、と思えます。
6.「全短編」の総括
「何千文字台」という分け方で文字数の平均値、中央値、最頻出などを並べてみましたが、母集団の大きさとの兼ね合いを考えると一概に短めの作品が好まれるとは思えません。また実際に上位に入った作品は広く分布しているので、あまり統計的な最適値を意識しなくても良さそうです。
「何文字以内に纏めなくては」と考えるより「内容に相応しい描写」に注力すべき。月並みですが、そう感じました。
次項では、ジャンルごとに見た結果を記します。