はじめに
初めまして、あるいは毎度このデータ分析を読んでくださってありがとうございます。相変わらず発表する小説の人気は微妙な佐々木尽左です。
小説家になろうという小説投稿サイトを書き手として利用させてもらって6年目に突入しました。結構長く使っていることに気付いて驚いています。この『小説家になろうをデータ分析してみた』も2016年から初めて今回で5回目となりました。小説の件数も69万件以上となり、投稿された小説が本当に全部読まれているのか余計な心配をしてしまうほど増えています。
このように、読みたい小説を探すときは苦労する程膨大な小説の件数ですが、分析する分にはデータはたくさんあればある程嬉しいものです。かつてあったジャンルの大再編成も次第に昔のことになりつつある今、現在の小説家になろうが一体どのような状態なのかを説明していきます。
今回発表するデータは、『小説家になろう』へ2020年1月1日までに投稿された約69万件の小説です。データを比較する期間は今回以下のようになっています。
1.全データ
小説家になろうへ投稿された小説すべてが対象となります。今回は、開設時から2017年12月31日までの全データ、開設時から2018年12月31日までの全データ、開設時から2019年12月31日までの全データを使用します。各期間の累積データを比較することで『小説家になろう』全体がどの程度成長したのかを分析します。今後は、2017年全データ、2018年全データ、2019年全データと呼びます。
2.全転生転移データ
「1.全データ」のうち、転成転移のフラグを立てられた投稿小説のみを対象とします。今後は、2017年全転生転移データ、2018年全転生転移データ、2019年全転生転移データと呼びます。
3.年間データ
2017年、2018年、2019年と期間(すべて1月1日~12月31日)を区切り、投稿された小説や付与されたポイントの差異を比較します。各年の1年単位のデータを比較するわけですね。今後は、2017年年間データ、2018年年間データ、2019年年間データと呼びます。
4.年間転生転移データ
「3.年間データ」のうち、転成転移のフラグを立てられた投稿小説のみを対象とします。今後は、2017年年間転生転移データ、2018年年間転生転移データ、2019年年間転生転移データと呼びます。
今回は2017年、2018年、2019年と3年間のデータがようやく揃いました。特に1年単位のデータを比較することで、この3年間で小説家になろうがどのように変化してきたのかを知ることができます。つまり、「3.年間データ」と「4.年間転生転移データ」で近年の小説家になろうの流行がわかるのではないかと期待しているのです。
最後に、いくつか注意事項を明記しておきます。これを踏まえた上でご覧ください。
分析のために用意したデータを取得した方法は、『なろうデベロッパー』から公開されているAPI(http://api.syosetu.com/novelapi/api/)を使用しました。
対象データは2019年1月1日に『小説家になろう』から取得した約69万件です。ただし、APIの仕様上一部のデータは取得できませんでしたので、それは対象外となっています。また、2017年分および2018年分として集計しているデータは、去年および一昨年に取得したデータを利用しています。
尚、敬称は全て省略させてもらってます。