【なろうAPI】公式企画に参加するとポイントたくさん入るの?問題「春の推理2022」編・ついでに「小説を読もう」でID指定検索をするやり方もあるよ!
琥珀と申します。
金髪イケメン残念王太子アルフォンスが雑な扱いを受ける異世界恋愛物のシリーズなどを書いております。
一番下に、近作の異世界恋愛x推理物「公爵令嬢カタリナの推理」へのリンクを貼っておりますので、お気が向かれましたらぜひ!
仕事の絡みで、python(データ処理が得意なプログラミング言語)をちょっとは覚えた方がいいんだよなー、でもぶっちゃけわけわかんねえんだよなーともだもだしておったのですが、そいや「なろうAPI」から引っ張ったデータをpython使って色々分析されていた方がいらしたような…とあちゃこちゃ拝見して勉強させていただいていたのです。
そして、そういや春に、公式企画に参加しようと思って、参加作品をチラ見させていただいていた時に、序盤の方がポイント入りやすいのかな?と、ふと思ったのを思い出し、データを取得して分析ごっこをしてみるべ!となったのです。
やっぱり自分なりに調べたいことがないと、なかなか勉強する気が出ないですからね。
今回の問いは以下の2問。
問1:公式企画に参加すると、ポイント入りやすいの?(直球)
問2:参加のタイミングによって、ポイントの入りやすさは違うの?
問1は、作品を投稿されたことがある方なら、なんだかんだポイントは気になっちゃうよね……ということでわかりやすいかと思います。
問2は、↑でご説明したほんわりした体感があったので。
というわけで、「春の推理2022」参加作品のデータを引っ張ってきてこねこねしてみました。
この企画を選んだのは、自分が企画に初参加したものであるのと、夏のホラーよりは作品数少ないからです。
まだpython全然いじれないので、ターミナル(Mac使い)に出てきたデータをコピペして手作業で処理してるので、あまり多いと死ねるのです(屍)。
karupoimou様の「Pythonで行う「なろう小説API」の分析 コード例、環境準備、トラブルシューティング」(https://karupoimou.hatenablog.com/entry/2019/04/19/175638)のお陰で、なんやこれ…わけわからんし…とか言いながら、企画参加作品計277本分(去年以前に投稿されて、タグだけつけていた作品を除く)のデータを取得できました。
タイトル、初回投稿日、最終回投稿日、総合ポイント、ついでに会話率をとってきました!
まずは問1「公式企画に参加すると、ポイント入りやすいの?」←しやすいです!!
本当は、今年に入ってからの全体データを取ってきた方がいいのですが、500件以上取得するとなるとなんか難しいことしないといけないっぽいので、ゆうゆう@なろうデータ収集卿様の「小説家になろうを知ろう ~小説家になろうをグラフ化してみた~」(https://ncode.syosetu.com/n3630fb/12/)のグラフ(2018年時点の全データ)と比較させていただきました。
18年のデータでは、0ポイントの作品が42.3%だったのに、春の推理2022参加作品では7.2%!
なんらかのポイント入る作品が、18年では6割、春の推理2022参加作品では9割以上となっています。
ついでに黒長二郎太様が集計されている21年末の全体データ(「作者別、文字数、pt分布(ただの集計データ)」(https://ncode.syosetu.com/n2304hj/))でも、0ポイントの作品は4割。さらに、ポイント中央値は4pt!とあります。
そしてNコードの約半数が欠損値であることから、0ポイントのまま消された作品も相当数あるのではないかと推測されています。
実際には、0ポイント作品の比率はもっと高いのではないかということですね。
1000pt以上の作品の比率はむしろ低いので、企画でめちゃくちゃ注目を集めてドカンと当てる!ということは春の推理2022では起きていないにせよ、小当たり、中当たりは発生しやすい模様です。
ただこれ、「企画参加されている作者様は普段から活発に活動されている方が多く、そういう方が書かれているからこそポイントが高めに入っている」可能性はありますがががが。
このへん、統計&プログラミングに詳しい方にモデル化して分析してみてほしい……
企画参加者は、他のユーザーより投稿数が多いとか出る予感がするんですよね。
そして問2「参加のタイミングによって、ポイントの入りやすさは違うの?」←まあ関係ないかな……
イベント開始時(2022/4/12)から初回投稿日、最終回投稿日(編集は反映されません)との差分をてきとーに出して、グラフ化したのが以下です。
開始前に投稿している方や8月になってから追加更新された方もいらしてグラフが変なことになっていますががが、
①初回投稿日は、企画開始日が多い
②最終回投稿日は、終了日が多い
と、そりゃそうだろという当たり前の結果が。
ちなみに200作品が初回投稿日=最終回投稿日なので、短編か同日完結の中編です。
そんで、総合ポイントと開始時からの日数の相関係数をGoogleスプレッドシートの「ピアソンの積率相関係数」で出してみました。
イベント開始時からの初回投稿までの日数と総合ポイントの相関:-0.05294286724
イベント開始時からの最終投稿までの日数と、総合ポイントの相関:-0.05826161867
相関係数、-1から1までの間の値を取る係数で、-1(Aが多ければBが少ない逆相関で完全に一致)〜0(全然関係ない)〜1(Aが多ければBも多い相関で完全に一致)の間の値をとります。
社会科学系だと、相関あるんじゃね?と言っても許されるのが0.3くらいだったような(うろ覚え)。
マイナスなので、「日数が少ないほどポイントが高い」、つまり早めの方が若干ポイントが高めっぽいですが、この数値では相関があるとは到底言えない雰囲気です……
タイトルとブクマ数、会話率も取ってきたのでついでに出してみますと
タイトル文字列の長さ(文字数)と総合ポイント:0.3899550683!
この値なら、タイトルが長いほど、ポイントも高いと言えますですね!
ブクマ数と総合ポイント:0.7988183491
めっちゃ相関あります!って、そりゃそうだ。
会話率と総合ポイント:-0.0630391768
ほぼ関連はないけど、若干低い方がポイント入ってはいる雰囲気。でもこれはジャンルにもよるのかも?
ふむむむむ……
ま、ちょっと値の散らばりを見てから考えるのです。
って散布図を出してみたらなにがなにやら。
下の方のもにゃもにゃっと重なっているところの傾向が知りたい……
ほんとは28日間ですが、おまけで30日までにして、300pt以下のものに絞ってみます。
うーん、どうなんですかねこれは……
最終投稿の方で、ラスト5日くらいで多めに100pt-200ptくらいの作品が出ているようにも見えますが、相関係数がアレでしたし、やっぱり関係なさそうな気配……
統計のやり方がうろおぼえすぎて、こっからなにをどうすればいいのやらです。
ついでに言うと、日別で分析するなら、曜日の影響も考えないといけんじゃろうしな……
土日祝日はみなさんの行動がバラけるせいか、概してPVが伸びにくく、ポイントが入りにくいのです。
というわけで、
問1:公式企画に参加すると、ポイント入りやすいの?
←0pt作品の比率は、全体データと比べて大幅に低く、2桁ポイント作品の比率が高いです!
ただし、活発に活動していて、読者を抱えている方が企画に参加されているかもなので、企画に参加したからといってポイントが入るかどうかは不明……
問2:参加のタイミングによって、ポイントの入りやすさは違うの?
←特に関係なさそうなので、気にせず参加しましょう! まあでも、開始日、最終日は投稿が集中するので、埋もれてしまうとかもありそう。自分だったら避けるかも…
おまけでわかったこと:春の推理2022参加作品の場合、タイトルの長さとポイントには正の相関があるようです!
データの数がそんなでもないので、参考値ということでででで。
個人的には、普段書いていないジャンルの小説に挑戦できる&それまで絡んでなかった方とも新たな出会いがあったりすることが企画参加のメリットかなと思います。
ということで、次回「秋の歴史」でお会いしましょう!(自分はちょっと忙しくなりそうで、書けるかどうかわからんですががが)
=おまけ・自作品リストのリンクの作り方=
「小説を読もう」、おもろい作品を探したり、ランキングでお世話になっていますが、なんでか作者IDでの指定ができません。
私のように、他にも同名の方がいらっしゃる作者名をうっかりつけてしまった者はとほほ……
ですが、実は「小説を読もう」でも、なろうAPI(https://dev.syosetu.com/man/api/)の絞り込みが一部使えるそうで、URLにコードを入れることで、「小説を読もう」の標準検索機能ではできないID検索をすることができます。
https://yomou.syosetu.com/search.php?userid=2055769
IDは「ユーザーホーム」ページのすみっこにひっそり書かれています。↑のは私のですが、ご自身のIDや読みたい作者様のIDに書き換えていただければ適宜使っていただけます。
指定しないと新着順で出てきますが、&order=hyoukaを足した以下のURLだと、総合評価ポイント順で並べかえたものが出てきます。
https://yomou.syosetu.com/search.php?userid=2055769&order=hyoka
並べ替え順の指定については、なろうAPIの「出力GETパラメータ」というところに出てきます。「hyouka」の部分を差し替えていただくと、文字数が多い順、少ない順とか、レビューが多い順、感想が多い順とかに並べ替えることができます。
ついでにジャンルの絞り込みもできるようです。
https://yomou.syosetu.com/search.php?userid=2055769&genre=101&order=hyoka
とすると、genre=101というのが、異世界恋愛のコードなので、私の作品のうち、異世界恋愛作品のみ総合評価ポイントが多い順に出せたりします。
ジャンルコードは、なろうAPI解説ページのわりと最後の方の「出力」という項目に書いてあります。
お好みの検索条件を組んで「あとがきテンプレート」に仕込んでおいて、作品の最終回で別の作品を宣伝するとか、バナーを作ってランキングタグに入れておくとか、色々できるかと思います。
ご覧いただきありがとうございました!
なお、先人の皆様のコードのコピペでどうにか「なろうAPI」を使えたというレベルなので、技術まわりのご質問等はご容赦ください><