『なろう』のPV数に関して真面目に考えてみた件(短編版、中編①、第二版)
※前回以上にガチ数学なので、苦手な方はブラウザバックお願い申し上げます。
※式中のパラメーターが何を示しているのか分からないというご意見を頂戴しましたので、一部修正中です。
2022年5月、私は『『なろう』のPV数に関して真面目に考えてみた件』という作品を投稿した。
この作品は、『なろう』における短編作品の初期PV数とそれに影響を及ぼす制御因子との関係性について考えた作品である。作品の中で、私は『タイトルに含まれるキーワード数』が1個、『タグ中のキーワード数』が2個、『小説ジャンル』が『異世界恋愛』、『あらすじの文体表現』が『適切』である時に、最適な初期PV数が得られることを導き出した。
しかし上述の通り、変数を調整することで最適な初期PV数は得られるが、変数の設定値を自由に決められないという欠点がある。また、PV数は時間とともに変化するものであり、PV数の経時変化も無視できない。
これら問題を解消するには、PV数と時間との関係を示す予測式が必要となる。予測式を算出することができれば、変数を定量的に扱え、PV数と時間の関係を可視化することができるからである。
最早決まり文句となってしまい申し訳ないが、実は私は工学屋である。
工学屋は、基本的には製品開発や性能試験等の仕事を行う。そして製品開発をしていると分かることなのだが、実は製品の性能というのは時間と共に変動することが分かっている。
顧客に製品を提出する際、工学屋は顧客に性能がどの程度変動するのかということを説明する必要がある。そのため、工学屋は開発した製品の性能の経時変化に関する試験を事前に行う。この試験を信頼性試験と呼ぶ。
この信頼性試験において、製品の時間的な変動を表す有名な式がある。その式を下の図に示す。
示した式はワイブルモデルと呼ばれるもので、物質と性能の関係を表している。式中のtは経過日数、cは尺度パラメーター、dは形状パラメーター、gは移置パラメーターを示す。このモデルを用いて得られるものは、初期性能とある時間における性能の比であり、0~1の値を取る。
なお、c、d、g等のパラメーターであるが、記号のままでは、モデルに対してどのように影響を与えているかが分かりづらい。そこで、それぞれのパラメーターを変化させた場合、どのように挙動が変化するかを下の図に示した。
図に示したように、ワイブルモデルはグラフ上では上記のような曲線になる。左からcのみを変化させた時の曲線の変化、dのみを変化させた時の曲線の変化、gのみを変化させた時の曲線の変化を示している。
最初に、cのみを変化させた場合の曲線の変化に着目した。cが大きくなるに伴い、曲線のピークが幅広になり、ピークの高さも少し変化していくことが分かる。cの尺度パラメーターの由来は、このピークの幅を変化させる因子であることに由来している。
次に、dのみを変化させた時の挙動を確認した。dが大きくなるにつれ、曲線のピークが鋭くなっていくことがうかがえる。dの変動幅が2.5~3.3であることからも分かるが、値自体は大きく変化させていない。それにも関わらず、ピークの外形は大きく変化していることから、ピークの形状に与える影響は多大であるといえる。このことから、dはピークの形状を大きく変動させるパラメーターであることが確認された。なお、dの形状パラメーターの由来は、このピークの形状を大きく変化させてしまうことに起因する。
最後に、gのみを変化させた時の曲線の挙動について考える。gの増加に従い、曲線が右側にシフトしていくことが確認できる。ただし、他の2つのパラメーターと異なり、ピークの形状自体に対しては影響を及ぼしていない。それ故、gはピークの位置のみを支配するパラメーターであることが分かる。また、gの移置パラメーターの由来は、ピークの位置を変化させることに由来する。
ワイブルモデルの大枠を掴んだところで、『WEB小説』というものについて改めて考えてみる。『なろう』に投稿する『WEB小説』は作者が作成した一種の『製品』であり、得られるPV数はその『性能』と捉えることができる。
そのため、『WEB小説』のPV数に対しても、上述のワイブルモデルが適用できるのではないかと考えた。ただし、繰り返しになるが、ワイブルモデルはあくまで比率であるため、PV数を予測するためには、式を一部改変する必要がある。そのため、①ベースラインを移動させる、②比率から具体的なPV数に変更することを考慮し、下図のように式を変形した。
赤字で示したところが、ワイブルモデルの中で変更した箇所になる。なお、ワイブルモデルでのtは経過日数であったが、上の図で示したtは掲載をしてから経過した日数を示す。詳細は省かせていただくが、ベースラインの移動させるパラメーターとしてa、比率から実際の値への変換させるためのパラメーターとしてbを割り当てている。eは累積した時、ベースラインを補正するためのパラメーターである。
モデル式が仮定できたので、『なろう』に投稿された『WEB小説』に対してフィッティングを行った。フィッティングには、実測値と予測値の差分の二乗が最小になるように最小二乗法を用いた。
実際には30件以上のフィッティングを行ったのだが、スペースの都合上、全て載せることはできないので、代表の10件を下図に示す。
図中の黒丸は『なろう』に投稿された『WEB小説』の実測PV数、破線は予測曲線を示している。図に示したように、投稿日から30日までの短編小説のPV数と予測式とが良好に一致することが確認できる。このことから、投稿日から30日までの短編小説のPV数は、ワイブルモデルを一部改変した式で表現できることが示唆された。
この結果と前回の『『なろう』のPV数に関して真面目に考えてみた件』に示したPV数の定義式より、これ以降の30日までの短編のPV数は、下の図に示した式で予測できることを宣言する。
続いて、一日当たりのPV数予測式に示したそれぞれの定数値が、PV数に与える影響を確認した。各定数値を変化させた時の曲線の挙動を下の図に示す。
図の左側はaを600~1800まで変更した時、右側はbd/cを500~2000まで変更した時の曲線を示している。
まず、aを変更した場合の曲線の挙動について考えた。aの増加に伴い、曲線のベースラインが上部に移動していくことが分かる。このことから、aはPV数の曲線位置を支配する定数値であることが予想できる。また、PV数を全体的に向上させるには、定数aの増加が鍵を握っているともいえる。
次に、bd/cを変更した場合について考察した。bd/cが低下すると、ベースラインそのものは変化しないものの、初期のPV数が低下してしまうことが確認できる。このことから、bd/cは初期PV数周辺に見られる『こぶ』の縮尺を支配する定数値であることが示唆された。
以上より、初期からPV数を大きく変動させず、かつ高いPV数を得るには、aを増加させつつ、bd/cを低下させる必要があることが明らかとなった。
では、このaとbd/cを制御するにはどうすれば良いのかという話になるが、残念ながらまだその因子を掴めていない。そのため、このaとbd/cを制御するための変数を探すことを次の目標としたい。
前回よりも明らかに短いが、今回はここまでにさせていただく。
前回の投稿から時間があったのに、あまり進捗が無くて本当に申し訳ない。なるべく早くaとbd/cの制御因子を見つけたいと考えているので、それまでお待ちいただい。
私は次の作品の執筆に移らせていただく。それでは――。