表示調整
閉じる
挿絵表示切替ボタン
▼配色
▼行間
▼文字サイズ
▼メニューバー
×閉じる

ブックマークに追加しました

設定
0/400
設定を保存しました
エラーが発生しました
※文字以内
ブックマークを解除しました。

エラーが発生しました。

エラーの原因がわからない場合はヘルプセンターをご確認ください。

ブックマーク機能を使うにはログインしてください。
小説を書く人工知能を作ることはできるか?  作者: 葦沢かもめ
PHASE 2 小説評価予想プログラムの開発
6/12

第6回 パラメーターの推定(スモールスケール)

では、パラメーターを推定していきましょう。


まずスモールスケール(少量のサンプル)でパラメーターを推定します。


ストラテジーとしては、①ある特定の限局した範囲において有効な法則を見つけて、②次に範囲を拡大してその法則が成り立つかを調べる、というのが適切でしょう。


今回用いる実データは、拙作の「牛の中の美女」です。


簡単に評価の経過を振り返ります。


投稿日は「2017年 01月29日 01時49分」。

総合評価ポイントは、1日経過時点で12ポイントを頂きました。以降は変わらず。

ユニーク数は、1日経過時点で93。


既出の仮説に基づいて総合評価ポイントをユニーク数で割って被評価率を逆算すると、約13%という結果になりました(表1)。


挿絵(By みてみん)


(表1 「牛の中の美女」に関する評価パラメーターの実測値と予想値)


普通に考えて、被評価率が13%は高すぎます。

原因は、評価ポイントが入る際の評価者あたりのポイント数の期待値を考慮していなかったためと思われます。

文章評価 5ポイント、ストーリー評価 5ポイント、ブックマーク 2ポイントの足し合わせで評価ポイントは決まります。

これを無視してしまったため、被評価率が高くなってしまったと思われます。


式の意味としては(アクセス数)×(被評価率)=(評価者数)なので、便宜的に「評価期待値」を導入して、作業仮説を書き直します。


(評価)=(アクセス数)×(被評価率)×(評価期待値)


これで妥当なパラメーターになると思われます。


では手っ取り早くパラメーターを推定していきます。

どうせ後から修正するので、適当に決めていきます。

表1を参照してください。


まずアクセス数から。

(アクセス数)=(露出数:リンクが目に触れる数)×(魅力度:リンクが踏まれる確率)

なので、アクセス数が93になるよう、露出数を1000、魅力度を約0.092と推定しました。


露出数の内訳は、表の通りです。適当に決めました。

ツイッターでの宣伝効果は人によりますが、私の場合はこれでも多く見積もっている方です。


魅力度は、読了時間、獲得済み評価、ブクマ数、感想数、レビュー数をそれぞれパラメーターに置き換えました。リンクを踏まれる率が9.2%というのは、高いのか低いのか分かりませんが。

上で推定した露出数が多過ぎだった場合は、魅力度はもっと高いはずです。


次に、被評価率を見てみます。

(被評価率)=(読了率)×(評価衝動率)


ここは大雑把に読了率が約5割になるように調整しました。特に理由はありませんが、当てにできそうな根拠も示しづらいので応急処置です。

そこから評価衝動率は1.8%、被評価率は約0.88%と推定しました。まあまあ適正値だと思います。


評価期待値には10を入れてみました。

一人あたりの期待値が最大12なので、平均したらこのくらいでしょうか。


その結果、総合評価ポイントの予想値は約8.13となりました。

あえて実測値より低くしました。


なぜならば、ここまでは、あくまでも1日経過時点での話だからです。

投稿からある程度の期間は再現性を保てないと、実用性に劣ります。


執筆中の5月30日現在、122日経過時点でのユニーク数は169です。

アクセス数に169を代入すると、約14.9となります(表1中 例1)。

予想評価が12に近くなるのは、アクセス数が136の時になります(表1中 例2)。

これで投稿からの期間がある程度増減しても、大きな影響は無いでしょう。


評価期待値を上げれば、より投稿から短期間での評価に近くなると思われます。

ただ、期間が短いだけ評価を予想する精度は悪くなると思われます。

ここは実用性と正確性のどちらを重視するか、といったところでしょうか。




より正確に考えるなら、被評価率を場合によって変えた方が良いでしょう。

しかしながら、細かいことを考えるとキリがありません。


そこで、まず短編作品の最大評価がどのくらいか、ごく少数の作品を調べてみました。

データ数が少ないのでデータは載せませんが、すぐ分かりますので気になる方は検索してみて下さい。


おおよそ最大評価は3万ポイント近くになるのですが、それらの作品のユニーク数は20万~30万くらいです。

つまり被評価率は約1.5%になります(表1中 例3)。


今回は0.8%で計算しましたが、最大でもその2倍程度ということなので、かなり高評価の作品を除けば被評価率は一定でも予想値は大きく変わらないと思われます。


ここは追々、高評価の場合のパラメーターを考える時に変えていくことにします。



さて、今回はかなりアバウトにパラメーターを推定しました。

正確性には大きく欠けますが、考察してみる価値はあるでしょう。


例えば、今回のパラメーターのうち、アクセス数を300に変えると、評価は約26.5になります(表1中 例4)。

2人から12ポイントを貰ったのと同じシチュエーションと考えて良いでしょう。


逆に言えば、今回の作品で投稿から1日で2人から評価を得たかったら、300人にアクセスしてもらう必要があるということです。

方法としては、露出数を増やすか、魅力度を上げるか、になります。


単純計算すると、露出数(リンクが目に触れる数)を3000に増やすか、あるいは魅力度(リンクが踏まれる確率)を27%に増やすかです。


しかし、魅力度を上げる余地は、あまりないように思えます。

自分でできるのは面白いタイトルを考えるくらいですが、容易にできるものではありません。

どちらかと言うと、露出数を増やすのが現実的です。


露出数を意図的に増やすには、やはり自分で宣伝するしかありません。

計算上は、ツイッターやブログを駆使して約2000人にリンクを見てもらう必要があります。

ただしスパムまがいのことをやれば、魅力度を下げかねないので逆効果です。


それを達成する方法で最も簡単で有効なのは、ツイッターで宣伝ツイートを拡散してもらうことでしょう。

1回のツイートで100人が見るなら、20回のリツイートで2000人の目に触れることになります。

創作小説の宣伝で20リツイート超えをしているものは、少なくありません。


これは相互にリツイートする文化からくるものなので、活発に他の人のリツイートをすればリツイートしてもらいやすくなるようです。

裏を返せば作品内容には大きく左右されないので、かなり万能な方法だと思います。

(もっともリツイートを嫌う人がいない訳ではないでしょうけれど)




次回は、本文から評価を予想できるように、テキスト情報のみからパラメーター(魅力度、読了率、評価衝動率)を抜き出せるようにします。

そうすれば、小説本文を入力したら、あとは露出数を任意に設定するだけで評価が予想できます。


その後で、サンプルの範囲を広げてみてパラメーターの種類は増やさずとも値を修正するだけで十分に再現性を得られるかを検証してみます。


それでは。

評価をするにはログインしてください。
この作品をシェア
Twitter LINEで送る
ブックマークに追加
ブックマーク機能を使うにはログインしてください。
― 新着の感想 ―
このエピソードに感想はまだ書かれていません。
感想一覧
+注意+

特に記載なき場合、掲載されている作品はすべてフィクションであり実在の人物・団体等とは一切関係ありません。
特に記載なき場合、掲載されている作品の著作権は作者にあります(一部作品除く)。
作者以外の方による作品の引用を超える無断転載は禁止しており、行った場合、著作権法の違反となります。

この作品はリンクフリーです。ご自由にリンク(紹介)してください。
この作品はスマートフォン対応です。スマートフォンかパソコンかを自動で判別し、適切なページを表示します。

↑ページトップへ