2話 開票率1%で当選確実が出る選挙の謎
読み飛ばし推奨
概要は「評価をつけた作品一覧」が0作品の利用者の割合を調べる方法の検討 です
「評価をつけた作品」が0作品の利用者を探そうと思っても、「小説家になろう」にそのような機能はありません。
小説家になろうの「ユーザ検索」では、作品投稿数0件のユーザ数やレビュー0回のユーザ数を調べる事は(強引に)できます。しかし「評価をつけた作品」に関する条件指定はできません。
そこで統計的手法です。とはいえ統計、全く知りません。適当な数のマイページを眺めていけばいいでしょう。
さて、どの程度が適当な数でしょうか。
世論調査では1500~2000人程度を対象としてアンケートを取るようです。信頼度95%、許容誤差2.5%としたときサンプルサイズは1537人でいい、とネット検索したら出てきました。意味がわかりません。
もう少し調べると、母集団としてユーザ数80万人の「小説家になろう」の場合、1534人でいいことが計算できました。調べるユーザ数が減ってホッとしました。
偏向なくサンプリングするため、誰のマイページを参照するかはユーザIDで決めることにします。初期のユーザから最近のユーザまで網羅するといい気がします。
さきほどの「ユーザ検索」の「新着順」で並べ替えると、ユーザID逆順で全員のマイページへのリンクが表示されます。ただURLで直接ユーザID指定の方が早いです。
http://mypage.syosetu.com/mypagenovelhyoka/list/userid/(ユーザID)/
誰も真似する人もいないでしょうけど、注意点として、多くのページを見るときはWebサーバの負担をかけないように、間隔を開けてアクセスするのが重要です。利用規約 第14条20項に該当しないよう注意しましょう。あと岡崎市立中央図書館事件でネット検索。
アクセス間隔はrobots.txtも参考になるでしょう。
http://mypage.syosetu.com/robots.txt
なろうデベロッパーを使うわけでもないですし、「利用制限は現在休止しています」と書かれていますが、なろうデベロッパーの利用制限も参考になるでしょう。
http://dev.syosetu.com/man/api/#link8
なろうユーザAPI、いつ準備終わるん