第1話 情報集めが肝心や
プカー・エンターテイメント。これは人間界某所にある「西」において2001年に設立され、2004年3月31日深夜24時を持て分割した、トレーディングカードゲームを運営する団体だ
設立から分割まで、一貫して1人の中学生―当局による詮索を防ぐため、ここでは「一戸氏」と呼ぼう―によって運営されており、非営利団体であること、プカー・エンターテイメントが運営するトレーディングカードゲームは、他社が運営するトレーディングカードゲーム用のカードのうち、2タイトルのみだが使用を認めていることが特筆される
そこで、これらのトレーディングカードに書かれているHP、攻撃力、守備力の値は、かたは数十から百数十、かたや数百から数千であり、対戦に支障をきたす
そこは中学生、偏差値というものに出会った
偏差値を用いて2つのトレーディングカードゲームの数値を換算できないかと、一戸氏は考えた。つまり、他社の守備力2200ないしHP50を、プカー・エンターテイメント製カードの守備力でいうといくらにあたるのかを、それぞれのカードゲーム内で、いったん偏差値に直す
そして、その偏差値同士で対戦するのだ
理想を言えば、中学校の範囲であるy=ax+bで表現できるとなおよい
そもそもプカー・エンターテイメント製カードゲームは12禁でないから(一部カードに6禁がある)、小学生にもわかるルールが望ましい
その点、y=ax+bであれば「攻撃力にaをかけて、bを足す」といえるので、説明もやりやすくなる
だが、プカー・エンターテイメント製カードならいざ知らず、他社製のカードをすべて調べることは費用的にも時間的にも難しい
ここで母集団と標本という用語が現れる
母集団とは調べたい対象すべての集合、標本は調べたい対象から調べる対象ですと取り出したものの集合だ
取り出す方法は大きく分けて有意抽出と無作為抽出がある
では、どうやって取り出すべきだろうか??
カードゲームの攻略本を購入し、同書を標本とする?
不可。その本は特定のスターターパックや拡張パックに属しているカードしか掲載されていない、つまり既に有意抽出された標本だ
よって、その標本からどんな取り出し方をしても、無作為抽出された標本にならない
仮に「その時点で発行されているすべてのカードを掲載した攻略本」が手に入ったとしても、その時点では全数調査されたようなものだが、発行日の翌日以降、「発行日までに発行されたカードを有意抽出した標本」に成り下がるであろう
ランダムに選んだ拡張パックを購入する?
不可。その拡張パックの製造元は、そのパックに封入すべきカードから選んで製造している
母集団は「そのパックに属するカード」ではなく「そのトレーディングカードゲームのカード」といった方が近いから、その拡張パックは1回の有意抽出を経た標本から無作為抽出された標本と扱うことはできても、有意抽出されていない標本と扱うことはできない
中学生の遊び相手のデッキに入っているカードを調べる?
不可。その人はデッキを作るとき、どんなカードを入れれば強いデッキになるかを考えて作っている。つまり、その時点で有意抽出が行われている。そもそも、その人がカードを購入する時点で、気に入ったパックを選んでいれば、その時点で有意抽出だ
中学生が思いつく方法は、いずれも有意抽出となり、信憑性のあるデータが集まらない可能性が高い。
実は、総務省統計局にこのようなときのために標本を作る方法が書いてあるウェブサイトがある
しかしそのページは教師向けだ
「集めたデータを計算するため」ではなく「データを集めるため」の方法を教師向けの場所に書かざるを得ないのだから、その難易度は推して知るべし、であろう
ちなみに中学3年生の数学にも統計に関する項目はあるが、データの集め方についてはそれほど詳しく述べず、集めたデータをどう計算するかにほとんどを割いている
集落抽出法
この抽出方法は、母集団を構成する全種のものが何であるかがわかる一覧表が存在しないときにも使える方法だ
今調べようとしているものに当てはめると、スターターパックや拡張パック1種類を1個の集落とみなし、調査しようとする集落を選び、その集落に属するカードを全数調査する
もちろん。スターターパックや拡張パック全種の一覧表は必要だが、そのパックに属する全カードのリストよりは入手が容易であろう
二段抽出法
調査しようとする集落を選ぶところまでは集落抽出法と同じだ
しかし集落内でさらに無作為抽出するところが、集落抽出法との違いだ
もちろん集落抽出法より精度は落ちるが、調査対象の集落の数を増やすことで、その低下を補うことができる
しかし、プカー・エンターテイメントでは、親戚あるいはその知人からカードのコレクターがいないかを探してもらい、その人に会った上でカードを見せてもらいコピーさせてもらうことにするので、二段抽出法と集落抽出法では交通費が変わらないことから、二段抽出法の利点は零といってよい
こうして、プカー・エンターテイメントは集落抽出法を使うことにした
1回調べれば終わりではない。なぜならプカー・エンターテイメントが例えば2002年の8月に調査したとして、その翌日以降もカードは発行されるためだ
もし2002年8月のデータを永久に使い続けることにしたら、それは2002年8月以前に発行されたデータを有意抽出したことになってしまう
そのため半年おき、具体的には毎年8月と2月にエージェントがコレクターの現地に赴き、コレクターに見せてもらって上でコピーさせてもらうことにした
日付は指定するわ、パックは指定するわ、指定したパックに属するカードは全部コピーさせろだの、プカー・エンターテイメントには無礼な要求が多い
だから現地に足を運ぶのはせめてもの礼儀であろう
もちろん攻略本を買った方が安いのだが、親権者的にはそれをよしとしない
安いけどカードゲームのためにしか役立たないコストと、高いけどカードゲームのためだけではないコスト。後者を―費用が嵩むことを承知のうえで―よしとするのは親権者あるあるだ
これは同伴の有無にもいえる。中学生1人で旅行ならびに宿泊すれば、親権者同伴つまり2人でいくより大幅なコストダウンになる。ただし親権者は同意書を書く必要がある
同意書を書く手間及び親権者が同伴しないことによる不安要素は、親権者が同伴することを―費用が嵩むことを承知のうえで―よしとするのもまた、親権者あるあるだ
プカー・エンターテイメントは、採用する抽出方法を集落抽出法とすることを決めた
スターターパックや拡張パックなどを、1種類が集落1個に相当するとみなし、抽出する集落の数を決め、どの集落を抽出するかを決めるのだ
しかし、集落抽出法は、抽出する集落について「多ければ多いほど誤差が小さい」といえるが、何個抽出すればよいかは、一概にはいえない
プカー・エンターテイメントは、苦肉の策として、全体集合における集落がn個あるとき、全体集合から1個以上(n―1)個以下の数のうちいずれかの数だけ抽出することにし、その際における抽出対象を表計算ソフトの乱数により決定、協力者と連絡をとり、どのパックをコピーさせてもらえるかを交渉、それに合わせて抽出する対象とした
例えば、1番から10番までのスターターパックや拡張パック(集落)があるとする
ここから、1個から9個までの数を抽出―n個抽出することを「n号抽出」と呼ぼう―する場合の中擦出するパックを、乱数を使って決める
例えば、乱数を使って、1号抽出では4番、2号抽出では1番と5番、3号抽出では3番と6番と9番、という具合だ
もし、東北の協力者が2番、5番、9番をコピーさせてくれて、新大阪の協力者が1番、5番、6番をコピーさせてくれるとしたら、3号抽出は3番がないため使えない、2号抽出は東北で5番、新大阪で1番がコピーできるから、2号抽出をする、といった具合だ
ただし、この方法が統計学的に正しいかどうかは定かではない
参考資料
総務省統計局 統計学習の指導のために https://www.stat.go.jp/teacher/survey.html 2022年1月7日閲覧