パラドックス
病気遺伝子評価の取り組みがはじまったのと同じような時期に仕事における遺伝子情報活用の分野が生まれた。
この分野もはじめはスポーツ選手の骨格や筋肉のつき具合などといった外見的なものからだけではわからない
速筋線維と遅筋線維の割合や、
エネルギー変換効率のような代謝特性がどうなっているかを調べ、
対象選手が短距離走・長距離走どちらにむいているのか、
またどのようなトレーニングをするのが「効果的か」という指導のための補足情報として利用されたにすぎなかった。
オリンピックの各国代表になるような苛烈な競争を勝ち抜ける人間と一般人の遺伝子では何が違うものがあるのか?
トップ競技者にあって、成績を残せない競技者にはない遺伝因子がなんであるのかが調査された。
やがて同じような取り組みが重要な成果を残した科学者や上場企業の経営者、有名アーティストや技巧派としられるミュージシャンのような社会的地位を獲得した成功者をモデルとして分析されるようになった。
社会的成功にまで辿り着いたヒトの遺伝子を分析し一般人と比較したところ、そこにはなんらかの統計的差があるようにみえた。
病気のように比較的簡単に因果関係が証明できる簡単な分析だと研究者達は考えた。
!!
調べる対象を増やすだけで確実なものにできるぞ、と。
しかし、実際は観測対象者が増えるたびに誤発見率があがり科学的な統計のうえでは意味がないことになってしまう矛盾に苦しむことになった。
関係がありそうだと思われた遺伝子をもっているのに社会的成功をしていないヒトがいる、
逆に関連遺伝子を持っていないのに活躍しているヒトがいる。
集計母数が増えるにつれ検定値は下がり、例外が増えていく。
ビッグデータ・パラドックス。
関係する遺伝子の組み合わせは観測対象が増えるごとに莫大な数になり、当初考えられていたような単純な因果関係には収まりきらないことがわかりつつあった。
しかし、研究者達はそれを後天的な環境、獲得形質のせいだけにして諦めずサンプルバイアスを排除し、擬似相関を排除し数学的に処置可能な統計上有意な多因子形質を少しづつ特定し体系化するために地道な調査をおこなっていった。