心の実験の再現性
科学的根拠を得るにはそれなりの壁を超えなければなりません。本日は、心理『学』がどのようにして理論を組み立て論文を発表しているのか、なんて流れを説明していきます。
以前、どこかで(どこだよ)精神科医に『ふつうの人』を送り込み、精神科医に診断を誤らせるという実験を紹介しました。ざっくり要約すれば、精神科に関しては患者が本当に精神疾患を患っているかについて見抜くのが難しい、という話です。だからこそ、現代の精神科医のみなさんは長期的に患者さんと向き合い、あるタイミングではある病名がつき、経過とともに患者が患う病名も変化していくような形になることがわりとあるようです。ちょっと考えてみてください。アナタ方は24時間365日同じような精神状態でいるでしょうか? ありえませんよね? 常に24時間怒っている人、常に24時間楽しい気分でいる人なんて『まったくいない』と断言できるレベルです。ときには不安になることもあり、時にはこの上なくハイな気分になることだってある。怒りだって覚えるし悲しみに苛まれなかなか抜け出せない時間もあります。人間の心とはそういうもの。あちこちに気持ちが揺らいでいく心に対して「これだ」なんて短絡的に決めつけることはできません。精神疾患も、たしかに『ある状態になったらこういう病名だ』という決まりはありますが、曖昧な心の世界ではちょっと揺れ動いただけで別の病気の『け』が芽吹くこともあります。
このように、人間の『心』とはどうにもならないくらい、ままならぬものなのです。
しかし『心理学は科学』です。いくら曖昧なものであっても、先程申し上げた通りに『○○だったら○○という病気だ』という約束事があります。こういった定義があって、一連の規則に従っての科学的研究をするからこそ、語尾に『学』がつくことを許されています。心理学は心という曖昧な世界を研究する故に、より精巧かつ正確な研究が求められます。
科学的研究において『追試』というものがあり、ある研究所である現象を発見し、それを論文として発表した際、その論文が正しいかどうかは『他の研究機関によって同じことを実行し、論文内容と同じ結果が生まれた』かどうかによって信憑性が問われます。例えば以前騒動になった『stap細胞』なんかは、そもそも他の研究機関でそこまで再現性が確認できなかったにも関わらず、名前だけが有名になってしまったようですね。だからこそ、科学という分野は慎重に検証を繰り返し、論文の内容に充分なエビデンスがとれた段階で騒ぎまくるべきなのです。いや騒ぎまくるのはアレかな。
この科学的手法を1から通して見てみましょう。まず研究者は自らの観察眼により外界を観察します。そこにある解決すべき問題を見出したのなら、それについて考え、可能性のある解決策の答えを示す必要があります。これを『仮説』と呼びます。カンタンに例えると「サイフを落としたとき、いったいどれほどの人が落とした人にサイフを手渡してくれるだろうか(問題の発見)? だいたい半分くらいの人が教えてくれるんじゃないかな(仮説)?」みたいなイメージです。
仮説をたてたのなら、次は『検証』をしなければなりませんね。数ある実験のなかで、アナタが『このやり方でならナゾが判明するはずだ』と思えるような手段を探して実行します。この実験を正しく行うことも大切で、徹底的に余計な要素を排除する必要があり、さらにデータを集める上で特定の層に偏らないようにしなければなりません。例えば、先程の例をあげれば『街なかを歩きわざとサイフを落として、それを見ていた人がどのような行動をするかモニタリングする』というのが適切でしょう。ただし、対象者が『全て男性だ、とかすべて60代以上の高齢者だった』などではまるで意味がありません。『人の心を科学する』とある通り、この"人"には『乳児などの例外を除いたあらゆる層の人間すべて』が入るわけですから、性別も年齢層も何もかもを無造作に、ランダムに、そして充分な母数として確保できる量を研究しなければなりません。
ある程度の数をこなして、充分なデータがとれたらそれを『統計』にかけます。心理学は、実はものすごく『統計学』の知識が必要になります。統計はざっくり説明すれば『データの法則性をシンプルに表現する図をつくる』というイメージです。突然ですが、ある祭場にやってきたお客さんの人数と身長を調べることになりました。そこで、身長ごとの人数を棒グラフや折れ線グラフなどで作ったとき、おそらく『150cm台と170cm台にふたつの山ができる』ような形になると思います。しかしこれ統計学上のグラフとしてはよろしくありません。カンタンな例ですから、これは『ああ、女性と男性の平均身長のところだけ膨らんだんだな』ということはわかりますが、複雑化した統計データではこういった要素を予め排除することが望ましいです。統計学では『山がひとつにならなければ良いグラフとは呼べません』。山がいくつもあれば『複数の法則が複雑に絡み合っている』という証左になりますからね。
さて、これらの山を乗り越えて、アナタはこの実験を論文にまとめました。しかしそれだけでは終わりません。はじめに申し上げた通り、その論文の内容が本当に正しいかどうかを他の研究機関でテストしてもらいましょう。
例えば、アナタは上記の実験を『東京都のある街』で行ったとします。その場合、追試は『大阪の〇〇市』とか『鹿児島の〇〇市』とか『宮城の〇〇市』などまるべ別の環境である必要があります。そうすることで、アナタが建てた仮説は『その地方独自のものではない』という説明に繋がります。複数の場所で同じ条件、内容で検討を重ね、大まかに認められたとき、はじめてアナタの論文が認められる、すなわち『科学的に正しい』という結論にたどり着くわけです。
いやぁわりと遠い道のりですね。心という曖昧な産物に関して言えばさらに複雑な問題を孕んでいます。というのも、心のあるひとつの現象を調べる、という意味において、常に変動する心がその条件に合うかどうかなんて誰にもわからないからです。
2015年のこと、ある心理学研究のプロジェクトが再吟味され、その結果研究の半分以上が同じ結果を再現できませんでした。100件を越える心理学の実験ひとつひとつを、大規模な研究チームはそれぞれ吟味し検証、追試してきました。そうしたら、なんと100件のうちわずか36件だけが、オリジナルの研究と同じ結果が得られた、という結果になりました。
なぜ? どうして? 多くの方がそう思うでしょう。科学的に証明されたはずの理論が再検証された結果64件も同じ結論に達しなかったというのです。ナニがおかしかったのでしょう? 実験環境? 対象者? 時間? 季節? ――問題はまさに『そこ』にあります。
何が不確かだったからこのような結果になったのか? それがわからないのです。
この問題はそれだけにとどまりません。ただ1度のプロジェクトでも、100件中64件もの不再現性が見つかったということは、心理学の分野における他の実験さえも、再現性が得られないのではないか? という大きな示唆を表しています。よくよく考えていると、これは大きな問題です。大げさなことを申し上げれば、これまでの心理学的理論の64%が根拠無しです、と言っているようなものですからね。この『再現可能性』の危機はみなさんが想像している以上に学会では大事になりそうなものです。いえ、これは心理学界のみならず『科学界全てにおいて』同じことが言えるかもしれません。この再現可能性の危機は、もしかしたら『心理学による発見』と言い換えられるのかもしれませんね。
心理学の実験をするということは、必ず参加者の人間がいる、ということです。それらには個性があり、個々の信念があり、行動する根拠があります。それらの方々に対して説明し、同じ条件になれるよう努力することは並大抵のものではありません。だれもが同じ条件に立ち、同じ実験をし、心理として科学的に根拠のとれたデータを得る、というのはおそらく私や皆さんが想像しているよりも難しい作業なのだと思います。ただ、このようにして再現性がないというのは、我々にとってはとても喜ばしいことなのかもしれません。
それこそ、人間が『個性をもっていて、心は科学できない』という証左になるのですから。
科学ノ進歩、発展ニ犠牲ハツキモノデース




