社会論:共通バイアスと報酬予想誤差
共通バイアスと報酬予測誤差
― 振れ幅が作る「当たり前」の正体 ―
(観測的整理)
0. 位置づけ
本稿は、
個人の性格や知性を論じるものではない。
社会や集団において、
なぜ似た判断の偏り(共通バイアス)が、
同時多発的に現れるのか
を、
報酬予測誤差(Reward Prediction Error, RPE)という
観測可能な更新信号の観点から整理する。
1. 共通バイアスとは何か
共通バイアスとは、
多数の個体が、
独立に考えているつもりで、
似た判断・評価・反応を示す状態
を指す。
これは:
•洗脳
•同調圧力
•知性の欠如
ではなく、
同じ入力分布に晒された学習器が、
似た更新を行った結果
として説明できる。
2. 閾値は「絶対値」ではない
意思決定や評価における閾値は、
•固定された基準
ではなく
•直近の経験分布に対する相対量
として設定される。
つまり、
•何が「良い/悪い」か
•何が「許容/危険」か
は、
過去の振れ幅によって動的に変化する。
3. 振れ幅が大きいと何が起きるか
戦争・災害・急激な社会変動など、
極端な経験が続くと:
1.期待値が破壊される
2.評価閾値が再配置される
3.期待と結果のズレが
報酬予測誤差として可視化される
このRPEは、
感情や理念になる前に、
更新信号として処理される
4. 共通バイアスは「誤差入力の共有」から生じる
同じ社会に生きる人々は、
•同じニュース
•同じ出来事
•同じ制度変更
に晒される。
結果として:
似たRPEを、
同時期に入力される
このとき、
•判断の方向
•危険認知
•道徳的評価
が、自然に揃う。
これが共通バイアスの実体である。
5. バイアスは「間違い」ではない
重要なのは、
共通バイアスは
必ずしも誤りではない
という点である。
それは:
•学習器として
•生存のために
•最短で更新した結果
であり、
過去の振れ幅に対する、
正常な適応反応
である場合が多い。
6. 歴史的政策との接続(例)
大きな社会的振れ幅の後に、
•極端な倫理政策
•過剰な安全志向
•逆方向への急旋回
が現れるのは、
巨大な報酬予測誤差が、
集団規模で可視化された結果
と理解できる。
これは誰かの暴走ではなく、
更新信号に対する、
集団的応答
である。
7. なぜ「自然発生的」に見えるのか
RPEは:
•無意識的
•非言語的
•数値的
に処理される。
そのため、
誰も「決めていない」のに、
似た判断が増える
という現象が起きる。
これが、
共通バイアスが
自然発生的に見える理由
である。
8. 注意点(重要)
•共通バイアスは永続しない
•入力分布が変われば更新される
•固定化すると、
別の歪みを生む
したがって、
バイアスを否定するより、
更新条件を観測する方が有益
である。
9. 結論
共通バイアスとは、
多数の個体が、
同じ振れ幅を経験し、
同じ報酬予測誤差を入力され、
似た更新を行った結果
に過ぎない。
それは:
•愚かさの証明ではなく
•悪意の産物でもなく
学習器としての、
ごく自然な振る舞い
である。
超圧縮まとめ(1行)
共通バイアスは、
同じ振れ幅に晒された社会が、
同じ報酬予測誤差で更新された痕跡である。




