学習ダイナミクスの場合
遺伝ダイナミクスの場合は、ある程度親子の戦略が一致していればプライスの共分散法の条件でC行動が増加することが分かった。しかし、学習ダイナミクスの場合は一般には増加するとは限らない。例えば、プレーヤーが小集団の中で戦略の模倣学習を行う場合には、小集団内では常にD行動の利得がC行動の利得を上回るのでC行動が集団内模倣学習で増加することはない。
あるいは試行錯誤学習の場合は、自分がC行動を採ったときの利得とD行動を採ったときの利得の大小でどちらを採るかがきまるので、
D(k-1)<C(k)
であるような社会的ジレンマ(弱いジレンマ)の場合は試行錯誤学習でC行動が増加するが
D(k-1)>C(k)
であるような社会的ジレンマ(強いジレンマ)の場合は試行錯誤学習でD行動が増加する。
同様に、プレーヤーが小集団内の戦略分布に最適反応する場合も弱いジレンマではC行動が増加するが、強いジレンマではD行動が増加するようになる。
以上の考察を一覧表にすると
学習タイプ\ジレンマ | 弱いジレンマ 強いジレンマ
---------------------------
試行錯誤 | C増加 D増加
集団内模倣 | D増加 D増加
集団間模倣 | CかD増加 CかD増加
最適反応 | C増加 D増加
となる。表中で集団間模倣とあるのは自分の所属する小集団外の誰かの戦略を模倣するタイプの学習で、C行動者の多い小集団のC行動者を模倣の対象として選んだ場合には、C行動が模倣される可能性があるので、CかD増加と表記してある。
この表から、弱いジレンマの場合にはC行動が増える場合が多いが、強いジレンマの場合は集団間模倣が生じる場合しかC行動が増加しないことがわかる。
といっても、集団間模倣で常にC行動が増加する訳ではないので、いかにそのための条件を考察してみよう。
簡単のために、すべての小集団は同じn人の人数を持ち、そのうちk人がC行動、n-k人がD行動を採る小集団がI(k)個存在するものと考える。
プレーヤーは微小時間dtの間にαdtの確率で戦略の見直しを行い、小集団内、小集団間を問わずに任意に一人選んだ参照者の利得が自分より高ければ参照者の戦略を採用し、さもなければそれまでの戦略を維持するものとする。
このとき例えばx人がC行動、n-x人がD行動を採る小集団でC行動の人数xが増える条件を考えてみる。微小時間dtの間にxαdt人のC行動者と(n-x)αdt人のD行動者が戦略の見直しを行うことになる。
ここでC行動者がランダムに一人選んだ対象者が「自分より利得の高いD行動者」である確率を考えてみる。yをD(y)=C(x)を満たす値とすると、全体集団のなかに「自分より利得の高いD行動者」は
Σ[k>y](n-k)I(k) 人
存在するので、そのような相手を参照する確率は
Σ[k>y](n-k)I(k)/(N-1)
となる(Nは全体集団の人数)。
したがって、この小集団で微小時間dtに戦略をCからDに変更する人数は
xαdtΣ[k>y](n-k)I(k)/(N-1)人
となる。
次にD行動者がランダムに一人選んだ対象者が「自分より利得の高いC行動者」である確率を考えてみると、zをC(z)=D(x)を満たす値とすると、
Σ[k>z]kI(k)/(N-1)
となる。
したがって、微小時間dtに戦略をDからCに変更する人数は
(n-x)αdtΣ[k>z]kI(k)/(N-1)人
となる。
これらより、微小時間dtの間のxの変化率は
dx/dt=α[(n-x)Σ[k>z]kI(k)-xΣ[k>y](n-k)I(k)]/(N-1)
と表すことができる。また、この小集団でxが増えるための必要十分条件は
(n-x)Σ[k>z]kI(k)>xΣ[k>y](n-k)I(k)
であることも分かる。
| 固定リンク | コメント (10) | トラックバック (0)
最近のコメント