2006年5月20日 (土)

学習ダイナミクスの場合

 遺伝ダイナミクスの場合は、ある程度親子の戦略が一致していればプライスの共分散法の条件でC行動が増加することが分かった。しかし、学習ダイナミクスの場合は一般には増加するとは限らない。例えば、プレーヤーが小集団の中で戦略の模倣学習を行う場合には、小集団内では常にD行動の利得がC行動の利得を上回るのでC行動が集団内模倣学習で増加することはない。

 あるいは試行錯誤学習の場合は、自分がC行動を採ったときの利得とD行動を採ったときの利得の大小でどちらを採るかがきまるので、

    D(k-1)<C(k)

であるような社会的ジレンマ(弱いジレンマ)の場合は試行錯誤学習でC行動が増加するが

    D(k-1)>C(k)

であるような社会的ジレンマ(強いジレンマ)の場合は試行錯誤学習でD行動が増加する。

 同様に、プレーヤーが小集団内の戦略分布に最適反応する場合も弱いジレンマではC行動が増加するが、強いジレンマではD行動が増加するようになる。

 以上の考察を一覧表にすると

  学習タイプ\ジレンマ | 弱いジレンマ 強いジレンマ

  ---------------------------

     試行錯誤    |  C増加    D増加

     集団内模倣   |  D増加    D増加

     集団間模倣   | CかD増加  CかD増加

     最適反応    |  C増加    D増加

となる。表中で集団間模倣とあるのは自分の所属する小集団外の誰かの戦略を模倣するタイプの学習で、C行動者の多い小集団のC行動者を模倣の対象として選んだ場合には、C行動が模倣される可能性があるので、CかD増加と表記してある。

 この表から、弱いジレンマの場合にはC行動が増える場合が多いが、強いジレンマの場合は集団間模倣が生じる場合しかC行動が増加しないことがわかる。

 といっても、集団間模倣で常にC行動が増加する訳ではないので、いかにそのための条件を考察してみよう。

 簡単のために、すべての小集団は同じn人の人数を持ち、そのうちk人がC行動、n-k人がD行動を採る小集団がI(k)個存在するものと考える。

 プレーヤーは微小時間dtの間にαdtの確率で戦略の見直しを行い、小集団内、小集団間を問わずに任意に一人選んだ参照者の利得が自分より高ければ参照者の戦略を採用し、さもなければそれまでの戦略を維持するものとする。

 このとき例えばx人がC行動、n-x人がD行動を採る小集団でC行動の人数xが増える条件を考えてみる。微小時間dtの間にxαdt人のC行動者と(n-x)αdt人のD行動者が戦略の見直しを行うことになる。

 ここでC行動者がランダムに一人選んだ対象者が「自分より利得の高いD行動者」である確率を考えてみる。yをD(y)=C(x)を満たす値とすると、全体集団のなかに「自分より利得の高いD行動者」は

    Σ[k>y](n-k)I(k) 人

存在するので、そのような相手を参照する確率は

    Σ[k>y](n-k)I(k)/(N-1)

となる(Nは全体集団の人数)。  

 したがって、この小集団で微小時間dtに戦略をCからDに変更する人数は

    xαdtΣ[k>y](n-k)I(k)/(N-1)人

となる。

 次にD行動者がランダムに一人選んだ対象者が「自分より利得の高いC行動者」である確率を考えてみると、zをC(z)=D(x)を満たす値とすると、

    Σ[k>z]kI(k)/(N-1)

となる。

 したがって、微小時間dtに戦略をDからCに変更する人数は

    (n-x)αdtΣ[k>z]kI(k)/(N-1)人

となる。

 これらより、微小時間dtの間のxの変化率は

    dx/dt=α[(n-x)Σ[k>z]kI(k)-xΣ[k>y](n-k)I(k)]/(N-1) 

と表すことができる。また、この小集団でxが増えるための必要十分条件は

    (n-x)Σ[k>z]kI(k)>xΣ[k>y](n-k)I(k) 

であることも分かる。

| | コメント (10) | トラックバック (0)

遺伝ダイナミクスの場合

 プライスの共分散法はC行動の平均利得がD行動の平均利得を上回る必要十分条件を示しているが、後で示すように学習ダイナミクスの場合はこの条件が成立していてもC行動が増加するとは限らない。

 しかし、遺伝ダイナミクスの場合は

  ・利得が適応度(子供の数の平均)を示す

  ・親子の戦略が完全に一致する

の2条件を満たすときには平均利得の高い行動が増加することが知られている(レプリケーターダイナミクス)。

 ただし、親子の戦略が完全に一致することは通常はありえないので、ここでは親子の戦略がある程度は一致するがある程度は異なる場合も考えておこう。

 C行動を採る親からC行動を採る子供が生まれる確率をp、D行動を採る子供が生まれる確率を1-pとする。同様に、D行動を採る親からD行動を採る子供が生まれる確率をp、C行動を採る子供が生まれる確率を1-pとする。またC行動を採る親の子供の数の平均(平均適応度)をwc、D行動を採る親の平均適応度をwdとする。

 現在N人中Nx人がC行動を採る親で、N(1-x)人がD行動を採る親であるとすると、次の世代でC行動を採る人は

    Nxpwc+N(1-x)(1-p)wd 人

D行動を採る人は

    Nx(1-p)wc+N(1-x)pwd 人

となる。

 これより、次世代でC行動を採る人の割合x'は

    x'=[Nxpwc+N(1-x)(1-p)wd]/[Nxwc+N(1-x)wd] 

      =[xpwc+(1-x)(1-p)wd]/[xwc+(1-x)wd] 

 この式をx'>xに代入して整理すると、次世代でC行動を採る人の割合が現在よりも増加する必要十分条件はp>1/2のときには

     wc>wd

であることが分かる。

 p>1/2は子供の戦略がある程度親の戦略と一致していることを示しているので、その場合には適応度で表した利得が

     Cov(xi,ui)+E[xi(1-xi)Δui]>0

を満たすときにはwc>wdとなるので、子供の代でC行動の割合が増加することが分かる。

| | コメント (0) | トラックバック (0)

協力行動が増加する条件について

 社会的ジレンマ状況におけるC行動は、通常D行動よりも利得が低いため、遺伝ダイナミクスや学習ダイナミクスで増加することはない。しかし、小集団がいくつか存在して、行為の外部性の及ぶ範囲が小集団内部に限定される場合には、集団全体の平均利得でC行動の利得がD行動の利得を上回る場合が存在、そのための条件が知られている(プライスの共分散法。Price 1970)。

 ただし社会的ジレンマの場合、平均利得で上回るだけではC行動が自動的に増えるわけではない。本報告では、遺伝ダイナミクスの場合と学習ダイナミクスの場合にわけて、C行動が増加する条件を探ることを試みる。

  1 プライスの共分散法

 まず、プライスの共分散法について紹介する。

 全体集団の中に小集団がm個存在し、それぞれの小集団で社会的ジレンマゲームが行われているとする。ここでi番目の小集団の

    人数をni

    C行動者の割合をxi

    C行動者の利得をuic、D行動者の利得をuid

    利得の差をΔui=uic-uid

    小集団全体の平均利得をui

とする。社会的ジレンマ状況では一般に小集団内部ではC行動よりD行動の利得が高いので

    Δui=uic-uid<0

である。一方、C行動者を多く含む小集団ほど平均利得が高いので

    ov(xi,ui)>0

となる。ここでCov(xi,ui)はxiとuiの重み付き共分散で

    Cov(xi,ui)=Σni(xi-x)(ui-u)/Σni

で定義される(ただしx=Σnixi/Σni、u=Σniui/Σni)。  

 このとき、全体集団において

    C行動の平均利得>D行動の平均利得

となる必要十分条件は

    Cov(xi,ui)+E[xi(1-xi)Δui]>0

である(プライスの共分散法)。ここでEは重み付き平均で

    E[xi(1-xi)Δui]=Σnixi(1-xi)Δui/Σni

で定義される。

| | コメント (0) | トラックバック (0)

2006年4月 7日 (金)

プライスの共分散法の証明

小集団が幾つか集まって全体集団をつくっているとき、全体集団のなかでの戦略Aの平均利得が戦略Bの平均利得を上回るための必要十分条件は

   Cov(xi,ui)+E[xi(1-xi)Δui]>0

である。 ただし
   xiは小集団 I における戦略Aの割合
   uiは小集団 I の平均利得
   Δuiは小集団 I におけるAとBの平均利得の差
   Covは小集団の大きさniで重みづけた共分散
   Eは小集団の大きさniで重みづけた重み付き平均
である。

 [証明]
    N=Σni    (全体集団の人数)
    x=Σnixi/N (全体集団でのAの割合)
    u=Σniui/N (全体集団の平均利得)  とすると

  E[xi(1-xi)Δui]=Σnixi(1-xi)Δui/N
  Cov(xi,ui)=Σni(xi-x)(ui-u)/N
       =Σnixiui/N-uΣnixi/N-xΣniui/N+xuΣni/N
       =Σnixiui/N-ux-xu+xu
       =Σnixiui/N-xu 
である。

  これらを
  Cov(xi,ui)+E[xi(1-xi)Δui]>0 に代入すると
  Σnixiui/N-xu+Σnixi(1-xi)Δui/N>0
  Σnixiui-Nxu+Σnixi(1-xi)Δui>0 式1

  ここで
   ui=xiuia+(1-xi)uib
     =xi(uia-uib)+uib
     =xiΔui+uib
 なので、これを式1に代入すると
   Σnixi(xiΔui+uib)-Nxu+Σnixi(1-xi)Δui>0
   ΣnixixiΔui+Σnixiuib-Nxu+ΣnixiΔui-ΣnixixiΔui>0
   Σnixiuib+ΣnixiΔui-Nxu>0
   Σnixiuia-Nxu>0 (∵Δui=uia-uib)

 これに
   Nu=Σniui
     =Σni(xiuia+(1-xi)uib) を代入すると

   Σnixiuia-xΣni(xiuia+(1-xi)uib)>0
   Σnixiuia-xΣnixiuia-xΣni(1-xi)uib>0
   (1-x)Σnixiuia>xΣni(1-xi)uib
   Σnixiuia/x>Σni(1-xi)uib/(1-x)

 この式の左辺は全体集団におけるAの平均利得、右辺は全体集団におけるBの平均利得をあらわす。  

 したがって
   Cov(xi,ui)+E[xi(1-xi)Δui]>0
 ならば、全体集団において
   Aの平均利得>Bの平均利得 が成立するし、その逆も成立する。
                                           [証明終わり]

 関連記事:「社会的ジレンマとプライスの共分散法

| | コメント (0) | トラックバック (1)