実験が示す国際関係における誠実さの価値 2024.08.06
「囚人のジレンマ」の国際関係
国際関係は「囚人のジレンマ」にあると言われます。囚人のジレンマとは、皆による協力が恩恵をもたらすにもかかわらず、各々が協力の負担を避けようと抜け駆けする結果、その恩恵を得ることができず悪い状態から抜け出せない社会状況を指します。気候変動問題は、これが当てはまる例です。国々が協力し、地球全体で温室効果ガスを削減すれば現在よりもよい環境を作ることができます。しかしこの協力のためには、設備投資や人々の我慢といったコストが国々にかかります。そこで諸国は、他国にこのコストを負ってもらって問題を解消し、自分だけは負担なしで恩恵を受けたいと考えます。多くの国がこう考えることで、削減努力は遅々として進みません。未曽有の猛暑・大水害・大干ばつに見舞われる現状は、こうして続いていきます。協力による温室効果ガス削減が望ましいにもかかわらず、利己的な誘惑に駆られて世界の国々はそれができないということです。
囚人のジレンマにある国々が「協力」「非協力」の行動選択を行う機会は、たびたび訪れます。気候変動問題であれば、国連気候変動枠組条約締約国会議(COP)はそうした場です。ほぼ毎年開催されてきたこの会議は、すでに30回近く行われました。この例のように、囚人のジレンマにおいて何度も行動選択の機会がある状況は「繰り返し囚人のジレンマ」と呼ばれます。
囚人のジレンマ・コンテスト
繰り返し囚人のジレンマを特徴とする国際関係において、国々は国益を高めることに邁進しているわけですが、それはどうすればうまくいくのでしょうか。政治学者ロバート・アクセルロッドが、この問いに答えるべく考え出したのが繰り返し囚人のジレンマ・コンテストでした。その成果は1980年代の社会科学論文の中で最も引用された論文の一つとなり、同氏は一時期ノーベル経済学賞の候補ともなりました。
コンテストでは次のような囚人のジレンマを考えます。2つの国家が対峙し、国家は協力と非協力の2つの選択肢を持ちます。互いに協力すればともに3点を獲得します。他方、互いに非協力であれば、それぞれ1点となります。自分は非協力で相手が協力を選択すると、ズルをした非協力側は5点を得ますが、協力し出し抜かれた側は0点になってしまいます。じゃんけんのようなものを想像してください。ともに協力を出せば互いに3点、一方が協力で他方が非協力であればそれぞれ0点と5点という具合です。
コンテストにおいてプレーヤー(国家)は、「協力」「非協力」の選択を繰り返します。この毎回の行動の決定方法を戦略と呼びます。例えば、「毎回協力する」というのも戦略の一つであり、「コインを投げて半々の確率で協力と非協力を出す」というのも戦略です。アクセルロッドは、コンピュータ・プログラムにした戦略をコンテストに応募してもらい、どの戦略が最も得点を得ることができるかをみてみることにしました(コンピュータ・シミュレーション)。すべての戦略は総当たりで対戦し、全対戦の総計で最も得点を稼いだものが優勝とされました。
得をするのは誠実な者
コンテストの優勝者は、思いがけずTIT FOR TAT(目には目を)という戦略でした。この戦略は協力で始め、繰り返す中で相手が非協力を出した場合には次回非協力で応酬する、しかし相手が協力に戻ればこちらも協力に戻るという戦略です。「目は目を」というわけです。「思いがけず」と書きましたが、この結果が驚きであったのは、相手を出し抜きたくなる「囚人のジレンマ」状況であるにもかかわらず、相手が裏切らない限り「自分からは決して裏切らない」という誠実(nice)な振る舞いをする戦略が勝利したという点にあります。確かに一度きりであれば5点を取って裏切ったものの勝ちです。しかし、国際社会のように何度も繰り返される状況では、(TIT FOR TATはすべての戦略に勝利するわけではないので)相手によっては時に負けることがあっても、全体としてみれば、結局は誠実な者が最も得をするという結果だったわけです。この場合の「誠実な行動」とは自分からは裏切らない行動であるので、この教訓を踏まえて多くの国家が誠実な行動をとるならば、国際協調が生まれます。対立に満ちた国際社会に希望を与える含意でした。
「誠実さ」の頑健性
とはいえ、ここで胡散臭さを感じないでしょうか。コンテストは、応募してきた戦略のみで競われています。しかし戦略のタイプには、無数のパターンを思いつきます。つまりコンテストの結果は、ごく限られた戦略から得られた結果に過ぎません。このような偏りのある事例のみから得られた結果を一般化することはできません。他方、無数想定される戦略すべての対戦や戦略のランダム・サンプル抽出は、この場合、現実的には不可能です。考えうる次善策の一つは、アクセルロッドの実験とは異なる戦略同士で対戦が行われても同じ結果を得ることができるかどうかをみてみることです。
筆者の研究室(ゼミ)では、学生たちがコンテストの応募者となり、その戦略を対戦させる実験を行いました。するとアクセルロッド実験とは異なり、TIT FOR TATは13戦略のうち5番目でした。「誠実さが得をもたらし、協調が生まれたのはたまたまか」とがっかりしそうですが、それは少し早計です。誠実な行動とは自ら裏切ることはないタイプのあらゆる行動を指しますから、TIT FOR TATはその一つに過ぎません。アクセルロッドのコンテストの結果に関してはTIT FOR TATばかりが注目を集めましたが、彼の実験ではTIT FOR TAT以外も含めたほとんどの誠実な戦略が順位の上位を占めていました。我々の実験では誠実な戦略は6つでしたが、実にそれらが上位6位までを独占しました。同様の実験を行ったチームは我々以外にも多くあり、おそらく同じような結果を出してきたと想像されます。
あまり論じられることはないのですが、アクセルロッドの研究が一般性を欠くにもかかわらず、ここまで注目された理由はここにあります。分析モデルの様々な条件を変えてもその結果が変わらないことを頑健であると言います。囚人のジレンマ・コンテストは、「誠実さの強さ」に関して頑健性を持っているわけです。
コンテストが与える真の含意
TIT FOR TATは誠実な行動である一方、相手の悪行に対しては制裁を行うという攻撃的な性格も持っており、むしろこの点が強調されてきました。1980年代の日米貿易摩擦に際して、日本の「不公正貿易」に対して制裁で対抗するとういうアメリカの政策は今でも話題に取り上げられますが、アクセルロッドの研究はその理論的根拠を与えたとも言われています。現在の対中国貿易におけるアメリカの政策にもその影響がみられるでしょう。しかし我々の実験が示すように、誠実な戦略の中ではTIT FOR TAT自体は頑健ではありません。すなわち、国の利益と国際協調を推進するために強調されるべきは制裁の効果ではなく、誠実さの重要性なのです。さらに言えば、誠実さは備えないが制裁は行うという戦略もありえます。しかし、単に制裁を行うだけのそのような戦略は、コンテストにおいて上位になることはないでしょう。
「自分からは裏切らないことが結局は自身の利益となり、それがまた社会の協調も実現する」という含意をどう受け止めるでしょうか。囚人のジレンマ・コンテストの教訓は、国際関係に限られたものではありません。企業同士や友人同士と、あらゆる人間関係に通じます。身の回りから世界情勢まで、我々は一度しっかり見渡してみる必要があるかもしれません。
文献案内
ロバート・アクセルロッド『つきあい方の科学: バクテリアから国際関係まで』(松田裕之訳)、ミネルヴァ書房、1998年(原著1984年)。誠実さ(nice)は上品さと訳されています。
Kazuya Yamamoto, (2024). “Axelrod’s Round-Robin Contest in a Classroom Setting,” WIAS Research Bulletin 16: 25–29.