죄수의 딜레마

죄수의 딜레마(prisoner's dilemma)

죄수의 딜레마(prisoner's dilemma)란, 협동을 하면 모두에게 이익이 됨에도 불구하고 배반을 선택하게 되는 상황을 말한다. 흔히 '죄수의 딜레마' 라고 부르며 용의자의 딜레마, 수인의 번민 (囚人의 煩悶) 이라고도 한다. 1950년에 미국 랜드 연구소(RAND Corporation)에서 두 과학자 메릴 플러드(Merrill Flood)와 멜빈 드레셔(Melvin Dresher)가 사람들의 협력과 갈등에 관한 게임 이론에 대해 시행한 연구에서 시작되었다. 이후 랜드 연구소의 고문 앨버트 터커(Albert W. Tucker)가 이 게임이론에 ‘prisoner's dilemma’라는 이름을 붙였다.

개요

죄수의 딜레마는 게임 이론의 대표적인 예시 중 하나이다. 비 제로섬 게임(non zero-sum game)의 일종으로, 협력적인 선택이 최선의 선택임에도 불구하고 자신의 이익에 치중한 이기적인 선택으로 인해 결국 서로에게 나쁜 결과를 야기하는 현상을 말한다. 경쟁자의 전략에 대응해 최선의 선택을 하면 서로 자신의 선택을 바꾸지 않는 균형상태를 보이게 된다는 내시균형 이론이나, 어느 한 쪽이 양보하지 않을 경우 양쪽 모두 파국으로 치닫게 되는 치킨게임 이론과 함께 다뤄지는 경우가 많다. 미시경제학에서 시작되어 심리학, 생물학, 정치학 등의 다양한 학문에 큰 영향을 끼쳤으며, 서로에게 더 좋은 결과가 있음에도 불구하고 서로에게 더 나쁜 결과로 귀착된다는 점에서 수많은 경제적, 사회적인 현상을 시사하는 대표적인 게임이론이다.

이론 및 예제

죄수의 딜레마(prisoner's dilemma) 예제

앨버트 터커의 예제

앨버트 터커(Albert W. Tucker)는 프린스턴 대학교의 수학자 출신이다. 그는 랜드 연구소의 고문을 맡아 게임 이론을 설명하는 강연을 진행하면서 처음으로 이 게임이론에 '죄수의 딜레마'(prisoner's dilemma) 라는 이름을 붙였다. 다음은 앨버트 터커가 강연에서 제시한 예제이다.

두 명의 범죄 조직원 C,D가 체포되어 왔다. 이 범죄자들은 각각 독방에 수감되어 서로 교류할 수 없는 상황이다. 경찰은 두 명의 공범을 기소하기 위한 증거가 부족한 상황이다. 이러한 상황에서 경찰은 이들에게 자백을 받아 범죄를 입증할 방법을 세우고, 각 범죄자들을 대상으로 신문을 한다. 이때 경찰은 두 공범에게 동일한 제안을 건넨다. 다른 한 명의 공범에 대해 자백을 하면 자백한 그 사람은 석방해주는 반면에, 다른 공범은 징역 3년을 선고받게 된다는 것이다. 이는 상대편 공범이 자백을 했을 경우에도 성립한다. 누구든 자백을 하면 자백을 한 사람은 석방되지만 상대편 공범은 3년의 징역을 받는다. 그러나 두 공범이 모두 자백을 하면 각각 징역 2년을 받으며, 둘다 자백하지 않고 묵비권을 행사하면 증거 불충분으로 각각 징역 1년을 받게 된다.

이는 죄수의 딜레마의 가장 대표적인 사례이다. 상대방이 배신하지 않고 자백하지 않을 것이라는 강한 믿음을 가지고 있다면 묵비권을 행사할 가능성이 높다. 또한 상대편 공범도 동일한 선택을 한다면 서로에게 최선인 결과, 즉 1년의 징역을 얻게 될 것이다. 그러나 상대방을 믿지 못한다면 상대방이 자백을 해서 구형을 받게 되는 일이 일어나는 것이 두려울 것이다. 결국 두 사람은 서로를 믿지 못하고 자백을 하게 되어 두 사람 모두 징역 2년을 선고받을 가능성이 높다. 대부분의 사람은 자신의 이익을 고려해서 공공의 이익이 아닌 '자신'에게 최선인 선택을 한다. 그래서 서로를 배신하지 않고 협조했을 때의 결과보다 나쁜 결과를 맞게 된다. 이러한 상황에서 상대편 공범이 협조를 선택했을 때 또 다른 공범이 묵비권을 행사함으로써 협조를 선택하는 것보다 공범을 배신하는것이 이득이 된다. 상대편 공범이 배신을 하는 상황을 고려해봐도 역시 자신이 묵비권을 행사하여 징역 3년을 받는 것 보다는, 상대방을 배신하여 징역 2년을 받는 것이 이득이 된다. 모두가 배신하는 선택을 했을 때 이는 내시균형(Nash equilibrium)을 만족한다. 이는 개인에게 있어서 최선의 선택이 서로에게 최선의 결과를 가져오진 않는다는 것을 보여주는 예시이다.

냉전 시대

제 2차 세계대전 이후 냉전 시대가 열렸다. 미국과 소련은 어느 한 쪽이 무기를 만들어내면, 다른 한 쪽은 더 나은 무기를 만들어 내는 식의 군비 경쟁을 펼쳤다. 그러나 무기 개발은 막대한 자원 소모 및 경제적 손실을 야기하고, 서로 만들어낸 핵무기를 사용하게 되면 거대한 핵전쟁이 발생하여 지구가 멸망에 가까운 위기를 맞을 수 있다는 문제 때문에 미국과 소련은 더이상 무기를 개발하지 말자는 약속을 했다. ^[1] 여기서 딜레마가 발생한다. 서로 약속은 했으나, 상대방이 핵무기를 개발할지 개발하지 않을지 알 수 없는 상황에서는 각자 핵무기를 개발하는 것이 최선의 선택이 되기 때문이다. 물론 양국에서 서로 무기를 만들어내지 않는다는 선택을 해서 평화를 맞을 수 있는 상황이 가장 최선이지만, 한 국가의 입장에선 타국의 핵무기 보유 여부를 알 수 없는 상황에 무기를 개발하지 않는다는 선택을 내린다면, 타국은 핵을 보유하여 자국의 군비를 압도하게 되는 최악의 상황에 놓이게 될 수 있다. 그러나 핵을 개발하는 선택을 한다면 최소한 타국과 핵 군비 균형을 이룰 수 있기 때문에 자국의 입장에서 합리적인 선택이라고 볼 수 있다. 결국 양국은 군비 경쟁을 하게 되었고, 서로에게 큰 위험이 되어가는 것을 인지하고 있었기 때문에 딜레마를 해결하기 위해 핵확산금지조약을 맺는 등의 수많은 노력을 기울였다.^[1]

해결 방안

각주

↑ ^1.0 ^1.1 함규진 , 〈조약의 세계사〉, 《미래의창》, 2014-12-22

참고자료

같이 보기

게임이론

이 죄수의 딜레마 문서는 알고리즘에 관한 글로서 검토가 필요합니다. 위키 문서는 누구든지 자유롭게 편집할 수 있습니다. [편집]을 눌러 문서 내용을 검토·수정해 주세요.

블록체인 : 블록체인 기술, 합의 알고리즘, 암호 알고리즘, 알고리즘^□^■^⊕, 블록체인 플랫폼, 블록체인 솔루션, 블록체인 서비스

채굴 알고리즘	SHA-256 • X11 • X11고스트 • X13 • X14 • X15 • X16R • X17 • 그로스톨 • 네오스크립트 • 니스트5 • 리라2알이 • 미리아드-그로스톨 • 블레이크 • 블레이크2 • 블레이크B • 블레이크2B • 블레이크256R8 • 블레이크256R14 • 스컹크해시 • 스케인 • 스크립트 알고리즘 • 스크립트엔 • 엘비알와이(LBRY) • 이더해시 • 이퀴해시 • 제반 • 쿼크 알고리즘 • 큐빗 알고리즘 • 크립토나이트 • 크립토나이트 라이트 • 타임트래블10 • 텐서리티 • 파스칼 • 프로그작업증명(ProgPoW)

매칭 알고리즘	경매 • 더치 경매 • 매칭 알고리즘 • 매칭튜터 • 비크리 경매 • 센디 • 집닥 • 튜다 • 틴더

추천 알고리즘	TF-IDF • 추천 알고리즘 • 콘텐츠 기반 필터링 • 협업 필터링

고급 검색 알고리즘	AND-OR 검색 트리 • 국소 검색 알고리즘 • 국소 다발 검색 • 모의정련 • 언덕 오르기 검색 • 유전 알고리즘

대항 검색	검색의 차단 • 알파베타 가지치기 • 전방 가지치기 • 최소최대 알고리즘

제약 만족 문제	국소검색 • 역추적검색 • 제약전파

게임이론	게임이론 • 공유지의 비극 • 내시균형 • 메커니즘 디자인 • 비협조게임 • 사회선택이론 • 역게임이론 • 제로섬게임 • 조정게임 • 죄수의 딜레마 • 치킨게임 • 팃포탯 • 협조게임

위키 : 자동차, 교통, 지역, 산업, 기업, 단체, 업무, 쇼핑, 블록체인, 암호화폐, 인공지능, 개발, 인물, 행사, 일반

[cold-1] 1.0 ^1.1 함규진 , 〈조약의 세계사〉, 《미래의창》, 2014-12-22

[1]

위키

이름공간

변수

보기

더 보기

검색