일반형 게임 문서 원본 보기
←
일반형 게임
둘러보기로 이동
검색으로 이동
문서 편집 권한이 없습니다. 다음 이유를 확인해주세요:
요청한 명령은 다음 권한을 가진 사용자에게 제한됩니다:
사용자
.
문서의 원본을 보거나 복사할 수 있습니다.
{{위키데이터 속성 추적}} '''일반형 게임''' 또는 보수 행렬(Normal-form game 또는 pay-off matrix)이란, [[게임 이론]]에 등장하는 게임의 종류 중 하나로, '''전략형 게임'''이라고도 한다. [[전개형 게임]]과 달리 [[그래프]] 모양을 취하지 않고, [[행렬]]의 형태를 취한다. 이 형태는 [[우월 전략]]과 [[내쉬 균형]]을 찾는데 유용하나, 전개형 게임에 비해 몇 가지 정보를 표시할 수 없다는 단점이 있다. 일반형 게임은 각 경기자의 모든 선택 가능한 전략과 보수를 표현할 수 있고 특히 행렬로 표현할 수 있으며 이때 이러한 행렬을 '보수행렬'(payoff matrix)이라고 한다. == 예시 == {| align=right border="1" cellpadding="4" cellspacing="0" style="margin: 1em 1em 1em 1em; background: #f9f9f9; border: 1px #aaa solid; border-collapse: collapse; font-size: 95%;" |+ align=bottom |''일반형 게임의 예'' |- | ! scope="col" style="color: #900;width: 90px;"|''경기자 2의 전략 L'' ! scope="col" style="color: #900;width: 90px;"|''경기자 2의 전략 R'' |- ! scope="col" style="color: #009;width: 90px;"|''경기자 1의 전략 T'' |align=center| <span style="color: #009">4</span>, <span style="color: #900">3</span> |align=center| <span style="color: #009">−1</span>, <span style="color: #900">−1</span> |- ! scope="col" style="color: #009;width: 100px;"|''경기자 1의 전략 B'' |align=center| <span style="color: #009">0</span>, <span style="color: #900">0</span> |align=center| <span style="color: #009">3</span>, <span style="color: #900">4</span> |} 오른쪽의 표는 일반형 게임의 예시이다. 각 경기자는 동시에 행동을 하며, 각 경기자의 행동의 결과에 따라 보수가 결정된다. 예를 들어 경기자 1이 T의 전략을 선택하고, 경기자 2가 L 전략을 선택한다면, 경기자 1은 4, 경기자 2는 3의 보수를 받는다. 각 칸의 보수 (a, b)에서 a는 경기자 1, b는 경기자 2의 보수를 뜻한다. === 다른 표현 방법 === 지불보수(payoff)가 각각의 경기자의 행동에 좌우되지 않는 [[대칭적 게임]]의 경우, 보수는 한 가지로만 표현된다. 이것은 '열'에 위치한 경기자(2인 게임의 경우, 대개 경기자 1)의 보수이다. 예를 들어 아래에 나온 두 개의 보수 행렬(payoff matrix)은 같은 게임을 나타낸다. {| align="center" | {| border="1" cellpadding="4" cellspacing="0" style="margin: 1em 1em 1em 1em; background: #f9f9f9; border: 1px #aaa solid; border-collapse: collapse; font-size: 95%;" |+ align=bottom|''두 경기자의 보수를 표현한 경우'' | ! ''사슴'' ! ''토끼'' |- ! ''사슴'' | 3, 3 | 0, 2 |- ! ''토끼'' | 2, 0 | 2, 2 |} | {| border="1" cellpadding="4" cellspacing="0" style="margin: 1em 1em 1em 1em; background: #f9f9f9; border: 1px #aaa solid; border-collapse: collapse; font-size: 95%;" |+ align=bottom|''열에 위치한 경기자의 보수만 표시한 경우'' | ! ''사슴'' ! ''토끼'' |- ! ''사슴'' | 3 | 0 |- ! ''토끼'' | 2 | 2 |} |} == 일반형 게임의 용례 == === 우월전략이 존재할 때 === {{참고|죄수의 딜레마}} {| border="1" align=right cellpadding="4" cellspacing="0" style="margin: 1em 1em 1em 1em; background: #f9f9f9; border: 1px #aaa solid; border-collapse: collapse; font-size: 95%;" |+ align=bottom|''죄수의 딜레마'' | ! ''협조'' ! ''비협조'' |- ! ''협조'' | −1, −1 | −5, 0 |- ! ''비협조'' | 0, −5 | −2, −2 |} 보수행렬의 형태는 '우월전략의 단계적 소거'를 용이하게 해준다. 예를 들어 오른 쪽에 나온 [[죄수의 딜레마]]에서 각 죄수들은 '협조' 또는 '비협조'를 할 수 있다. 만약 한 죄수가 '비협조'를 하면, 그는 금세 풀려나올 수 있으며, 나머지 죄수는 계속 감옥에 갇히게 된다. 그러나 만약 둘 다 '비협조'를 선택하면, 둘 다 '협조'했을 때보다 더 오랜 시간 감옥에 있어야 한다. 어떤 죄수가 전략을 결정할 때, 그는 어느 쪽을 골랐을 때의 보수가 더 좋은지를 본 뒤에 결정하게 된다. 죄수 1(열에 위치한 전략을 선택할 죄수)이 '협조'를 염두에 두고 있다고 생각해 보자. 죄수 2의 전략에 따라 죄수 1의 보수가 달라진다. 만약 죄수 2가 '협조'를 선택할 경우, 그의 보수는 -1으로, 죄수 1이 '비협조'를 했을 때 받게 될 0의 보수보다 작다. 죄수 2가 '비협조'를 선택했을 때도 마찬가지다. 즉, 죄수 1은 죄수 2의 전략과 관계없이 '비협조'를 선택하는 것이 더 낫다는 결론에 다다른다. 대칭적 게임이므로, 죄수 2도 같은 과정을 통해 '비협조'가 더 낫다는 결론에 도달하게 된다. 따라서 이 게임의 [[내쉬 균형]]은 (비협조, 비협조)가 된다. == 수학적 일반화 == 일반형 게임의 수학적 일반화는 다음과 같다. * 유한한 수의 경기자의 집합 'P'는, P = {1, 2, ..., ''m''}로 표시된다. * P에 속하는 경기자 k는 유한한 개수의 [[순수 전략]](순수 ESS)을 가지고 있다. 즉, k의 순수 전략의 집합은 다음과 같다. ::<math> S_k = \{1, 2, \ldots, n_k\}. </math> '순수 전략 프로필'은 경기자들의 전략의 모음으로, m-[[튜플]]이다. :<math> \vec{s} = (s_1, s_2, \ldots,s_m) </math> 이는 곧, :<math> s_1 \in S_1, s_2 \in S_2, \ldots, s_m \in S_m </math>을 뜻한다. '보수 함수'는 다음과 같다. :<math> F: S_1 \times S_2 \times \ldots \times S_m \rightarrow \mathbb{R}. </math> 게임의 결과 한 경기자의 의도된 판단에 따른 보상이 주어진다. 게임이 끝날 때 P에 속하는 모든 경기자에 대한 각각의 보수가 결정된다. * '''정의''': '일반형 게임'은 다음과 같은 구조를 가진다. :<math> G=<P, \mathbf{S}, \mathbf{F}> </math> 여기서 P는 경기자의 집합이다. :<math>P=\{1,2, \ldots , m\}</math> S는 각각의 경기자에 대한 m-[[튜플]]의 순수 전략 집합이다. :<math>\mathbf{S}= \{S_1, S_2, \ldots, S_m\} </math> F는 m-튜플의 보수 함수이다. :<math> \mathbf{F} = \{F_1, F_2, \ldots, F_m\} </math> == 같이 보기 == * [[진화게임이론]] * [[팃포탯 전략]] {{게임 이론}} [[분류:게임 이론]]
이 문서에서 사용한 틀:
틀:게임 이론
(
원본 보기
)
틀:위키데이터 속성 추적
(
원본 보기
)
틀:참고
(
원본 보기
)
일반형 게임
문서로 돌아갑니다.
둘러보기 메뉴
개인 도구
로그인
이름공간
문서
토론
한국어
보기
읽기
원본 보기
역사 보기
더 보기
검색
둘러보기
대문
최근 바뀜
임의의 문서로
미디어위키 도움말
특수 문서 목록
도구
여기를 가리키는 문서
가리키는 글의 최근 바뀜
문서 정보