Minimax Theorem for Latent Games or :

How I Learned to Stop Worrying about Mixed-Nash and Love Neural Nets

David Balduzzi 는 천재적인 저자이다. 이 사람의 논문은 챙겨보면 좋다. Gan 이라는 것은 두 그룹이 보는 관점에 따라서 평가하는 방법이 무척 다르다. Gan 이야말로 미래기술이다. 딥러닝의 Cash-cow가 될 것이다 라는 시각 EX. Text-to-Speech 이 있고, Multi-Agent 하는 시스템하는 사람의 입장에서 보면 아니다.

5년이 지난 후, 네트워크 및 기존 시스템 구조에 (양자컴퓨터) 큰 변화가 올것이다. 훨씬 더 가속화 하는 지금 GAN 이 주는 결과가 얼마나 원시적인 것인가 생각할 수 있다.

Abstract

멀티 에이전트는 굉장히 중요한 분요인데, GAN 같이 하면 안되고, Mix Strategy 를 사용한다. Pure Equilbrai 판별자가 던지는 신경망 하나, 생성자가 던지는 신경망 하나 뉴럴넷 하나 가지고 학습하고 이건 말이 안되는 것이다. 이 경우 내쉬균형이 혼합 전략으로 존재하여야만 한다.

Latent 고차원의 실세계를 우리 머리에서는 추상적으로 교통 정리를 하는데, 상황에 대해서 가정을 하는 거 아니야 GAN 이 원래는 특정 상황에서만 적용되는 거인데, 일반화 하도록 하겠다. 생성자를 통해 얻어진 변수가 다변량 정규분포를 이루는데, 판별자가 두 변수를 비교해서 점수를 매긴다. Latent Variable 확률 분포가 초장에 사용이 되는데, 너가 하나도 모르니깐 다변량 정규분포를 사용하는데 Latent Game 전통적인 게임에 한번 더 나아가서 Latnet Game 으로 나아가서

용의자의 딜레마

아래 표를 보수행렬표라고 한다. 갑이 자백을 할 경우의, 을의 최선의 선택은 자백(주황색화살표)이다. 이렇게 계산을 하면, 을은 갑이 어떠한 선택을 하던지 자백을 하는 것이 좋다.즉, 우월전략이 있다는 것이다. 갑의 입장에서 보면, 을이 자백을 하던지, 부인을 하던지 자백을 하는 것이 좋다. 따라서 둘다 자백을 하는 것이 우월 전략이다.

우월 전략이란 갑의 행동과 상관없이 나에게 높은 보수를 주는 행동 및 전략을 의미한다. 모든 경기자들한테 우월 전략이 있고, 그때 나타나는 균형을 우월 전략 균형이라고 한다.

균형이란, 선택을 바꿀 의향이 없는 상태를 말한다.

하지만, 가장 최선의 상황은 둘 다 범죄를 부인하는 것 (-1,-1) 이다. 즉 두 플레이어의 각자의 이기적 행위가 열등한 상황(-5,-5)을 초래하였다. 이리하여, 이 게임을 용의자의 딜레마 라고 한다.

Nash 가 이 논문을 지도교수에게 찾아갔을때, 200년간의 경제학 근간을 흔드는 것이라고 말하였다. 애덤 스미스가 주장한, 각 개인들이 사적 이익을 추구하는 과정에서 사회적 공익을 효과적으로 증진시킨다는 말을 뒤엎은 것이다.

Nesh 균형, Nesh 전략

Nesh 균형이 2개인 경우

을같은 경우 우월전략이 없다. 을은 내쉬전략이 있다. 갑의 a1을 선택할 때, 을은 b1 을 선택해야하는 것이고, 갑이 a2를 선택할때, 을은 b2를 선택하는 것이다. 즉, 상대방의 행동에 따라서 나의 최선의 선택이 바뀌는 전략내쉬전략이라고 한다. 그리고 그 서로의 내쉬전략이 맞물려있는 상태를 내쉬균형이라고 한다.

Nesh 균형이 1개인 경우

Nesh 균형이 0개인 경우

내쉬 균형은 2개일수도 있고, 1개일수도 있고, 균형이 존재하지 않을 수도 있다. 경제학자들은 균형을 찾는 사람들인데, 균형이 없는 경우, 균형을 찾기위해 전략을 확장하였다. 순수전략이란 a1 아니면 a2 , 모아니면 도인 전략을 의미한다. 전략을 확장한 것은 혼합전략이라고 하는데 각 행동에 확률을 부여한 것이다. 예를 들어 갑의 순수전략은 {a1,a2}\{a_1, a_2\} 라고 표현할 수 있다. 이를 혼합전략으로 표현하면, {a1p,a2(1p)}\{a_1*p, a_2*(1-p)\} 이다. p가 1인 경우에를 순수전략이라고 말하기 때문에 순수전략을 혼합전략안에 포함된다고 말할 수 있다.

순수전략에는 (내쉬)균형이 없더라고, 혼합전략에는 내쉬 균형이 반드시 존재한다는 것이 내쉬의 증명이다.

Last updated