🚩Monty Hall 문제
3개의 문이 존재한다. 하나의 문에는 차가 존재하고, 나머지 2개의 문에는 염소가 존재한다. 이 게임의 진행자는 각각의 위치를 알고 있다. 참가자가 하나의 문을 골랐을 때, 몬티는 염소가 있는 문 중 하나를 엽니다. 그럼 여러분은 문을 바꿔야 할까요?
(가정: 몬티는 항상 염소가 있는 문을 엽니다. / 만약 그가 어떤 문을 열지 결정할 수 있다면, 그는 동일한 확률로 문을 엽니다.)
정답부터 말하자면
선택을 바꾸면 성공할 확률이 2/3이고, 선택을 바꾸지 않는다면 성공할 확률이 1/3이기 때문에 문을 바꾸는 것이 성공할 확률이 더 높다.
- 이 문제를 푸는데 있어서 가장 중요한 사실은
- 몬티는 항상 염소가 있는 문을 연다는 사실이다.
- 이 문제를 풀기 위해 아래의 3가지 방법으로 이를 증명하는 법을 살펴보자.
(1) 수형도
- 게임 참가자가 1번 문을 선택했다고 가정했을 때의 상황을 수형도로 나타내어 보자.
- 몬티 홀이 어떤 문을 여느냐에 따라 가지가 결정된다.
- 몬티가 2번 문을 열었다는 조건 하에 나머지 3번 문을 여는 상황을 제거하고
- 각각의 케이스의 확률을 구하면
- 자동차가 있을 확률은 각각 1/3 이고, 내가 고른 1번 문에 실제로 자동차가 있다면 몬티는 염소가 들어있는 2,3 번 문을 열기 때문에 각각 1/2의 확률로 몬티가 열 수 있다.
- 몬티가 문을 여는 사건과 자동차가 있을 사건은 독립이기 때문에 각각의 확률은 곱하면 된다.
- 1 - 1 - 2 = 1/3 * 1/2
- 1 - 3 - 2 = 1/3 * 1
- 이전 포스팅에서 얘기했지만 조건부 확률은 각각의 확률을 구한뒤 renormalize하는 것이기 때문에 둘의 총합이 1이 되도록 하려면 각각의 확률에 2를 곱해주면 된다.
- 이로써 1번 문을 선택했는데 선택을 바꿀 경우에 훨씬 더 높은 확률을 갖는다는 것을 알 수 있다.
(2) 전체 확률의 법칙 (wishful thinking)
"우리는 자동차가 어디에 있는지 알고 싶어한다."
를 조건으로 가정한다. (wishful thinking)
- S : 항상 처음의 선택을 바꾸어서 성공할 사건
- $D_j$ : j번 문 뒤에 자동차가 있을 사건
- $P(S) = P(S|D_1) * \frac{1}{3} + P(S|D_2) * \frac{1}{3}+ P(S|D_3)$ * \frac{1}{3}
- 1번 문을 선택했다고 가정했을 때 $P(S) = 0 * 1/3 + 1/3 + 1/3 = 2/3$
- 1번 문에 자동차가 있음에도 불구하고 --> 우리의 선택은 무조건 문을 바꾸는 것이기 때문에 성공할 확률은 0이 된다.
(3) 특이한 방법으로 접근 → 문이 백만개라고 가정한다면?
그래도 똑같이 적용된다.
몬티홀 문제의 의의는 단순한 직관을 적용해버리면 틀리기 마련임 !
🚩Simpson’s Paradox
지금부터 2명의 의사를 보여줄텐데 두 의사 중에서 더 가고 싶은 의사는 누구일까요?
각각의 의사는 총 100번의 수술을 진행했다고 가정했을때,
여러분 중 몇명이나 닉 대신 히버트에게 가고 싶나요?
- 대부분의 사람들은 당연히 더 어려운 수술을 성공시킨 히버트를 선택하고 싶어할 것입니다.
- 하지만 만약에 각자의 수술 성공률이라는 수치로만 판단했을때는 어떨까요?
(1) 히버트
심장 수술 | 붕대 풀기 | |
성공 | 70 | 10 |
실패 | 20 | 0 |
(2) 닉
심장 수술 | 붕대 풀기 | |
성공 | 2 | 81 |
실패 | 8 | 9 |
- 각각의 수술 성공률
- 히버트 성공률 →80 % (70 + 10)
- 닉 성공률 →83 % (81 + 2)
- 닉은 자신의 성공률이 83%라고 광고할 수 있습니다!
- 이러한 문제는 조건부와 비조건부의 차이를 보여줍니다.
- (조건부로써) 심장 수술을 할 경우 히버트에게 찾아갈 것이고, 붕대 풀기 위해 히버트를 찾아갈 것이다.
- (비조건부로써) 닉이 진행한 수술 중 90%는 붕대 풀기인데 닉은 붕대풀기라는 쉬운 수술을 많이 했기 때문에 전체 성공률을 높이기 쉬웠을 것이다.
- 이건 실생활에서도 적용 가능한데 명망 있는 신경 외과 의사의 수술 성공률이 매우 높지 않을 수도 있다는 뜻이다. (만약 그들이 항상 쉬운 수술만 맡아서 한다면 성공률이 자동으로 오른다는 소리!)
심슨의 역설은
문제가 완벽히 같더라도 다른 표현과 환경을 제시한다면 불가능하게 들릴 수 있음을 보여줍니다.
Example
- 야구에서 2명의 선수가 있다고 가정할 때, 첫 시즌도 잘하고 두 번째 시즌에도 잘한 A 선수(1등)가 전체로 봤을 때는 B 선수(2등)가 더 높은 타율을 가질 수 있다.
- 이에 대한 증명은 직접 위의 심슨 문제처럼 풀면 가능!
이제부터는 심슨 문제를 조건부 확률을 기반으로 하여 풀어보자.
- A : successful surgery (수술이 성공할 사건)
- B : treated by Dr.Nick (의사 닉이 수술한 사건)
- C : type of surgery (어떤 종류의 수술인지) = 심장 수술
- $C^c$ : 붕대풀기
이를 정의 한다고 했을 때 자명한 사실은
- $P(A|B, C) < P(A|B^C,C)$ : 의사 닉이 심장 수술을 한다고 했을때 성공할 확률은 히버트가 심장 수술을 해서 성공할 확률보다 낮다.
- $P(A|B^C, C) < P(A|B^C, C^C)$ : 히버트가 심장 수술해서 성공할 확률은 히버트가 붕대 풀기를 해서 성공할 확률보다 낮다.
- $P(A|B) > p(B^C)$이 두 경우를 합친다고 했을때 (= 어떤 수술인지에 대한 조건을 달지 않고 전체 수술을 보는 것) :
$P(A|B)$ (의사 닉의 성공 확률) > $P(A|B^C)$ (히버트의 성공확률보다 크다.)
심슨 역설은 이렇게 예상했던 바와 달리 조건이 없을 경우에 부등호 방향이 유지되지 않고 반대로 바뀝니다.
Dr.Hibbert가 각각의 수술이라는 조건부 확률에서는 더 좋은 성적을 보일 수 있지만,
무조건부 확률은 P(A|B) > P(A|B^C)P(A∣B)>P(A∣BC) 와 같이 역전될 수가 있다는 것이다.
⇒ 여기서 C(수술의 종류)는 confounder (교란변수)라고 하며, 이렇게 적절한 confounder에 의한 조건부 확률을 확인하지 않으면 상황에 대한 그릇된 판단을 내릴 위험이 있다.
- C는 교란요인입니다. (여러분이 통제하고자 하는 요인)
- 위의 문제에 대해서는 어떤 종류의 수술을 하는지가 훨씬 더 중요한 조건으로 보인다. 연관성이 높은 비교가 더 조건부적!
- C조건으로 삼는데 실패하면 → 오해할만한 답을 얻게 될 것이다.
- 심슨의 역설과 관련된 모든 문제는 위의 방정식으로 전부 설명 가능합니다.
- 심슨의 역설 정의: 부등식을 단순히 더했을때 부등호 방향이 바뀐다.
- 여러분은 이게 왜 가능한지 직접 해보면서 알아야 합니다.
- C를 조건으로 하는 것도 알아야 한다.
또 심슨의 역설의 한 문제로 유명한 문제를 한 가지 더 말하도록 하겠다.
상황: 버클리에 대한 소송이 있었는데, 대학원 입학 시험에서 성차별이 있어다는 주장
- 전체 입학률은 봤을 때 → 여자보다 남자가 입학하기 쉽도록 만들었다고 주장
- 데이터를 보니 다른 결과가 나왔는데 → 각 학과 자료를 보면 명백한 증거가 없지만 모든 학과를 다 합해보면 여자에게 불리한 것처럼 보인다.(어떤 학과는 여자가 실제로 들어가기 어렵운 학과도 있었기 때문)
이제부터는 심슨의 마지막 예제를 보면서 본인이 스스로 증명해보자.
- 젤리빈이 들어있는 2 병이 있다고 가정하자.
- 두 가지 종류의 젤리가 있고, 2가지 맛이 있다.
- 여러분은 둘 중 하나의 맛을 더 좋아한다고 가정 (왼쪽 병을 더 좋아한다고 가정)
- 두 병 중에서 임의로 하나의 젤리를 꺼내먹는다고 가정했을 때 → 여러분이 좋아하는 젤리빈이 나올 확률이 더 높다고 생각하자.
- 만약 두 번째 병의 경우에도 → 여러분이 좋아하는 젤리가 나올 확률이 더 높다고 가정했을때
- 이 4개의 병을 아주 큰 병에 담으면 → 이전과 달리 여러분이 상대적으로 덜 좋아하는 젤리가 나올 확률이 더 높을 수 있다.
이에 대한 예시들을 직접 숫자를 넣어서 생각해보길 권장합니다.
이후에 심슨의 역설에 대한 직관력을 기를 수 있을 것입니다.
다음 포스팅은 확률변수의 정의와 확률분포에 대해서 정리해보도록 하겠습니다 ◠ ̫◠
'Math > 확률과 통계 Probability and Statistics' 카테고리의 다른 글
[확통]조건부 확률과 전확률 정리(Conditioning Continued, Law of Total Probability) (1) | 2023.08.04 |
---|---|
[확통]조건부확률(Coditional Probabaility) (0) | 2023.08.02 |
[확통]Birthday Problem과 확률의 특성 (3) | 2023.08.01 |