메인 콘텐츠로 건너뛰기

생일, 아이, 의료 테스트... 우리가 틀리는 확률 역설 3가지 재미있게 풀어보기

요약

확률 역설은 우리의 직관을 흔드는 마법을 가진 수학 문제입니다. 23명이 있는 방에서 생일이 같은 사람이 있을 확률, 자녀가 두 명일 때 모두 아들일 확률, 그리고 99% 정확한 질병 검사가 실제로 얼마나 신뢰할 수 있는지... 오늘은 여러분이 처음엔 말도 안 돼!라고 외칠 세 가지 확률 역설과 사고의 기반이 되는 핵심 툴(조건부 확률, 확률 트리)을 쉽고 재밌게 소개합니다. 보기엔 단순해 보여도 누구나 한 번쯤 헷갈려하는 문제들! 이야기를 따라가다 보면 아, 그래서 그렇구나!란 깨달음을 얻으실 거예요.

생일 문제: 23명만 모이면 ‘생일짝꿍’이 있을까?

어느 날 친구들과 23명이 모였습니다. 1년은 365일이니, 정말 우연히 생일이 겹치는 사람이 생길까요? 대부분의 사람들은 글쎄, 확률이 엄청 낮겠지라고 생각하죠. 하지만 놀랍게도 확률은 거의 50%를 넘어요! 실제로 23명만 모이면 50.7%의 확률로 두 명의 생일이 같습니다. 왜 이렇게 될까요?

여기서 중요한 원리는 ‘조건부 확률’과 ‘확률 트리’를 그리는 것. 2번째 사람이 들어오면 앞선 사람과 생일이 같을 확률 1/365, 3번째는 앞선 2명의 생일 중 하나와 같을 확률 2/365, ... 이런 식으로 조건을 붙여가며 계산하면 일종의 누적(1+2+3+...+22)이 빠르게 커집니다. 즉, 사람 수가 늘어날수록 가능한 ‘짝꿍 조합’이 기하급수적으로 많아지기 때문이죠.

“365일이니 365명은 되어야 생일 맞출 것 같아!”라는 직관, 실제론 완전히 틀립니다. 사람 23명만 있으면 아, 오늘도 생일짝꿍이 나올지도?란 기대감을 가질 수 있어요.

확률 트리와 조건부 확률: 이해의 열쇠

사람 3명이 모였다고 생각해 볼까요? 2번째 사람이 1번째와 같은 생일일 확률은 1/365. 3번째 사람은 1번이나 2번의 생일과 같을 확률, 즉 2/365. 이런 ‘만약에...라면(If...then)’의 상황을 트리로 그리면, 각각의 가지마다 확률을 곱하고 더해서 쉽게 정답에 접근할 수 있습니다.

‘모두의 생일이 다를 확률’을 먼저 계산한 뒤 1(100%)에서 빼버리면 ‘최소 한 쌍 이상 생일이 겹칠 확률’을 얻는 것! 규모가 커질수록, 이런 방식이 훨씬 효율적이죠. 실제 코딩(파이썬 등)으로도 시뮬레이션 가능합니다.

이렇게 조건에 따라 가지를 쳐가는 트리 방식은 생일 문제뿐 아니라 다양한 확률 역설에 적용됩니다.

가장 확률 높은 ‘첫째 생일 짝꿍’은 몇 번째 사람?

시뮬레이션을 돌려 보면 약 20번째로 들어온 사람이 ‘처음으로 누군가와 생일이 겹칠’ 가능성이 최대입니다(약 3%). 평균적으로 25명 정도가 방에 들어올 때 첫 생일 ‘매칭’이 일어나죠. 중간값(최초 50%를 넘는 시점)은 23명입니다.

이런 통계는 모임 혹은 이벤트 기획할 때, 그룹 내 생일이 겹치는 사람을 주제로 소소한 게임이나 이벤트를 펼치는 데도 활용할 수 있습니다.

희귀 질병 검사 역설: 99% 정확해도 확신할 수 없는 이유

이제 전혀 다른 상황! 한 희귀 질병이 1,001명 중 1명꼴로 발병한다고 가정합시다. 진단검사는 99%의 정확도를 자랑합니다. 무조건 질병이 있으면 ‘양성(+)’, 없을 땐 ‘99% 음성(-)’, 1% ‘가짜 양성(+)’이 뜹니다.

어느 날 내가 검사를 받았더니 ‘양성(+)’이 나왔어요. 나는 진짜 환자일 확률이 얼마나 될까요? 대부분 “검사 정확도가 99%니까 거의 확실하겠네!”라고 생각하지만, 실제론 9.1%밖에 안 됩니다.

이는 조건부 확률의 대표적 함정입니다. 전체 인구(1,001명) 중 진짜 환자는 1명인데, 건강한 1,000명 중에서도 1%는 ‘오진’을 받으니 ‘가짜 환자’가 10명! 결국 ‘양성’ 판정자 11명 중 실제 환자는 오직 1명이에요.

이 역설 때문에 병원에서는 아무에게나 검사하지 않고, 가족력‧증상‧환경 등을 질문해 ‘질병 발생 가능성’ 자체를 높인 후에야 검사를 권하죠. 그래야 검사 결과가 실제 신뢰를 얻을 수 있습니다.

조건부 확률 적용: 불가능한 가지치기와 재조정

조건부 확률은 ‘불가능한 상황을 쳐내고(가지치기) 남은 경우만 재조정(renormalize)해서 확률을 계산’하는 과정입니다. 위 의료 예시에서는 음성(-) 결과를 가진 사람들은 계산에서 없어진 상태이고, 남은 ‘양성(+) 결과자만을 대상으로 “진짜 환자일 확률”만 따지는 것이죠.

이것을 확률 트리로 나타내거나, 실제 인구를 수로 나눠 직관적으로 이해할 수 있습니다. 그래서 병·건강 여부, 검사결과 등 층층이 쌓인 경우의 수를 직관적으로 이제 남은 11명 중 1명이 진짜로 계산할 수 있게 되는 겁니다.

두 자녀 역설: 한 명이 남자라면, 둘다 남자일 확률은?

마지막 역설은 가족 이야기입니다. Mr. Smith에게 두 명의 자녀가 있습니다. “적어도 한 명은 남자”라는 정보를 들었을 때 두 아이 모두가 남자일 확률은 얼마일까요? 본능적으로 “50%”라 생각하지만, 답은 33.3%(1/3)입니다.

왜냐면 경우의 수를 그려보면 (남자, 남자), (남자, 여자), (여자, 남자), (여자, 여자) 네 가지가 있는데, “한 명은 남자”라는 조건이 들어가면 (여자, 여자)는 제외! 남은 세 가지 경우 중 모두 남자인 경우는 하나, 즉 1/3입니다.

더 어려운 버전: 한 명이 ‘화요일에 태어난 남자라면’?

이번엔 “두 자녀 중 한 명이 화요일에 태어난 남자”라면, 둘 다 남자일 확률은? 이제 화요일이면 뭐가 달라지나? 궁금하지만, 실은 확률이 무려 48.1%로 올라갑니다!

이는 조건이 더 특별해질수록(즉, 정보가 더 구체적일수록) 확률 계산에서 자신이 보는 경우의 수가 달라지기 때문입니다. 만약 더 희귀한 상황(“두 아이 중 한 명은 특정 별자리 출생의 남자”)이라면 확률은 더 올라가겠죠.

이걸 확률 트리 혹은 격자 그림(열/행)으로 나타내면 더 쉽게 이해할 수 있습니다. 정보가 구체적일수록 실제로 고려해야 할 경우의 수가 줄어들어, 남자일 확률이 높아지는 셈입니다.

확률 트리와 격자, 그리고 실제 활용 방법

위 역설들에서 확률 트리나 격자 그림을 통한 시각화는 명확한 계산과 직관을 동시에 제공합니다. 가지를 따라 조건을 붙이고, 가능성들을 쳐내면서 남은 것만 비율 계산(renormalize)하면 혼돈스러운 경우의 수도 한눈에 파악됩니다.

이런 조건부 확률 툴은 보험, 의료, 데이터 분석 등 모든 분야에 활용될 수 있습니다. ‘우리 모임에 생일이 겹칠까’, ‘어떤 가족 조합이 될까’, ‘요 검사가 정말 신뢰할 만한가’ 등 실생활에서도 응용 가능하죠.

이 역설들이 알려주는 것: 직관보다 확률을!

흔히 수학적 사고가 ‘직관’과 다를 때가 많습니다. 생일 문제, 두 자녀 문제, 희귀 질병 검사 등에서 우리의 첫 답은 늘 틀릴 수 있어요. 조건부 확률과 트리, 격자 그림은 이런 함정에서 벗어나게 해줍니다.

다음 번 친구 모임, 병원 검사, 가족 계획 등에서 이 원리를 떠올려 보세요. 확률의 마법을 알면, 세상을 훨씬 다채롭게 바라볼 수 있습니다.


조언: 복잡한 확률 역설에 부딪힐 땐 트리와 격자로 시각화해 보길 권합니다. 혼돈의 직관을 넘어서, 논리적 사고가 주는 새로운 통찰을 만날 거예요. 내가 틀릴 수도 있다!는 열린 마음이 확률 수학을 진짜 즐기는 첫걸음이니까요.

출처 :